ai taal ontcijferen

Hoe ArtificiaI Intelligence onze taal ontcijfert

AI-onderzoekers hebben ’s werelds grootste taalmodel ontwikkeld, dat teksten in 46 verschillende talen en 13 programmeertalen kan genereren die nauwelijks zijn te onderscheiden van wat mensen schrijven. Betekent dit het einde voor marketeers, vertalers en developers?

Artificial Intelligence (AI) content heeft de afgelopen jaren grote stappen vooruit gemaakt. In 2020 werd door OpenAI GPT-3 naar buiten gebracht. Dit taalmodel heeft 175 miljard parameters en is getraind met meer dan 500 miljard woorden. Ook ligt het niveau van begrijpend lezen van GPT-3 vele malen hoger dan van een gemiddeld mens. Deze statistieken zijn weliswaar indrukwekkend, maar slechts een beperkt aantal partijen hebben toegang tot het volledige model.

Daarom zijn er kansen voor het BLOOM-model, dat voor iedereen toegankelijk is en op een aantal gebieden GPT-3 overklast. Zo heeft het BLOOM-model veel meer parameters. Op dit moment kan iedereen via het BLOOM-model teksten genereren, vertalen en schrijft de tool direct een app uit in een programmeertaal.

Het BLOOM-model biedt dan ook een aantal interessante kansen. Om het ware potentieel daarvan te benutten is het goed om de geschiedenis ervan te leren.

Geschiedenis van AI-taalmodellen

GPT staat voor Generative Pre-trained Transformer en GPT-3 verwijst naar de derde versie van het taalmodel. Ze worden aangestuurd door kunstmatige intelligentie en zijn aan de voorkant getraind en voorzien van meer data dan een mens in zijn hele leven ooit zou kunnen verwerken.

Het eerste document over GPT(-1) werd gepubliceerd op OpenAI’s website in 2018. Dit model werd getraind door het leren van BooksCorpus data. Dit waren duizenden boeken die nog niet gepubliceerd waren. Het resultaat van deze training was dat GPT-1 goede uitkomsten gaf op verschillende taken omtrent data waar nog niet eerder mee gewerkt was.

Een jaar later, in 2019, ontwikkelde en publiceerde OpenAI GPT-2. Deze tweede versie was getraind op anderhalf miljard parameters en vooral goed om op de opgegeven zin een vervolgzin te genereren.

In 2020 werd GPT-3 naar buiten gebracht. Deze versie heeft zoals eerder aangegeven 175 miljard parameters. Dit is grofweg 115 keer meer dan GPT-2. Deze nieuwe versie kan alles genereren met teksten: van artikelen schrijven, vragen beantwoorden, vertalen van teksten tot aan apps schrijven in programmeertalen, je kan het je zo gek bedenken en de GPT-3 kan het.

Sinds de eerste versie van GPT heeft het model al gebruikgemaakt van ‘deep learning’. Dit is een familie van methodes van machinaal leren (machine learning) en gebaseerd op kunstmatige neurale netwerken. Deep learning wordt onder meer toegepast op spraakherkenning, medische beeldherkenning en nog een aantal andere domeinen.

AI-vertaaltools

Dankzij GPT-3 zijn er een aantal interessante tools ontstaan. Zo lanceerde Google in april 2006 Google Translate en wordt deze vertaaltool sindsdien continu bijgewerkt. Tegenwoordig kun je via Google Translate in meer dan 100 talen vertalen. Google heeft een enorme database, die aangevuld wordt door zowel specialisten en de resultaten vanuit de vertalingen. Pas wel op met het vertalen van persoonlijke of gevoelige informatie, want Google is niet verantwoordelijk wat er met de data gebeurt.

Een andere vertaaltool is het Duitse DeepL, dat naar eigen zeggen dankzij hun geavanceerde AI-technologie drie keer nauwkeuriger is in het vertalen van teksten dan directe concurrenten.

Verder is er Ithaca, een vertaaltool die door middel van een neuraal netwerk helpt bij het herstellen van oud Grieks geschrift. Op deze manier wordt het mogelijk om ons verleden nog beter te vertalen naar het heden.

AI-vertalers zijn echter nog lang niet perfect. Als je daarom op zoek bent naar een nauwkeurige en professionele vertaling van je teksten, ben je voorlopig nog altijd beter af bij een professioneel vertaalbureau. Dat wil niet zeggen dat deze vertaalbureaus niet met hun tijd mee gaan en soms ook AI inzetten.

Vertaalbureaus gebruiken AI als ondersteuning

De opkomst van AI zorgt ervoor dat de taken en werkzaamheden van vertalers veranderen. Zo is een vertaler nu veel meer bezig met revisies; het nalezen en corrigeren op vlakken waar vertaaltools vaak nog struikelen. Denk hierbij aan het plaatsen van teksten in culturele en/of emotionele context, spreekwoorden en woordspelingen.

Zo zijn er bij Fairlingo dankzij AI bepaalde zaken geautomatiseerd om vertalers te helpen efficiënter te werken en tijd te besparen. Wanneer je kiest voor een vertaling op ‘Basisniveau’ wordt de content als post-edit uitgevoerd. Met post-editing combineer je een vertaaltechnologie samen met een vertaler. Eerst wordt je tekst vertaald door een geavanceerde vertaaltechnologie en daarna wordt de tekst gereviseerd door een ervaren vertaler. Door post-editing te gebruiken is de levertijd van een tekst 40% sneller dan wanneer je de vertaling volledig door een vertaler zou laten doen, terwijl post-editing niet ten koste gaat van de kwaliteit van de vertaling.

Ook maakt Fairlingo gebruik van een vertaalgeheugen om het vertaalproces nog efficiënter te maken. Een vertaalgeheugen (of Translation Memory) is een database van zinsdelen, segmenten en woorden die de vertaler ondersteunt bij het vertalen van content. Dit biedt jou als klant meer consistentie en snelheid tegen lagere kosten. Eerder vertaalde zinnen worden namelijk opgeslagen en als suggestie gegeven aan de vertaler wanneer een soortgelijke zin zich weer voordoet. Doordat de vertaler eerder vertaalde teksten niet nogmaals hoeft te vertalen, kan hij of zij efficiënter werken. De tijd die hiermee bespaard wordt, zie jij als kostenbesparing in de prijsopgave voor de vertaling.

Om de kwaliteit van jouw vertaling te maximaliseren, maakt Fairlingo ook gebruik van een terminologielijst. Elk bedrijf hanteert namelijk specifiek taalgebruik. Door het maken van een terminologielijst worden specifieke (voorkeurs)termen met hun vertalingen opgeslagen. De terminologielijst kan op deze manier bijdragen aan een consistente en vooral kwalitatieve vertaling.

De verwachting is dat AI in de komende jaren een grotere rol gaat spelen in taal. Als vertaler en vertaalbureau moet je deze ontwikkeling niet zien als een bedreiging, maar het optimaal weten te gebruiken. Hierdoor verhoog je namelijk de kwaliteit van je vertalingen en werk je efficiënter.