Masin tõlgib üha paremini

Google Translate.

FOTO: Fragment koduleheküljest

Kõige tuntum eestikeelse masintõlke rakendus on seni Google Translate, mille tõlgete üle saab aeg-ajalt naerda, ometigi on selle levik juba hakanud keeleruumide vahelisi barjääre maha võtma.

Arvuti abil tõlkimise esimesed katsetused tehti eelmisel sajandil kohmakate suurarvutite abil, mille jõudlus mahub tänapäeval mitmekordselt harilikku sülearvutisse. Toona alustati mõttest, et tõlkimiseks on vaja arvutis kirjeldada ära erinevate keelte reeglid.

«Tänapäeval enam nii ei arvata, üldlevinud meetod on statistiline masintõlge,» märgib Tartu Ülikooli teadur Heiki-Jaan Kaalep. See tähendab lihtsustatult, et arvutile söödetakse ette võimalikult palju paralleeltekste, mida võrreldakse, ja tõlkimine käib varasemate tõlgete järgi.

Kaalepi sõnul ei ole Google’i tõlkesüsteemis midagi erilist, suurfirma kasutab lihtsalt avalikult kättesaadavaid lahendusi ning spondeerib ka ise masintõlke-alaseid uurimistöid, mille resultaadid on avalikud. «Kõik, mida maailmas sel alal tehakse, jõuab hetkeliselt ka Google’isse,» märgib teadur. «Nende tugev külg on tohutu serveripark, mis tagab tõlke kiiruse.»

See ei tähenda aga, et Eestis võiks istuda masintõlke alal käed rüpes ja oodata, millal Google’i tõlge muutub täiuslikuks. «Ega Google ise ei tee spetsiaalselt midagi selleks, et eestikeelne tõlge parem oleks,» ütleb Kaalep. «Kui me ise vaeva näeme, siis saame ka Google’i kaudu parema tõlke.»

Keeletehnoloogia üheks «pühaks graaliks» on süsteem, mis tõlgib arusaadavalt suulist kõnet otse ühest keelest teise.

TTÜ küberneetika instituudi teadur Tanel Alumäe on valmis uskuma, et sellist imet me oma eluajal näha ei saa. «See ülesanne hõlmab korraga palju valdkondi, nagu kõnetuvastus, masintõlge, emotsioonide tuvastus, et tõlgitud tekst sünteesitaks samade emotsioonidega. Kõik need integreeritud tehnoloogiad peavad töötama väga hästi, et tervikrakendus töötaks hästi.»

Alumäe ütleb, et märksa tõenäolisem on näiteks see, et paari aasta pärast on Youtube’is olemas süsteem, mis lubab automaatselt genereerida ingliskeelsetele videoklippidele eestikeelseid või muukeelseid subtiitreid.

Tagasi üles