P, 29.05.2022
Juhime tähelepanu, et artikkel on rohkem kui viis aastat vana ning kuulub meie arhiivi. Ajakirjandusväljaanne ei uuenda arhiivide sisu, seega võib olla vajalik tutvuda ka uuemate allikatega.

Keeletehnoloogid õpetavad arvutit rääkima ja jutust aru saama

Kristjan Otsmann
Keeletehnoloogid õpetavad arvutit rääkima ja jutust aru saama
Facebook Messenger LinkedIn Twitter
Comments

«Posstimehe tehnoloogiaküljet,» loeb arvuti veidi kerge kõnehäirega soomlast meenutava kurvameelse intonatsiooniga ekraanile kirjutatud teksti.

Arvuti oskab eestikeelset teksti juba lugeda, kuid teeb mitmeid hääldusvigu.

Arvutitele kõnekeelt õpetavate keeletehnoloogide hinnangul on kõnesüntesaatoritel ja suulisest tekstist aru saavatel programmidel veel küllaga arenguruumi.

Emotsioone ei mõista

«Maksimumi ei saa veel loota, sest kõnes on olemas sellised asjad nagu emotsioonid, kuid emotsioonide puhul ei ole ka mujal maailmas reaalselt edasi jõutud,» ütleb kakskümmend aastat arvutisüsteemidele kõnekeelt õpetanud Eesti Keele Instituudi kõnetehnoloog Meelis Mihkla.

Jutustavate lausetega tuleb arvuti juba praegu üsna hästi toime.

Hüüatuste ja küsimustega on asi raskem, sest arvuti ei suuda leida lause fookust.

«Puudu jääb ka kõne sujuvusest ja meloodiast,» sõnab ta. Keeletehnoloogid lähtusid kõnesüntesaatori loomisel eesti keele ortograafiast, kuid tavalises kõnekeeles kohtab nn puhast eesti keelt väga harva. Peale tavaliste apsakate erineb kõnekeel oluliselt kirjakeele normist.

«Kujundlikult me kõneleme liitsõnades, me ühendame suvaliselt sõnu kokku, kõneleme fraasidega,» selgitab Mihkla. Inimesega sarnasel moel kõnet fraasidesse jagada arvuti veel ei suuda.

Mihkla sõnul peaks arvuti selleks, et inimlikult kõnelda, kõneldavat teksti mõistma. Arvuti sellega esialgu toime ei tule. Arvuti ei suuda analüüsida ka konteksti, millest sõltub sageli sõna tähendus ja hääldus.

Samuti ei suuda arvuti esialgu eristada teist ja kolmandat väldet. Selle probleemi kallal töötavad hetkel Tartu kõnetehnoloogid. Probleemi lahendab see, kui sõnastikus on märgitud, millised sõnad on kolmandas vältes.

Hetkel on peaaegu kogu arvutis olev info ingliskeelne. Sama kehtib kodumasinate kohta: nende menüüd on sageli ingliskeelsed.

Praegu on veel ühiskond kirjakeskne. Kirjalikku teksti on kõnest rohkem ning kirjaliku teksti - näiteks lepingute - usaldusväärsus on suulise teksti omast suurem.

Vajalik keele säilitamiseks

Mihkla hinnangul muutub tulevikus vahekord kõne kasuks. Esimesena annb sellest muutusest aimu näiteks numbrite häältunnuse abil valimise võimalus taskutelefonidel.

Tema arvamust jagab Tallinna Tehnikaülikooli küberneetikainstituudi foneetika ja kõnetehnoloogia labori juhataja Einar Meister.

«Infotehnoloogia areng liigub arvutiga loomulikus keeles suhtlemise poole, mitmete keelte puhul on see osaliselt võimalik juba täna,» kinnitab ta.

«Kui me juba praegu suhtleme arvutite ja kodumasinatega inglise keeles, siis milleks meile tulevikus eesti keel,» küsib Mihkla. Ta lisab, et praeguse ingliskeelse arvutiajastu jätkumisel muutub inglise keel suhtluskeeleks ja see võib viia väikeste keelte tähtsuse vähenemisele.

Eesti keelt mõistvale arvutile on rakendusi palju. Mihkla hinnangul ootab suurim tulevik ees kõne-tekst-kõne-süsteeme ehk süsteeme, mis muudavad inimkõne kirjalikuks tekstiks, teevad selle abil näiteks päringu, teisaldavad vastuse kirjalikust tekstist kõnekeeleks ja loevad selle ette.

Sel moel võiks Mihkla prognooside kohaselt viie aasta pärast töötada näiteks infotelefonid, kus kliendi kõnele vastaks inimese asemel arvuti.

Tulemus pole veel rahuldav

Samuti vajavad kõnesüsteeme pimedad, kes ei näe, mida arvuti ekraanile kirjutab. Eesti nägemispuuetega inimesed kasutavad endiselt soome kõnesüntesaatorit, sest eesti keele süntesaator ei suuda siiani töötada koos ekraanilugemise tarkvaraga.

«Eesti keele süntesaator ei tööta ühegi ekraanilugemise tarkvaraga, mida olen katsetanud,» ütleb Erik Loide, kes kasutab soomekeelset süntesaatorit. «Soome keele süntesaator töötab paremini.»

Vaata ka:
Kõnesüntesaatori veebidemo
Keeletehnoloogia leheküljed

Tagasi üles