Google kogus kogemata andmeid

Google Home nutikõlar, mis peale küsimustele vastamise salvestab ka küsimusi.

FOTO: Federica De Caria / PA Wire/PA Images / Scanpix

Lekitatud helisalvestised näitavad, et Google on kogunud andmeid ka siis kui luba selle jaoks ei ole saanud. Helitehnoloogia areng aitab tulevikus aga sarnast probleemi vältida.

Belgia uudistekanal VRT avalikustas kolmapäeval lindistused, mis on tehtud Google Assistant tarkvara või Google Home nutikõlarite poolt. Lindistusi, mis VRT kätte sattusid, on tuhatkond ja need on salvestatud Belgias ja Madalmaades.

VRT väidab aga, et sarnaseid lindistusi tehakse üle kogu maailma ning Google töötajad kasutavad neid, et muuta paremaks oma otsingumootorit.

Enamik lindistusi, mida Google töötajad üle kuulasid, olid lindistatud Google Home seadetega, ajal, mil neid kasutati, vahendab VRT.

VRT otsis üles ka inimesi, kelle häält lindistati ning nad suutsid selgelt oma hääle ära tuvastada. «See on kahtlemata minu oma hääl», ütles üks flaami mees, olles üllatunud, kuidas lindistus saadi.

Miks Google su häält lindistab?

Seadistades endale hääl-otsimise Googles, on võimalik Googlest otsida asju, ilma klaviatuuri puudutamata. Kui alustada oma otsingut fraasiga «Ok Google», siis salvestab Google sinu öeldu.

Salvestamise eesmärgiks on parandada teenust. Küsimuste salvestamise eesmärgiks pole see, mida sa ütled, vaid see, kuidas sa seda ütled. Inimeste rääkimisviisid on paratamatult erinevad ning hääle tuvastamise jaoks vajab Google arvutisüsteem palju erinevaid häälsalvestusi, et saada öeldust aru.

Süsteemi toimimiseks on vajalik, et inimesed seoks hääle kirjaga. Seepärast kasutatakse inimesi, kes kuulavad häälsalvestisi ning kirjutavad üles, mida nad kuulsid. Lisaks kuuldule märgitakse üles ka sugu ja vanus, kirjutab VRT.

Mis olukordasid on Google tarkvara salvestanud?

Kuigi süsteem peaks salvestama inimeste juttu vaid siis kui inimesed otsivad midagi Google abil, siis leke viitab sellele, et salvestatud on ka muul ajal.

Enamik lindistusi olid süütud, kuid oli ka 153 juhtu, mille puhul ütleb VRT, et «neid vestlusi poleks kunagi tohtinud salvestada». Salvestusele jäi neil juhtudel tülisi, vooditoa jutte, laste-vanemate vestlusi, aga ka vägivallajuhtum ning telefonikõned, kus edastati salajast informatsiooni.

Kogemata lindistamise põhjuseks on tõenäoliselt asjaolu, et vestluse käigus ütles üks osapool midagi, mis salvestamistehnika jaoks meenutas fraasi «Ok Google».

Google vastus

Google ütles blogis vastuseks, et lekke taga oli üks lindistuste ülevaataja, kelle tööks oli täiustada nutikõlarite lingvistilisi oskusi.

Pärast leket on võetud vajalikud sammud, kaitsmaks inimeste privaatsust, kelle häält Google töötajad üle kuulavad, ütles Google.

Vaatamata lekkele, ütleb Google, et helisalvestuste tegemine on oluline osa ehitamaks tehnoloogiat, mida saab aktiveerida läbi kõne. Samuti ei ole helisalvestused kunagi seotud kindla inimesega, vaid on anonümiseeritud.

Tagasi üles