NORISES
>
Notikumi, problēmas, aktuālas tēmas
TĒMAS
Juris Kaža
neatkarīgais žurnālists
27. janvārī, 2017
Lasīšanai: 9 minūtes
RUBRIKA: Tuvplānā
TĒMA: E-vide
3
3

Balss atpazīšanas rīki jeb kā “sarunāties” ar datorizētām ierīcēm

Publicēts pirms 7 gadiem. Izvērtē satura aktualitāti! >>

Apple izstrādātais Siri gan telefonā, gan datorā atbildes sniedz rakstiski, parādot virkni interneta resursu, kur, piemēram, var atrast, “cik bieži var lidot no Rīgas uz Stokholmu”.

FOTO: Aiga Dambe, LV portāls

Ja mums vajadzīgs kaut kas, ko nevaram izdarīt paši, parasti, ja esam ģimenē vai citu cilvēku sabiedrībā, to palūdzam. Gandrīz lieki, pat komiski teikt, ka izmantojam balsi. Tuviniekam: “Mīļā, cikos rāda Šerloku”? Pie pieturas: “Atvainojiet, 6. tramvajs jau aizbrauca vai nedaudz kavē?” Kafejnīcā: “Jums te skan radio. Vai neteica, kā veicas “Rīgas Dinamo” šodienas spēlē?” Kaimiņam kāpnēs: “Vai visu dienu tā snigs?”
īsumā
  • Informācijas sistēmas arvien biežāk izmanto dabiskāko saskari ar cilvēkiem – balsi.
  • Pateicoties mākslīgā intelekta risinājumiem, datori un mobilie telefoni daudz labāk saprot balsi.
  • Ar mobilo ierīci Latvijā pagaidām var "sarunāties" tikai angliski vai krieviski (ja neprot citas "lielās valodas"), bet ir vairākas balss palīglietotnes, tostarp Siri, Cortana un Google Now.
  • Vide, kurā ierīces mūs vienmēr "dzirdēs" un sapratīs, rada nopietnus jautājumus par privātumu.

Parasti sagaidām, ka mums atbildēs mutiski, arī tad, ja atbilde ir "TV programma taču ir internetā" vai "Re, tepat sarakstā rakstīts, ka 6. tramvajs būs pēc trīs minūtēm", vai retā gadījumā "What did you say? Tram? Sorry, I am a tourist" ["Ko jūs teicās? Tramvajs? Atvainojiet, es esmu tūrists" – angliski]. Taču, pats galvenais, – lai cik mēs nebūtu pieraduši sērfot un "rakties" pa internetu ar dažādām ierīcēm, visērtākais un dabiskākais veids, kā iegūt informāciju, ir saruna.

Balsis arvien labāk "saprot" mākslīgais intelekts

Kā nesen rakstīja žurnāls "The Economist", tā dēvētā balss atpazīšana jeb iespēja "sarunāties" ar datorizētām ierīcēm ir spērusi milzu attīstības soļus. Virkne jauno tehnoloģiju, pārsvarā dažādas tā dēvētā mākslīgā intelekta izpausmes, ir radījušas iespēju informācijas sistēmām paprasīt vai pateikt to, ko vēlamies. Ar mašīnapmācības un mākslīgā intelekta paņēmieniem ir būtiski uzlabota informācijas sistēmu spēja saprast dabisko runu. Sistēmas pat saprotot teiktā kontekstu un dažādas, bet nebūt ne visas nianses.

Latviešu valodā, kura nav prioritāra valodas sapratnes sistēmu izstrādē, labs tests sistēmai būtu redzēt, vai tā kontekstā pareizi saprot jautājumu "Vai šovasar skolēni gulēs zālē?". Vienā gadījumā sistēmai būtu pateikts, ka skola X piedalās Skolu jaunatnes dziesmu svētkos, tādēļ atbilde skanēs – jā, skolnieki-ciemiņi gulēs sporta zālē.  Citā kontekstā, zinot, ka daudzos parkos var gulšņāt zālājā,  sistēma atbildēs, ka "iedzīvotāji, arī skolnieki, varēs gulēt zālē A, B un C, bet ne D parkā".

Balss palīgu skaits un izvēle kļūst lielāka

Pagaidām tik precīzas atbildes no informācijas sistēmas var saņemt (un ne jau latviešu valodā), iespējams, tikai laboratorijā, taču Latvijas un pasaules tirgos jau ir pieejami ar balsi darbināmi "palīgi", kas darbojas vairākās lielās pasaules valodās, tostarp angļu un krievu.

Visplašāk izplatītais risinājums Latvijā, iespējams, ir Apple izstrādātais Siri. Siri sākotnēji parādījās 2011. gadā kā iPhone lietotne, taču tas arī spēj mājot iPad  planšetēs un Apple portatīvos un galda datoros. Siri, vaicāta amerikāņu angļu valodā, atbild "amerikāniski", ka protot vairākas valodas, un atver "logu" portatīvā datora ekrānā, kur rakstīts, ka "runājot" vairākos ķīniešu dialektos, holandiešu, angļu, franču, itāļu, vācu un spāņu valodā un "saprotot" arābu, dāņu, somu, japāņu, korejiešu, malaju, norvēģu, Brazīlijas portugāļu, krievu, zviedru, taizemiešu, turku valodu, kā arī ivritu. Proti, lietotne sapratīs lūgumus šajās valodās, bet nespēs sniegt balss atbildes.

Arī angļu valodā Siri gan telefonā, gan datorā atbildes sniedz rakstiski, parādot virkni interneta resursu, kur, piemēram, var atrast, "cik bieži var lidot no Rīgas uz Stokholmu". Pirmo reizi, prasot Siri telefona versijai šo jautājumu, lietotne "aizķērās" pie vārda Rīga un sāka angļu valodā savā (sievietes) balsī lasīt garu Vikipēdijas ierakstu par Rīgu. Interesanti, ka lasīšanu varēja pārtraukt ar balss komandu "Pietiek!" ("Enough!" - angliski).

Siri prot vairākus angļu dialektus un krievu valodu

Gados jauniem Latvijas iedzīvotājiem ar labām angļu valodas zināšanām ieteicams eksperimentēt ar iespēju Siri pielāgot deviņām dažādām izrunām, tostarp Latvijas skolās visbiežāk mācītām britu un amerikāņu angļu valodas izrunām. Ir arī iespēja pielāgot Siri īru izloksnei, kas varētu noderēt Īrijas latviešiem un viņu atvasēm. Saistībā ar Siri versiju krievu valodā 2015. gadā bija neliels skandāls, jo lietotne krievu valodā atcirta uz jautājumiem par gejiem, norādot lietotājam, ka tas izsakot rupjības un cūcības. Kļūda tika labota, un patlaban Apple lietotāju forumos ir tikai dažas piezīmes par krievu valodas niansēm. YouTube ir vairākus gadus vecs īss video, kurā kāds krieviski runājošs lietotājs ar sava iPhone starpniecību sarunājas ar Siri un saņem atbildes gan ar balsi, gan ekrānā kirilica burtiem.

Tuvākais konkurents

Siri ir balss palīgs, kas patlaban nāk komplektā ar Apple produktiem. Lietotnes tuvākais konkurents ir "palīgs" Cortana, kas ir komplektēts ar Microsoft Windows 10 operētājsistēmu un tās mobilo ierīču variantiem. Cortana var lietot, gan rakstot jautājumus, gan ar balsi. Patlaban Cortana saprot septiņas valodas, tostarp angļu valodas amerikāņu un britu izloksni, bet pagaidām nesaprot krievu valodu. Interneta aprakstos un recenzijās teikts, ka gan Siri, gan Cortana pielāgojas lietotāja runas veidam un vajadzībām.

Android operētājsistēmas ierīcēm ir vairāki balss palīgi, tostarp Google Now, kuru izstrādājis Android saimnieks – Google. Diemžēl Android operētājsistēmai ir daudz un dažādi varianti un balss palīgi katrā variantā darbojas citādi. Tiesa gan, Google Now ir arī pieejams Apple operētājsistēmai un cenšas nedaudz izaicināt Siri. Savukārt Google meklētāju datoros (ja ir mikrofons un Chrome pārlūks) var regulēt klausīties balss komandas daudzās valodās, tostarp krievu un lietuviešu, bet ne latviešu. 

Katrās mājās – gudrs skaļrunis, kas visu dzird?

Atgriezīsimies sākotnējā situācijā – esam mājās un kaut ko prasām tuviniekam, sagaidot atbildi no blakusistabas. Ja neviena nav mājās un nav pie rokas datora, interneta lieltirgotājs Amazon tam piedāvā risinājumu Echo.  Echo  ir staba vai kolonnas  formas skaļrunis/mikrofons/interneta ierīce -  viss vienā. Ja dzīvesbiedra/biedres vai dzīvokļa kompanjona nav mājās, Echo sadzirdēs jautājumu  "Cikos rāda Šerloku?" (pagaidām tikai angliski – When is Sherlock showing?). Ja palūgs spēlēt mūziku no savas kolekcijas, tā skanēs Echo skaļrunī.

Echo pagaidām ir pieejams tikai ASV un nosacīti Lielbritānijā un Vācijā (ar "ielūgumiem" Amazon.de klientiem). Tas maksās ap 179 eiro un jāpieslēdz platjoslas internetam. "Stabs" un arī mazāks variants Echo Dot arī spēj darboties kā modinātājs un atgādinātājs, kas paziņos, ka jāceļas vai tuvojas kāda tikšanās. Tos iestāda ar balsi, palūdzot modināt plkst.8 vai atgādināt par tikšanos ar Irinu plkst.14. To pašu spēj arī Siri un līdzīgi risinājumi.

Echo pamatā ir saikne ar Alexa platformu, kas darbojas "mākonī" un spēj vadīt vairākas ierīces vienā un tajā pašā mājokli – Echo un Echo Dot, kā arī "gudras ierīces", kas pielāgotas šai sistēmai. Citiem vārdiem, Echo  ar balsi var palūgt ieslēgt kafijas vārītāju vai plīti.

Glabājas lietotāju darbības vēsture

Nav grūti iedomāties, ka Siri parastā iPhone telefonā neglabā visu Vikipēdijas saturu vai Stokholmas metro sarakstu – tā, līdzīgi visiem "balss palīgiem", cieši sadarbojas ar milzu informācijas krājumiem un datu apstrādes resursiem "mākonī". Arī balss lūgumu analīze, lietojot dažus no The Economist minētajiem mākslīgā intelekta paņēmieniem, notiek ārpus ierīces, attālinātā mākoņdatošanas centrā. Šajā datu centrā arī, iespējams, glabājas lietotāju darbības vēsture, kas rada zināmus jautājumus par privātumu. ASV jau sabiedrība diskutē, vai Echo "dzird" visu, jo policija kādā slepkavības lietā cenšas iegūt datus no Echo, kas atradies nozieguma tuvumā.

Latvijas iedzīvotājiem visi šie brīnumi pagaidām ir pieejami tikai svešvalodās, tostarp angļu un krievu valodā, kuras daudzi zina. Tomēr Latvijā  valodu tehnoloģiju kompānija  Tilde strādā pie latviešu valodas izmantošanas datorprogrammās un internetā, un The Economist raksta, ka viens no prioritāriem runas analīzes tehnoloģiju pielietojumiem ar Eiropas finansējuma atbalstu ir mazās valodas. Iespējams, jau 2018. gadā varēsim Siri vai līdzīgai lietotnei skaidrā latviešu valodā prasīt:  "Cikos sāksies Latvijas simtgades svinību parāde?"

Labs saturs
3
Pievienot komentāru
LATVIJAS REPUBLIKAS TIESĪBU AKTI
LATVIJAS REPUBLIKAS OFICIĀLAIS IZDEVUMS
ŽURNĀLS TIESISKAI DOMAI UN PRAKSEI