Praktiline AI Podcast: Tehisintellekt ja kõnesüntees eesti keeles
Description
Hääleassistendid ja kõnesüntees muutuvad AI-lahendustes üha tähtsamaks. Tippimine tüütu, palju mugavam oleks lihtsalt rääkida. Räägime, kuidas tänased tehisintellekti häälemudelid juba töötavad, millised on nende tugevused ja piirangud. Kuidas kohandada AI-d loomulikuks suhtluseks eesti keeles. Vaatame, kuidas AI vastab kõnele ilma et peaks heli esmalt tekstiks muutma.Katse AI Karmeniga eesti keeles
Saade algas hääleassistendi Karmeni demoga. See oli katse, kus AI kõnesüntees tegi saate sissejuhatuse. Karmen töötas ChatGPT 4o mudelil ja oli ühendatud läbi telefoni. See põhjustas viivitust ja mõningast katkendlikkust. Priit ja Henrik tõdesid, et täna on juba olemas paremaid, soravamaid häälemudeleid, aga need ei pruugi veel hästi eesti keelt toetada.
Miks hääleassistendid muutuvad oluliseks?
Priit tõi välja, et inimesed ei taha väikeste ekraanide peal tippida, häälega suhtlemine on loomulikum. Arvutid ja telefonid on klaviatuurile orienteeritud lihtsalt sellepärast, et varem polnud paremaid viise. Tänaseks on tehnoloogia arenenud sinnamaani, kus vestluspõhine kasutajaliides saab olla peamine.
Katsetused OpenAI Playgroundis
Priit kirjeldas, kuidas ta testis OpenAI API kaudu häälemudelit. Ta rääkis robotiga otse mikrofoni kaudu, kusjuures heli analüüsiti kohe ilma vahepealse tekstiks muutmiseta. Roboti algne reaktsioon oli liiga pikk ja monotoonne, aga pärast prompti muutmist, et vastused oleksid lühemad ja dialoogilised, muutus suhtlus loomulikumaks ja kiireks.
Robotite loogika ja parandusvõimalused
Henrik selgitas, et roboti monotoonsust ja liigset formaalsust saab promptidega korrigeerida. Näiteks võib anda käsu, et AI teeks mõtlikke pause, kasutaks vahehelisid nagu “noh” või “hmm” ja räägiks inimesele omasemalt. Ta lisas, et kasutab kodus Alexa’t juba kuus aastat ning lapsed oskavad seda loomulikult kasutada.
Kasutuskohad ettevõtluses ja teeninduses
Priit tõi näiteid, kus AI võiks asendada inimese: näiteks kliinikute kõned patsientidele, kes peavad kinnitama oma tulekut. See hoiaks kokku töötundide arvelt. Inkassos võiks AI võtta ühendust juba varakult, enne kui probleem suureks kasvab. Samuti võiks AI teha järelpärimisi enne maksetähtaega, et vältida vaidlusi.Henrik lisas, et isegi kui osa inimesi ei soovi robotiga rääkida, siis saab AI info edasi anda päris inimesele. Enamik inimesi ei pahanda, kui robot helistab, eriti kui ta räägib normaalselt.
Kliendikõnede kvaliteedi analüüs
Arutati, et täna kuulatakse kõnekvaliteedi hindamisel ainult negatiivseid juhtumeid. Tegelikult oleks väärtuslik ka positiivseid kõnesid kuulata, et mõista, miks need töötasid. Sellest võib õppida rohkem kui vigade otsimisest.
Eesti keele toetus ja murdeprobleemid
Räägiti varasemast projektist, kus katalaani arendaja õpetas AI-d eesti keeles rääkima, robot sai aru, kuigi inimesed mitte. See näitab, et hääleassistente saab õpetada erinevate aktsentidega ja mudelite treenimine on võti. Eesti ja soome keel võivad inimesele tunduda täiesti erinevad, aga vektormaailmas on nad lähedased.
Muud praktilised kasutusvaldkonnad
Näiteks teenusepakkujad, kes saavad kõnesid automatiseerida. Või eakad inimesed, kelle jaoks on AI-ga häälsuhtlus palju kergem kui ekraani kasutamine. Sama kehtib puuetega inimeste kohta, näiteks pimedad, kes kasutavad tekstipõhiseid lahendusi, aga kellele häälega juhtimine võiks olla palju loomulikum ja kiirem.
Meelelahutus ja uudiste tarbimine
Hääleassistentidega saab mängida mänge, nagu Priidu lapsed teevad Alexa abil. Samuti võiks AI teha uudistest kokkuvõtteid ja lugeda neid kasutajale ette. Priit siiski tõdes, et tema eelistab lugeda, mitte kuulata, sest loetud info omandamine on tal kiirem.
Kogemused olemasolevate tööriistadega
......