Arenduses: nutitelefonid, mis suudavad hinnata meeleolu
Rochesteri ülikooli teadlased töötavad välja uue arvutiprogrammi, mis mõõdab kõne kaudu inimeste tundeid, koos juba loodud nutitelefonide prototüüprakendusega.Programm ei analüüsi inimese öeldut, vaid pigem seda, kuidas.
"Me kasutasime tegelikult näitlejate salvestisi, mis lugesid ette kuu kuupäeva - tegelikult pole tähtis, mida nad ütlevad, vaid see, kuidas nad seda ütlevad, on meid huvitanud," ütles professor Wendi Heinzelman elektri- ja arvutitehnika valdkonnas.
Programm analüüsib kõne 12 funktsiooni, nagu helikõrgus ja helitugevus, et tuvastada helisalvestise põhjal üks kuuest emotsioonist. Teadlaste sõnul saavutab see 81-protsendise täpsuse, mis on märkimisväärne paranemine varasemate uuringutega, mis saavutasid vaid umbes 55-protsendilise täpsuse.
Uuringut on juba kasutatud rakenduse prototüübi väljatöötamiseks, mis kuvab pärast kasutaja hääle salvestamist ja analüüsimist kas õnnelikku või kurba nägu. Selle ehitas üks Heinzelmani kraadiõppuritest Na Yang Microsoft Researchi suvisel praktikal.
"Uuringud on alles algusjärgus," möönis Heinzelman, "kuid on lihtne ette kujutada keerukamat rakendust, mis võiks seda tehnoloogiat kasutada kõigeks, alates oma mobiilis (telefonis) kuvatavate värvide reguleerimisest kuni muusika mängimiseni vastavalt sellele, kuidas te tunneme pärast hääle salvestamist. "
Heinzelman ja tema meeskond teevad koostööd Rochesteri psühholoogide dr. Melissa Sturge-Apple ja Patrick Davies, kes uurivad praegu teismeliste ja nende vanemate suhtlemist. "Usaldusväärne viis emotsioonide kategoriseerimiseks võib meie uurimistöös olla väga kasulik," ütles Sturge-Apple. "See tähendaks, et teadlane ei pea kuulama vestlusi ja käsitsi sisestama erinevate inimeste emotsioone erinevates etappides."
Teadlaste sõnul õpetatakse arvutit emotsioonide mõistmiseks mõistma, kuidas inimesed seda teevad.
"Võite kuulda kedagi rääkimas ja mõtlemas:" oh, ta kõlab vihaselt. "Kuid mis paneb teid seda mõtlema?" ütles Sturge-Apple.
Ta selgitas, et emotsioon mõjutab inimeste kõneviisi, muutes oma kõne helitugevust, helikõrgust ja isegi harmoonilisi jooni. "Me ei pööra nendele funktsioonidele eraldi tähelepanu, vaid oleme lihtsalt õppinud, kuidas vihane kõlab - eriti inimestele, keda me tunneme," lisas ta.
Kuid selleks, et arvuti emotsioone kategoriseerida, peab see töötama mõõdetavate suurustega. Niisiis määrasid teadlased kõnes 12 eripära, mida mõõdeti igas salvestuses lühikese intervalliga. Seejärel liigitasid teadlased kõik salvestised kategooriatesse ja õpetasid neid arvutiprogrammile, kuidas kõlavad “kurb”, “õnnelik”, “kartlik”, “jälk” või “neutraalne”.
Seejärel analüüsis süsteem uusi salvestisi ja püüdis kindlaks teha, kas salvestise hääl kujutas mõnda teadaolevat emotsiooni. Kui arvutiprogramm ei suutnud otsustada kahe või enama emotsiooni vahel, jättis see selle salvestise lihtsalt klassifitseerimata.
"Me tahame olla kindlad, et kui arvuti arvab, et salvestatud kõne peegeldab konkreetset emotsiooni, kujutab see tõenäoliselt seda emotsiooni," ütles Heinzelman.
Varasemad uuringud on näidanud, et emotsioonide klassifitseerimissüsteemid sõltuvad tugevalt kõnelejast, see tähendab, et need toimivad palju paremini, kui süsteemi koolitab sama hääl, mida ta analüüsib. "See ei ole ideaalne olukorras, kus soovite, et saaksite lihtsalt korraldada katse rühma inimestega, kes räägivad ja suhtlevad, nagu vanemad ja teismelised, kellega me koos töötame," ütles Sturge-Apple.
Uued tulemused kinnitavad seda leidu. Kui kõnepõhist emotsioonide klassifikatsiooni kasutatakse häälel, mis erineb süsteemist, langes täpsus 81 protsendilt umbes 30 protsendile. Teadlased otsivad nüüd võimalusi selle efekti minimeerimiseks, treenides süsteemi samas vanuserühmas ja samas soos häältega.
"Kui me tahame seda süsteemi kasutada reaalses elus sarnanevas keskkonnas, on veel lahendada probleeme, kuid me teame, et meie väljatöötatud algoritm on varasematest katsetest tõhusam," ütles Heinzelman.
Allikas: Rochesteri ülikool