Big Data võib aidata arvutitel piltidega seotud emotsioone
Populaarsed saidid nagu Twitter ja Facebook ning muud kanalid on nüüd täis pilte, mis aitavad inimesel mõtteid ja tundeid paremini väljendada. Uute uuringute kohaselt võib arvutit õpetada piltidega seotud sisu ja tundeid tõlgendama „suurandmeid“ - mis tahes andmekogumite kogumit, mis on nii suur või keeruline, et traditsiooniliste andmetöötlusrakenduste abil on seda keeruline töödelda.
Rochesteri ülikooli arvutiteaduse professor dr Jiebo Luo esitas koostöös Adobe Researchi teadlastega hiljuti Ameerika kunstliku intelligentsuse assotsiatsiooni (AAAI) konverentsil ettekande, milles kirjeldatakse progressiivset sügava konvolutsioonilise närvivõrgu (CNN) koolitust. .
Väljaõppinud arvutit saab seejärel kasutada selleks, et teha kindlaks, milliseid tundeid need pildid tõenäoliselt tekitavad. Luo ütleb, et see teave võib olla kasulik nii mitmekesiste asjade jaoks nagu majandusnäitajate mõõtmine või valimiste ennustamine.
Ülesanne on siiski keeruline. Teksti sentimentaalne analüüs arvutite abil on ise keeruline ülesanne. Ja sotsiaalmeedias on meeleolude analüüs keerulisem, kuna paljud inimesed väljendavad end piltide ja videote abil, millest arvuti jaoks on raskem aru saada.
Näiteks poliitilise kampaania ajal jagavad valijad oma vaateid sageli piltide kaudu.
Kaks erinevat pilti võivad näidata sama kandidaati, kuid nad võivad teha väga erinevaid poliitilisi avaldusi. Inimene võib tunnistada, et see on kandidaadi positiivne portree (nt kandidaat naeratab ja tõstab käed üles) ja teine negatiivne (nt pilt kandidaadist, kes näeb välja lüüa).
Kuid ükski inimene ei saanud vaadata kõiki sotsiaalmeedias jagatud pilte - need on tõepoolest "suured andmed". Et teha teadlikke oletusi kandidaadi populaarsuse kohta, tuleb arvutid välja õpetada nende andmete kokkuvõtmiseks, mida Luo ja tema kaastöötajate lähenemisviis suudab täpsemalt teha kui seni oli võimalik.
Teadlased käsitlevad piltidest sentimentide väljavõtmise ülesannet piltide klassifitseerimise probleemina. See tähendab, et kuidagi on vaja iga pilti analüüsida ja sellele kleepida sildid.
Koolitusprotsessi alustamiseks kasutasid Luo ja tema kaastöötajad olemasolevas andmebaasis SentiBank (väljatöötatud dr. Shih-Fu Changi grupis Columbias) tohutult palju Flickri pilte, mis on masinalgoritmi poolt konkreetsete tunnetega lõdvalt märgistatud. Ülikool).
See annab arvutile lähtepunkti, et hakata mõistma, mida mõned pildid võivad edasi anda.
Kuid masinaga loodud sildid sisaldavad ka tõenäosust, et see silt vastab tõele, see tähendab, kui kindel on arvuti, et silt on õige?
Järgmine on koolitusprotsessi põhietapp, kui nad viskavad kõrvale kõik pildid, mille puhul ei pruugi see sentiment või tunded olla tõesed. Seega kasutavad nad võimsa konvolutsioonilise närvivõrgu raames täiendkoolituseks järk-järgult paremaks muutmiseks ainult „paremate” siltidega pilte.
Resaercher leidis, et see täiendav samm parandas oluliselt nende piltide täpsust, millega iga pilt on sildistatud.
Nad kohandasid seda meeleoluanalüüsi mootorit ka mõne Twitterist välja võetud pildiga. Sel juhul kasutasid nad rahvahulga luuret, kusjuures mitu inimest aitasid Amazon Mechanical Turk platvormi kaudu pilte kategoriseerida.
Nad kasutasid arvuti peenhäälestamiseks ainult väikest arvu pilte ja siiski näitasid seda domeeni kohandamise protsessi rakendades, et nad suudavad Twitteri piltide sentimentaalanalüüsiks kasutada tehnika taseme praegust taset.
Üks üllatav järeldus on see, et piltide meeleolu klassifitseerimise täpsus on ületanud samade Twitteri sõnumite tekstide meeleolu klassifikatsiooni täpsuse.
Allikas: Rochesteri ülikool