Kas arvuti saab õpetada ennast tervet mõistust?
Mitte liiga kauges minevikus loetakse oksümorooniks viidet sellele, et arvuti suudab näidata "tervet mõistust". Kuid sellised superarvutid nagu IBMi Watson võivad arvutite jaoks uusi rolle tähistada.Praegu töötavad Carnegie Melloni ülikooli teadlased 24 tundi ööpäevas arvutiprogrammiga, püüdes andmeid hõivata ja ennast massitundeks õpetada.
Programmi nimetatakse Never Ending Image Learneriks (NEIL), kuna tarkvara otsib veebist pilte, andes endast parima, et neid iseseisvalt mõista ja kuna see loob kasvava visuaalse andmebaasi, kogudes tervet mõistust massiliselt.
NEIL kasutab arvutinägemise hiljutisi edusamme, mis võimaldavad arvutiprogrammidel tuvastada ja sildistada piltidel olevaid objekte, iseloomustada stseene ja tuvastada atribuute, nagu värvid, valgustus ja materjalid, ja seda kõike minimaalse inimese järelevalve all.
Omakorda genereerivad andmed suurendavad veelgi arvutite võimet visuaalset maailma mõista.
NEIL-il on varasemate robotiseadmete ees märkimisväärseid edusamme, kuna see võib luua mõistliku teabe saamiseks seoseid asjade vahel. Teave, mida inimesed teavad peaaegu intuitiivselt - et autosid leidub sageli teedel, et hooned kipuvad olema vertikaalsed ja pardid näevad välja nagu haned.
Tekstiviidete põhjal võib tunduda, et lammastega on seotud must värv, kuid inimesed - ja nüüd NEIL - teavad siiski, et lambad on tavaliselt valged.
"Kujutised on parim viis visuaalsete omaduste õppimiseks," ütles Carnegie Melloni robootikainstituudi dotsent Abhinav Gupta.
"Pilt sisaldab ka palju tervet mõistust käsitlevat teavet maailma kohta. Inimesed õpivad seda ise ja koos NEIL-iga loodame, et ka arvutid teevad seda. "
Arvutiklaster töötab NEIL-programmi alates juuli lõpust ja on juba analüüsinud kolme miljonit pilti, tuvastades 1500 tüüpi objekte pooles miljonis pildis ja 1200 tüüpi stseene sadades tuhandetes piltides.
See on ühendanud punktid, et õppida 2500 ühendust tuhandetest juhtumitest.
NEIL-projekti üks motivatsioon on luua maailma suurim visuaalselt struktureeritud teadmistebaas, kus objektid, stseenid, tegevused, atribuudid ja kontekstuaalsed suhted on sildistatud ja kataloogitud.
"Mida oleme viimase 5-10 aasta jooksul arvutinägemisuuringute käigus õppinud, on see, et mida rohkem andmeid teil on, seda paremaks muutub arvuti nägemine," sõnas Gupta.
Mõni projekt, näiteks ImageNet ja Visipedia, on üritanud neid struktureeritud andmeid inimese abiga kokku panna.
Kuid Interneti ulatus on nii suur - ainuüksi Facebookis on rohkem kui 200 miljardit pilti -, et ainus lootus seda kõike analüüsida on õpetada arvuteid seda suuresti ise tegema.
Samuti ütlevad inimesed NEILile, milliseid objektide, stseenide jne kategooriaid otsida ja analüüsida. Kuid mõnikord võib NEILi leitud teadlasi üllatada.
Võib näiteks eeldada, et otsingu „õun” abil võidakse kuvada nii puuvilja kui ka sülearvuteid. Kuid Guptal ja tema meeskonnal, kõigil maalappijatel, polnud aimugi, et F-18 otsimisel tuvastatakse mitte ainult hävitaja kujutised, vaid ka F18-klassi katamaraanid.
Otsingu edenedes arendab NEIL objektide alamkategooriaid - kolmerattalised jalgrattad võivad olla mõeldud lastele, täiskasvanutele ja mootoriga või on autosid mitmesuguste kaubamärkide ja mudelitega.
Ja see hakkab märkama assotsiatsioone - et sebrasid leidub näiteks savannides ja aktsiatega kauplemise põrandad on tavaliselt ülerahvastatud.
Enne kui NEIL-ist saab kodunimi, tuleb skaalat vähendada, kuna NEIL on arvutuslikult intensiivne, kuna programm töötab kahes arvutiklastris, mis sisaldab 200 töötlevat südamikku.
Allikas: Carnegie Melloni ülikool