Ajupildid näitavad, kuidas õpistrateegiad töötavad

Värskendamine on vajalik, et saaksime muutuva keskkonna tingimustes neid hüvesid täpselt prognoosida.
Ehkki aju seda protsessi täpselt korraldab, jääb ebaselgeks, soovitab uus uuring, et meie käitumist juhib kahe erineva õppestrateegia kombinatsioon.
Töö kohta ilmub paber ajakirjas Neuron.
Üks aktsepteeritud õppestrateegia, mida nimetatakse mudelivabaks õppeks, tugineb katse-eksituse meetodil antud olukorras oodatava tasu ja tegelikult saadud tasu võrdlustele.
Selle võrdluse tulemuseks on “preemia ennustamise vea” genereerimine, mis vastab sellele erinevusele.
Näiteks võib preemia ennustamise viga vastata erinevusele finantsinvesteeringu prognoositud rahalise tootluse ja meie reaalse tulu vahel.
Teises mehhanismis, mida nimetatakse mudelipõhiseks õppeks, genereerib aju keskkonna kognitiivse kaardi, mis kirjeldab erinevate olukordade suhet.
"Mudelipõhine õpe on seotud" olekuprognoosivea "genereerimisega, mis esindab aju üllatuse taset uues olukorras, arvestades praegust keskkonna hinnangut," ütleb Jan Gläscher, Caltechi järeldoktor ja juhtivteadur uuringu autor.
"Mõelge olukorrale, kus sõidate pärast tööd koju sõites alati sama marsruuti, kuid konkreetsel päeval on tavapärane tee ehitustööde tõttu blokeeritud," ütleb Gläscher.
„Mudelivaba õppesüsteem läheks abitult kaotsi; see on seotud ainult toimingute tegemisega, mis varem olid tasulised, nii et kui need toimingud pole enam saadaval, ei saaks ta otsustada, kuhu edasi minna.
"Kuid mudelipõhine süsteem suudaks pärida oma kognitiivset kaarti ja leida alternatiivset marsruuti kasutades tõhus ümbersõit."
"Kuigi lihtsamat mudelivaba õppemehhanismi on hästi uuritud ja selle põhiline õppemehhanism - mille taga on preemiaennustamise vead - on suhteliselt hästi mõistetav, on keerukama mudelipõhise õppesüsteemi aluseks olevad mehhanismid selle rikkaliku kohanemisvõime ja paindlikkusega , on vähem mõistetavad, ”ütleb John P. O'Doherty, Caltechi psühholoogiaprofessor.
Nende kahe õppesüsteemi neuroloogiliste aluste täiendavaks iseloomustamiseks lõid Gläscher, O'Doherty ja nende kolleegid arvutipõhise otsustusülesande, mis võimaldas neil mõõta, millal ja kus aju arvutab nii tasu kui ka oleku prognoosimise veasignaale, ja teha kindlaks, kas need kahte tüüpi vead toodavad tegelikult erinevaid närviallkirju.
Ülesandes pidid katsealused tegema valikuid vasakule ja paremale liikumise vahel, mis võimaldas neil virtuaalses keskkonnas liikuda erinevate “graafiliste ikoonidega tähistatud” olekute vahel; protsess sarnaneb lihtsas videomängus ringi liikumisele.
Iga selles virtuaalses keskkonnas tehtud vasak- või parempoolne valik viis subjekti uude olekusse. Nende eesmärk oli jõuda rahalise preemia saamiseks kindlasse eesmärgi seisundisse, "ja nende võimalused sellesse sihtriiki jõuda sõltusid tugevalt nende tehtud järjestikuste valikute konkreetsest mustrist," selgitab O’Doherty.
Mudelipõhine süsteem saab õppida tundma virtuaalse keskkonna struktuuri ja seejärel kasutada seda teavet tasu seisundisse jõudmiseks vajalike toimingute arvutamiseks analoogselt sellele, kuidas maletaja võib proovida läbi mõelda järjestikused vajalikud maleliigutused. matši võitmiseks.
Mudelivaba süsteem seevastu õpiks pimesi valima vaid neid tegevusi, mis minevikus tasu andsid, hindamata tagajärgi praeguses olukorras.
18 osalejat skanniti ülesande õppimisel funktsionaalse magnetresonantstomograafia abil. Aju skaneeringud näitasid preemia ennustamise vea eristavat, varem iseloomustatud närviallkirja - mis tekkis mudelivaba õppimise käigus - aju keskel asuvas piirkonnas, mida nimetatakse ventraalseks striatumiks.
Mudelipõhise õppimise käigus ilmnes aga olekuprognooside vea neuronaalne signatuur ajukoores aju pinnal kahes erinevas piirkonnas: intraparietaalses sulcus ja lateraalses prefrontaalses ajukoores.
Need tähelepanekud viitavad sellele, et inimese ajus arvutatakse kahte ainulaadset veasignaali tüüpi, mis esinevad erinevates ajupiirkondades ja võivad esindada käitumise suunamiseks eraldi arvutusstrateegiaid.
"Mudelivaba süsteem toimib väga tõhusalt olukordades, mis on väga automatiseeritud ja korduvad - näiteks kui ma lähen regulaarselt sama marsruuti töölt koju," ütleb Gläscher, "samas kui mudelipõhine süsteem, mis nõuab palju suuremat aju- töötlemisvõimsus, suudab paindlikult kohaneda uudsete olukordadega, näiteks on vaja leida uus marsruut pärast teetõket. "
Need kaks erinevat õppemehhanismi täidavad inimkäitumise kontrollimisel täiendavaid rolle, ütleb Gläscher.
"Kuna meie aju töötlemisvõimsus on piiratud, pole mõtet arvutuslikult intensiivsemat mudelipõhist süsteemi kõige meie juhtimiseks juurutada. Selle asemel on parem tugineda mudelivabale süsteemile paljuski meie igapäevases käitumises ja kasutada mudelipõhist süsteemi ainult uute või keeruliste olukordade jaoks. Oluline valdkond edasiste uuringute jaoks on proovida mõista tegureid, mis mõjutavad nende süsteemide vastastikust suhtlemist käitumise kontrollimiseks, ja teha kindlaks, kuidas seda ajus rakendatakse. "
Allikas: California Tehnoloogiainstituut