Puuduste leidmine sotsiaalmeedia uurimises

Montreali McGilli ülikooli ja Pittsburghi Carnegie Melloni ülikooli arvutiteadlaste sõnul peavad teadlased olema ettevaatlikud suurte sotsiaalmeedia andmekogumitega töötamise tõsiste lõkse ees.

Vigastel tulemustel võib olla tohutu mõju: tuhanded teadustööd põhinevad igal aastal sotsiaalmeediast kogutud andmetel.

"Paljusid neist dokumentidest kasutatakse otsuste ja investeeringute teavitamiseks ja põhjendamiseks avalikkuse ning tööstuse ja valitsuse seas," ütles McGilli arvutiteaduste kooli dotsent dr Derek Ruths.

Käitumisteadlaste jaoks on sotsiaalmeedia kasv tundunud enneolematu võimalus hõivata ja seejärel analüüsida ohtralt inimkäitumist puudutavat teavet.

Paljud teadlased usuvad, et sellised küpsed andmekogumid võivad ennustada inimese käitumist tasemel, mida pole kunagi ette kujutatud. Viimastel aastatel on uuringud väitnud võimet ennustada kõike alates suvistest kassahittidest kuni aktsiaturu kõikumisteni.

Kuid ajakirjas avaldatud artiklis Teadus, Ruths ja dr Jürgen Pfeffer Carnegie Melloni tarkvarauuringute instituudist toovad välja mitmeid sotsiaalmeedia andmekogumite kasutamisega seotud probleeme ning nende lahendamise strateegiaid. Väljakutsetest:

  • Erinevad sotsiaalmeedia platvormid meelitavad erinevaid kasutajaid - näiteks Pinteresti domineerivad 25–34-aastased naised -, kuid teadlased korrigeerivad harva moonutatud pilti, mida need populatsioonid suudavad tekitada;
  • Sotsiaalmeedia uurimistöös kasutatavad avalikult kättesaadavad andmevood ei anna alati täpset ülevaadet platvormi üldandmetest - ja teadlased on üldiselt pimeduses, millal ja kuidas sotsiaalmeedia pakkujad oma andmevoogusid filtreerivad;
  • Sotsiaalmeedia platvormide disain võib dikteerida kasutajate käitumist ja seetõttu ka seda, millist käitumist saab mõõta. Näiteks muudab Facebookis nupu "ei meeldi" puudumine negatiivseid vastuseid sisule raskemini tuvastatavaks kui positiivseid meeldimisi;
  • Suur hulk rämpspostitajaid ja roboteid, mis sotsiaalmeedias maskeerivad tavaliste kasutajatena, lülitatakse ekslikult paljudesse inimkäitumise mõõtmistesse ja ennustustesse;
  • Teadlased annavad sageli tulemusi hõlpsasti klassifitseeritavate kasutajate, teemade ja sündmuste rühmade kohta, muutes uued meetodid tegelikest täpsemateks. Näiteks jõupingutused Twitteri kasutajate poliitilise orientatsiooni järeldamiseks saavutavad tüüpilistele kasutajatele vaevalt 65-protsendilise täpsuse - kuigi uuringud (keskendudes poliitiliselt aktiivsetele kasutajatele) on väitnud 90-protsendilist täpsust. Twitteri kasutajad saavutavad tüüpiliste kasutajate jaoks vaevalt 65-protsendilise täpsuse - kuigi uuringud (keskendudes poliitiliselt aktiivsetele kasutajatele) on väitnud 90-protsendilist täpsust.

Uurijate sõnul on paljud probleemid levinud ka teistes valdkondades, näiteks epidemioloogia, statistika ja masinõpe.

"Kõigi nende probleemide ühine joon on teadlaste vajadus olla sotsiaalmeedia andmetega töötades teadlikumalt sellest, mida nad tegelikult analüüsivad," ütleb Ruths.

Sotsiaalteadlased on oma väljakutseid lahendanud juba varem.

"Kurikuulus 1948. aasta pealkiri" Dewey võidab Trumani "tulenes telefoniküsitlustest, mille käigus Trumani toetajad valimisse alla jäid," märgib Ruths.

"Selle asemel, et valimisvõtteid alaliselt diskrediteerida, viis see räige viga tänapäevaste keerukamate tehnikate, kõrgemate standardite ja täpsemate küsitlusteni. Nüüd oleme sarnases tehnoloogilises pöördepunktis. Käsitledes probleeme, millega silmitsi seisame, suudame realiseerida sotsiaalmeedias toimuvate teadusuuringute poolt lubatud tohutu hea potentsiaali. "

Allikas: McGilli ülikool

!-- GDPR -->