(Valitud) rahvahulkade tarkus

Üha rohkem ettevõtteid kasutab ära oma klientide ja kasutajate tarkusi - väga valitud rahvahulk. Nad teevad seda „suurandmete” kaudu - koguvad anonüümsete andmete aardekogumeid ja viivad seejärel post-hoc analüüse.

See pingutus võib viia huvitavate teadmisteni. Samuti võib see panna ettevõtteid oletama, et tulemused on üldistatavad kogu elanikkonnale.

Ja see on viimane probleem. Sest kui alustate ise valitud valimiga, on teie andmed asjakohased ainult neile sarnastele inimestele, mitte kogu elanikkonnale. See on vaid üks probleeme valitud rahvahulgadelt saadud teabe põhjal mõõtmise ja tegutsemisega.

Veebisaidid on juba 20 aastat teinud suurandmete mõõtmisi. Iga kord, kui külastate mõnda veebisaiti, jätab see veebisaidi serverisse väikese andmejälje. Serveri omanikud võtavad need andmed ja käitavad neid läbi andmeanalüüsi platvormi (nt Google Analytics). See annab veebisaidi omanikule koondteavet nende veebisaidi külastajate tüüpide kohta.

Kuna iga veebisait on ainulaadne, on sellised teadmised asjakohased ainult selle veebisaidi jaoks. Näiteks CNN-i külastaval kasutajal võib olla vähe ühist Match.com-i külastava kasutajaga.

Valige rahvahulkade probleem

Andmeanalüüsis nimetavad statistikud sellist valimit "ise valitud valimiks", mille tulemuseks on "isevaliku kallutatuse" probleem. Lihtsamalt öeldes tähendab see, et kuna teie andmed pärinevad ainult inimestelt, kes kasutavad kindlat rakendust või mõnda sotsiaalmeediat, ei esinda see kogu elanikkonda. Ja kuna see ei esinda kogu elanikkonda, ei saa te andmete kohta üldistada.

Ma nimetan seda probleemiks “valitud rahvahulgad”. Sest kui kogute oma tarkust rahvahulgast, veenduge parem, et see rahvahulk esindaks elanikkonda, kui proovite sellest üldistavaid teadmisi saada.

On terveid ettevõtteid, kes ei tee midagi muud kui analüüsivad trende ja Twitteri andmeid. Kuid kui vaatate, kes Twitterit kasutab - ja kuidas nad seda kasutavad, oleksite kohe mures selle pärast, mida sellised andmed tegelikult tähendavad. Näiteks on Twitteri kasutajad palju nooremad kui kogu elanikkond ja vanemad inimesed on suuresti alaesindatud. Kui juhite ettevõtet, mis vaatab Twitteris tervisetrende, näete midagi hoopis muud, kui viiksite läbi randomiseeritud telefoniuuringu.

Teisisõnu, millistel Twitteri suundumustel võib olla või mitte olla mingit tähendust 80% -le ameeriklastest, kes Twitterit ei kasuta.

Rakendused pole paremad

Rakendustele meeldib sageli oma kasutaja andmeid koguda, anonüümseks muuta ja seejärel nende abil võrrelda teie toimivust teistega, kes samuti rakendust kasutavad. See peaks teile tekitama tunde, nagu oleksite osa sotsiaalvõrgustikust, millel on rakendus ühine. See on suurepärane idee.

Sest mis siis, kui seda konkreetset rakendust kasutab ainult teatud tüüpi inimene? Mis oleks, kui ainult depressioonis olevad inimesed kasutaksid meeleolu jälgimise rakendust, mis on mõeldud inimeste depressioonist välja tõstmiseks, aidates neil jälgida nende meeleolu, võrreldes nende arengut teistega, kes samuti rakendust kasutavad? Sellised tulemused võivad olla iseenesest tahtmatult masendavad.

Kas suudate sotsiaalse võrdluse kaudu kedagi positiivselt motiveerida? Võite küll, kuid liiga sageli näitavad uuringud ka seda, et selline sotsiaalne võrdlus viib inimesed end varasemast halvemini tundma. Seda tuleb teha peenelt hoolikalt - millest enamik tüüpilisi rakenduste arendajaid aru ei saa.

Tähtsate asjade väljajätmine

Iga rakendus või teenus on ainult nii hea, kui kraam, mille ta soovib mõõta. Võite oma tulemustesse viia tahtlikult või tahtmatult kallutatust selle järgi, mida otsustate mõõta - ja mitte mõõta.

Mõelge sellele niimoodi: mõtlete kolida uude linna, kus oleks vähem vihma, nii et vaatate ainult erinevate linnade aasta keskmist vihmasummat. Otsiksite üles nagu Miami linna ja mõtleksite: "Tead, ma ei koli Miamisse - neid sajab aastas ligi 62 tolli! Võrrelge seda Seattle'i vähese 37-tollise vihmaga. Seattle peab olema päikselisem ja vähem vihmane koht. " Kuna te ei lisanud mõõtmisse muid olulisi mõõdikuid, valiksite liiga piiratud teabe põhjal vale.

See, mida rakenduse või veebisaidi arendaja peab millegi mõõtmisel oluliseks, ei pruugi tegelikult olla nii oluline kui see, mille nad välja jätsid. Kujutage ette rakendust, mis mõõtis ainult teie reaktsiooni ravimitele, kuid jättis välja kõik muud olulised tegurid, mis mõjutavad teie meeleolu ja ravi.

Ravi ei toimu vaakumis koos teie ja ühe ravimiga. See toimub rikkalikus ja keerulises ökosüsteemis, mis võib sisaldada ravimeid, kuid sisaldab ka palju muud olulist, mida teete enda taastumiseks. See võib olla see, kui palju te treenite või ei mäletse, või päevad, mil möödute ilma paanikahooguta või stressist pereliikme või töö pärast.

Lühidalt öeldes on hulgaliselt asju, mida rakendused ja muud heatahtlikud teenused peaksid jälgima, kuid mitte. Ja see annab moonutatud vaatenurga sellest, kuidas mõõdetav on seotud meeleolu või taastumisega. Ravimid on paljude inimeste ravimisel tõepoolest olulised, kuid see ei pruugi - ja sageli pole - kõige olulisem.

!-- GDPR -->