Home > Digitalizacija > Stephen Baker: Numerati; Spoznajte numerate, oni vas že poznajo!

Stephen Baker: Numerati; Spoznajte numerate, oni vas že poznajo!

Dave Morgan in njegova ekipa v podjetju Tacoda spremlja potrošnike na internetu in poskuša v njihovem obnašanju odkriti vzorce obnašanja in jih uporabiti za komercialne namene. Podjetje je bilo prodano AOL-u za 275 milijonov dolarjev.

Znanstveniki, ki se ukvarjajo z analiziranjem enormnih količin podatkov so izvrstni matematiki, računalničarji in inženirji. Delčke naših življenj lahko spremenijo v simbole. In v njihovem povezovanju iščejo vzorce in podobnosti.

Včasih je bilo oglaševanje vezano na blagovne znamke. Industrijska proizvodnja je bila vezana na segmentacijo, ki je bila zelo splošna in oglaševanje je prilagodilo sporočilo znamke tem redkim segmentom. V industrijski dobi smo postali številke. Numerate imajo za nas ambiciozne načrte. Hočejo postaviti modele, ki bodo za vsakega od nas odkrili potencialne poti obnašanja. Vse večji svet podatkov postaja ogromen laboratorij človeškega vedenja.

Raziskava je pokazala, da lahko 87% ljudi v Ameriki odkrijejo, če ti razkrijejo svoj spol, datum rojstva in poštno številko.

Delavci

Že pred časom so podjetja, predvsem japonska želela izmeriti gibanja in delo delavcev. V času digitalnosti se ta aktivnost lahko samo razvija. Današnji digitalin footprint omogoča delodajalcem, da spremljajo delovanje delavcev brez štoparic in ostalih pripomočkov.

V IBM-u je nalogo kako IBM zaposlene spremeniti v številke prevzel Samer Takriti. Specialist za stohastično analizo je skupaj z ekipo poskušal zgraditi matematične modele IBM-ovih tehničnih svetovalcev.

Pred leti sta Myron Scholes in Fischer Black uvedla revolucijo v finance z modelom za tveganje, ki je omogočil razvoj novih storitev in produktov. Pomislite, kaj lahko prinesejo matematični modeli delavcev.

Mnoge delovne naloge so v bistvu proizvodi. In če bi jih bilo mogoče konfigurirati in nenazadnje rekonfigurirati, bi lahko ljudi preprosto vstavili v tem modele funkcij. Če bo Takritiju in ekipi uspelo delovno silo IBM-a strniti v koherenten portfelj veščin, v nekaj kar lahko razume računalnik, bo lahko družba svojo delovno silo kmalu upravljala tako, kot upravlja svoje finančne instrumente. IBM je uspel z uporabo matematike optimizirati lastne nabavne verige in je tako uspeval v času proizvodov. Toda sedaj se spreminja v servisno organizacijo in zato potrebuje modele v delu z delovno silo.

V sestavljanja modela, ki bo omogočil managerjem sestavljati najbolj optimalne ekipe zbrane v celem svetu, da opravijo zahtevne naloge, se mora ekipa ukvarjati tudi s socialnimi komponentami. Tudi iz tega naslova je raziskovanje socialnih omrežij še kako pomembno. Kathleen Carley iz Carnegie Mellon univerze je ena vodilnih raziskovalk tega področja. Njene raziskave so bile uporabljene na sojenju Enronu. Analize socialnih razmerij je pokazala kako so skupine povezane, izdela se lahko stike zaposlenih, odkrijejo neformalne mreže. Raziskovalci lahko opazijo tudi vzorce v komunikaciji. Pierre Haren je ustanovitelj podjetja Ilog, ki uporablja operacijske raziskave za  prilagajanje industrijskih sistemov ali za iskanje najučinkovitejših dostavnih poti. Ilog upošteva vse omejitve in išče najbolj optimalne poti. Haren tudi v pisarniškem delu vidi model virtualnega tekočega traka, ki lahko najde najprimernejši način in osebo, da opravi določeno delo v pisarniškem ali servisnem delu.

Kupci

V industrijski dobi, ko se je razvila množična industrija in z njo potrošništvo se je deloma izgubila osebna obravnava. Le-ta se sedaj vrača s pojavom podatkov in možnostjo prilagajanja uporabniških izkušenj tudi v množičnih dejavnostih. Lojalnostne kartice so bile prvi korak, toda te so dale trgovinam le vpogled v navade kupcev. Z uvajanjem bolj detajlnih analiz in uporabo novih tehnologij, ki lahko spremljajo obnašanje uporabnikov ter ga potencialno identificirajo že na vhodu in ne le na zaključku pri blagajni, se pojavijo tudi možnosti, da se aktivnosti znotraj trgovine prilagajajo tipu kupca. Ekipa Rayida Ghanija iz Accenture Labs se ukvarja ravno s tem, iskanjem modelov obnašanja kupcev in potencialnimi aktivnostmi vezanimi na različne modele. Z uvajanjem novih modelov nakupovalnih vozičkov si želijo, da bi ti postali osebni svetovalci za nakupe, ki bi vas poznali bolje, kot vi sami sebe. Ena od priložnosti uporabe tega vozička in dviga prodaje je vodenje do artiklov na seznamu, saj naj bi v povprečju pozabili nakupiti 11% artiklov, ki smo se jih namenili kupiti.

Skozi analizo nakupovalnih navad lahko raziskovalci odkrijejo kakšen je vaš mesečni budžet, v kateri segment spadate, kakšen je vaš življenjski stil, kako zvesti se znamkam, kako delujejo na vas akcije. Trgovine se predvsem želijo znebiti zajedavcev. Izraz je skoval V. Kumar iz Univerze v Connecticutu in predstavlja tiste, ki se vozijo od trgovine do trgovine, uporabljajo kupone in popuste in ne kupijo ničesar drugega. Na drugi strani so metulji, to so tiste stranke, ki se le redko ustavijo v trgovini, zapravijo veliko in se vrnejo šele po dolgem času.

Bistvo raziskav ni natančno preučiti eno samo osebo, ampak dešifrirati vzorce človeškega vedenja. Posamezniki štejejo le toliko, da so delčki različnih »veder« – skupin, ki imajo enake potenciale ali »plemen«, to so skupine ljudi z enakimi lastnostmi.

Analitika bi rada prešla iz faze analize, kaj se je zgodilo v fazo identifikacije, zakaj se je nekaj zgodilo. Pri tem mora biti še posebej pazljiva pri razbiranju vzorcev in odklonov. Oblikovanje modelov povprečja je bilo dokaj neuspešno, zato je pomembno, da se novi modeli osredotočijo na odstopanja in jih poskusijo opredeliti in na njih ustrezno odgovoriti.

Volivci

Josh Gothbaum je ustanovil podjetje Spotlight in zbral 1,5 milijona dolarjev kapitala tveganih skladov in je verjel, da bo z mikrociljanjem na želje posameznikov pomagala demokratom v boju za oblast leta v prvem desetletju tega tisočletja. Predvsem ciljajo na neopredeljene volivce in tiste, ki so bolj nagnjeni k temu, da spremenijo svojo preferenco. Ukvarjali so se s tem, kako izračunati politično motivacijo ljudi. To je težko početje, kajti ljudje ne govorijo radi javno o svojih političnih preferencah. Zato morajo v politiki podjetja najti način, kako iz zbranih podatkov o življenju, najti taktiko, ki bo najbolj relevantno nagovarjala tiste volivce, ki imajo potencial, da na novo oblikujejo svoje mnenje. Tako so se podjetja, ki so kreirala politike, povezala s podjetji, ki so zbirala podatke. Eno takih je podjetje ChoicePoint, drugo Axciom, tretje Yankelovich, ki ima podatke o 175 milijonih potrošnikov. Spotlight je angažiral agencije, da so zbrale podatke o vrednotah in prepričanjih Američanov. Razdelili so jih v 5 skupin:

  • Večje možnosti za druge (37%) – demokrati
  • Zagovarjanja moralnost (19%) – republikanci
  • Doseganje neodvisnosti
  • Delo v skupnosti
  • Osredotočenost na družine

Zadnje tri kategorije predstavljajo tiste, ki se lahko usmerijo na eno ali drugo stran in odločajo volitve. Vse kategorije so razdelili še na dve kategoriji, tiste na katere se da hitro vplivati in na tiste, ki se težko premaknejo. Teh deset skupin, imenovanih tudi plemena z različnimi vrednotami so poimenovali kot sentimentalneže, graditelje skednjev, intuivneže in poskušali najti skupne lastnosti, da bi lahko prilagodili komunikacijo njim. Nato iščejo razlike v vrednotah znotraj skupnostih, ki bi lahko pomenile možnost za spreobrnitev političnih preferenc. Večino 40-50% razlik v vrednotah je mogoče pojasniti samo s poznavanjem življenjskega statusa in značilnosti gospodinjstva.

Resnica za numerate ni preizkus uspeha ali neuspeha. Zanje je zmaga, če najdejo boljše, hitrejše ali cenejše odgovore od dosedanjih. Google nam na primer ne nudi končnih odgovorov, vodi nas le do obetavnih spletnih strani.

Volilni štabi se vedno bolj ukvarjajo s ceno, ki jo morajo plačati, da pridobijo volilni glas. Mark Steinz, svetovalec demokratske stranke je skupaj z ekonomisti prišel do modela, ki ga imenuje simpleksni trikotnik, ki vključuje dimenzije, koliko je volivec nagnjen k demokratom ali republikancem in koliko k temu, da bo šel volit. In če je nekdo sicer bolj nagnjen k demokratom, vendar ni rečeno, da bi volil, nima ravno visokega indeksa. Druga dimenzija pogleda na volivce je ta, da se večina ukvarja s tistimi, ki imajo potencial, da imajo tendenco za tvojo stranko v višini med 55 in 75, torej je potrebno poskrbeti, da bodo volili. Ko bodo modeli še boljši, bodo lahko natančno napovedovali stanje in če bo napoved tesna, potem bodo vložki v tiste zadnje glasove, ki bodo pomenili razliko, lahko kar veliki.

Blogerji

Blogi in družabna omrežja ponujajo najnovejše podatke, dolgoletne sanje tržnikov o vpogledu skozi odprto okno v svet potrošnikov. Howard Kaushansky iz družbe Umbria pravi, da spremeni blog v matematiko. Uporabljajo pregledovalnike besedil, da lahko podjetjem ponudijo tržno inteligenco v obliki vpogleda v potrošniške reakcije na njihove produkte. Naučiti računalnike kako razumeti jezik in razmišljanje je zahtevna naloga. Nekateri bi se je radi lotili logično. Cycorp želi ne le zbrati znanje o svetu, temveč poiskati smisel v njem. Umbria pa na drugi strani še vedno verjame v statistični pristop. Predvsem išče soodvisnosti. Umbrijini znanstveniki, eden od njih je Nicholas Nikolov, ki je prišel iz IBM-a in je delal na projektu Watson, delajo na tem, da izboljšajo delovanje računalnikov na način, da jih učijo za posebne panoge, tako imenovane domene. Ne učijo jih le pomena besed, temveč jih naučiti, da razumejo tudi kontekst. Želijo si, da bi računalniki razumeli pomen v bigrami (povezava dveh besed), trigrami ali n-gramih.

Ko je Google objavil Adsense, so se pojavili splogi – pisani s strani računalnikov. Ti kazijo statistiko podjetjem kot je Umbria.

Teroristi

Ker Amerika ni bila pripravljena na teroriste tipa Osama Bin Laden in njihove globalne prisotnosti, so po 11. septembru dvignili pristojnosti NSA in se usmerili na prečesavanje digitalnih podatkov. Po 11. septembru so zapravili več kot milijardo, da so poenotili podatkovne zbirke.

Podatki o teroristih se razlikujejo od ostalih podatkov v tem, da nimajo preteklih podatkov, težko je narediti model nečesa kar je redko ali neprimerljivo. Teroristi se tudi močno trudijo zakriti svoje signale ali sledi.

NSA je največja matematična delavnica na svetu. V prvi fazi so se matematiki v NSA ukvarjali predvsem s šifriranjem in dešifriranjem. To je bila tudi njihova glavna naloga v hladni vojni. Toda časi so se začeli spreminjati. Podatki so danes velikokrat na voljo v nešifrirani obliki, toda vedno bolj morajo matematiki razumeti ljudi.

Jeff Jonas, ki je bil znanstvenik v IBM-u je verjel, da bi NSA lahko prej odkril napadalce 11. septembra, če bi uporabljal njegov ciljno usmerjen pristop za razliko od podatkovnega rudarjenja. Njegov raziskovalni sistem se imenuje NORA (non-obvious relationship awareness – zavedanje prikritih odnosov). Ta sistem stalno dela, ne prečesuje le stare podatke, temveč razišče vsakega novega, ki pride. Jeffovo podjetje SRD, njegov delež je kupila družba In-Q-Tel, veja CIE za skupno financiranje. Kasneje je celo podjetje kupil IBM.

Iskanje prevarantov v kazinoju temelji na treh vprašanjih. Ali so na seznamu prevarantov? Ali se obnašajo čudno in ali so zaslužili veliko denarja? Podobno metodo lahko uporabimo tudi pri iskanju zločincev in teroristov.

Vlada in NSA danes rabita kadre, ki so strokovnjaki na svojih področjih in za te morajo tekmovati s tehnološkimi velikani, ki imajo ogromno denarja. Včasih te velikane celo uporabijo, da naredijo delo za njih.

Ena od metod iskanja je tudi metoda grafov, kjer so ljudje vozlišča, odnosi med njimi pa robovi. In ti robovi imajo potem uteži glede njihove moči. Toda včasih se težave pojavijo pri kvaliteti podatkov. Včasih se zalomi že pri imenih. Jack Hermansen ima podjetje LAS (language analysis system), ki se ukvarja s prepoznavanjem imen. Tudi on je družbo prodal IBM-u.

Eno glavnih vprašanj zbiranja in rudarjenja podatkov za vladne in obveščevalne namene bo seveda njihova uporaba, varnost in zasebnost državljanov. Potrebovali bomo pametne politike. Jonas je razvil program ANNA, ki ga je IBM preimenoval v IBM DB2 Anonymous Resolution. Ta kodira podatke v bazi.

Bolniki

Eric Dishman, eden od direktorjev Intel-a meni, da bodo v prihodnosti senzorji zbirali prave podatke in da bo le teh dovolj, da bodo lahko ljudje veliko bolj proaktivno delovali v korist svojega zdravja. Intel je razvijal neke vrste čarobne preproge, ploščice, ki bi zaznale težo in vzorec gibanja osebe in bi podatke lahko avtomatično prenašale v zdravstvo.

Večinoma se senzorji ukvarjajo z zbiranjem zdravstvenih podatkov o jutranjih in večernih obredih, gibanju in prehranjevanju. Če temu dodamo še senzorje telesnih funkcij, bi dobili dober vpogled v stanje ljudi in bi tako lahko veliko bolje odreagirali preventivno. Morda bodo v prihodnosti vlade, zdravstvene ustanove, zavarovalnice začele bolj pritiskati na uporabo senzorjev. To bo seveda sprožilo dodatna etična vprašanja.

Verjetno naslednji korak v razvoju senzorjev bo razvoj Nano senzorjev, ki se bodo lahko uporabili tudi znotraj človeškega telesa. Dan Andersen in Steven Warren sta razvila sistem spremljanja krav v Kansasu, kjer sta jih opremila s senzorji in vzpostavila mrežo senzorjev po farmi ter pripravila kravo, tako, da lahko vanjo vstavljata različne senzorje, ki spremljajo delovanje njenega telesa.

Vsi ti senzorji bodo zbirali podatke, ki bodo pripomogli k ustvarjanju in analizi vzorcev, ki bodo lahko pokazali na razvoj določenih bolezenskih stanj. Toda s senzorji bo prišla transparentnost in vprašanja, komu lahko zaupamo svoje podatke. Prav tako pa bi potrebno preučevanje podatkov prineslo kompleksnost v naše življenje in bomo tako raje plačevali svetovalce, ki nam bodo dajali nasvete in vpoglede na podlagi naših podatkov, kot da bi jih sami raziskovali.

Ljubimci

Portal Chemistry uporablja formulo, ki jo je razvila Helen Fisher iz univerze Rutgers, za določanje ujemanja ljudi. Formule, ki jih uporabljajo različne agencije lahko temeljijo na iskanju skupnih vzorcev. Vendar ljudje vedno lažemo, ko se predstavljamo. Tako imajo agencije ponavadi še določene ankete, ki poskušajo ujeti vzorce v delovanju, ko anketiranci nimajo popolne kontrole. Helen pravi, da našo osebnost oblikujejo štirje hormoni – estrogen, testosteron, dopamin in serotonin. Dopamin so raziskovalci, optimisti, ki radi tvegajo. Serotonin so graditelji, mirni in organizirani. Testosteron so direktorji, analitični in logični. Estrogen so pogajalci, intuitivni in se dobro razumejo z drugimi.

Ko se bodo paritveni obredi preselili iz gostiln in čitalnic v elektronska omrežja, bo morda brušenje naših algoritmov postalo tako pomembno kot nasmehi, dišave in sramežljivi pogledi, ki jih je Shakespeare tako dobro poznal. Če želimo biti vidni v elektronskem omrežju (s tem se ukvarja cela industrija SEO), moramo postati razumljivi za stroje. Potrebujemo visoko uvrstitev med rezultati iskanja. Slačiti se moramo v algoritme. Ker imamo ljudje radi možnosti, bomo vedno poiskali tudi druge opcije, čeprav najdemo pravo zase.

Nathan Eagle je želel izrabiti telefone, da bi raziskal obnašanje ljudi in bolje raziskal prijateljstva in potenciale na tem področju.

Numerati

Numerati nimajo lahkega dela. Najti vzorce v nečem tako zapletenem kot je človeško obnašanje ali razmišljanje. Velikokrat se bodo zmotili, toda obenem bodo vedno boljši. Ljudje se bomo morali s tem soočiti tako, da se bomo naučili, kako nas vidijo številke. Ob tem bo pomembno koliko in kaj si bomo želeli deliti. Kot pravi tista zgodba z premalo brisačo, ki naj bi zakrila goloto. Če si zakrijemo obraz, potem zakrijemo identiteto in bo golota ostala neimenovana.

Trije miti, ki jim ne smemo verjeti so:

  • Ljudje se delijo na tiste, ki so ljudje besed in tiste, ki so ljudje številk.
  • Nadzor je v rokah numeratov. Z nami bodo storili, kar jih bo volja.
  • Ljudje, ki obvladajo številke, bodo zaslužili največ sveta.

Neal Goldman je ustanovitelj družbe Inform Technologies, ki se ukvarja z zbiranjem najrazličnejših informacij in njihovim povezovanjem. Neal ni numerat, njegovo podjetje pa jih ima kar nekaj. Med njimi sta glavna brata Einhorn.

Največji izziv v vzorčenju svet je kakovost podatkov. Če kvaliteta, predvsem vsebinska ni prava, potem so numerati le »pijanci, ki iščejo ključ pod lučjo, ne zato, ker so ga tam zgubili, temveč ker je tam najbolj svetlo.«

Leave a Reply