Kako koristiti korelaciju za predviđanje

Lideri prečesto pogrešno tumače empirijske obrasce i propuštaju prilike da se uključe u razmišljanje zasnovano na podacima. Da bi bolje iskoristili podatke, lideri treba da razumeju vrste problema kojima podaci mogu da pomognu u rešavanju, kao i razliku između onih problema koji se mogu rešiti poboljšanim predviđanjem i onih koji se mogu rešiti boljim razumevanjem uzročnosti.

 

Previše lidera ima nepotpun pristup razumevanju empirijskih obrazaca, što dovodi do skupih grešaka i pogrešnih tumačenja. Kao što smo ranije raspravljali, jedna izuzetno česta greška je tumačenje pogrešne korelacije kao uzročne. Savetovali smo bezbrojne organizacije o ovoj temi. Napisali smo istraživačke radove, članke o menadžerima, pa čak i knjigu posvećenu moći eksperimenata i alata za kauzalno zaključivanje – komplet alata koji su ekonomisti usvojili i prilagodili tokom poslednjih nekoliko decenija. Ipak, iako duboko verujemo u alate za kauzalno zaključivanje, videli smo i obrnuti problem - lidere koji zanemaruju korisne obrasce jer nisu uzročno-posledični. Istina je da postoje slučajevi kada je korelacija ne samo dovoljna, već je upravo ono što je potrebno. Greška koju lideri prave u tome što ne razumeju razliku između predviđanja i uzročnosti. Ili, preciznije, razlika između predviđanja ishoda i predviđanja kako će odluka uticati na ishod.

Zamislite menadžera koji se muči sa sledećim pitanjem: Da li treba da subvencionišem fakultetske diplome za svoje zaposlene? Ona bi mogla početi ispitivanjem odnosa između fakultetskih diploma i produktivnosti. Ipak, čak i ako vidi pozitivnu vezu između fakultetskih diploma i produktivnosti, teško je znati - bez dalje analize - da li je ova veza uzročna. Na kraju krajeva, verovatno će postojati i druge osnovne razlike između ljudi sa i bez diplome. A nuđenje subvencija za obrazovanje zaposlenima bez diplome neće ih učiniti identičnima sa ostalim zaposlenima koji već imaju diplomu. Trebao bi joj eksperiment, ili prirodni eksperiment, da bolje razume da li je ova veza uzročna.

Sada, pretpostavimo da se isti menadžer uhvatio u koštac sa malo drugačijim pitanjem: da li da zaposlim više diplomaca? Možda bi ponovo pogledao korelaciju između fakultetskih diploma i produktivnosti kako bi razmotrio da li bi angažovao produktivnije radnike prilagođavanjem zapošljavanja da bi dao veću težinu diplomi. U ovom slučaju, korelacija je korisna – jer pomaže da se predvidi ko će biti produktivan, čak i ako ne govori ništa o tome da li stepen uzrokuje produktivnost.

Suptilna, ali kritična razlika postoji između ova dva pitanja. „Da li treba da zaposlim više diplomaca?“ je problem predviđanja. „Da li treba da subvencionišem fakultetske diplome za svoje zaposlene?“ je problem uzročnog zaključivanja. U prvom, lider pokušava da proceni da li fakultetske diplome predviđaju produktivnost. Drugim rečima, da li su ljudi koji stiču fakultetske diplome dobri zaposleni? U ovom drugom, pokušava da utvrdi da li fakultetske diplome izazivaju veću produktivnost.

Ova razlika je kritična za donosioce odluka: kada se razmatra zapošljavanje radnika sa fakultetskom diplomom, menadžeru su potrebni alati za predviđanje, koji mogu da variraju od osnovnih korelacija do naprednijih algoritama za mašinsko učenje. Možda neće morati da zna da li diplome imaju uzročno-posledičan efekat (ili su, umesto toga, ljudi koji stiču fakultetske diplome takođe produktivni zaposleni). Međutim, kada razmišlja o subvencionisanju fakultetskih diploma za svoje zaposlene, razumevanje da li je stvarno fakultetsko obrazovanje ono što uzrokuje veću produktivnost trebalo bi da bude osnovno pitanje. Da bi uspešno utvrdio da li će diplome pomoći da se poboljša trenutni učinak zaposlenih, potrebni su alati za uzročno zaključivanje, kao što su eksperimenti ili prirodni eksperimenti, koji su fokusirani na razumevanje uzročnog uticaja promene.

Ovde pružamo primere uobičajenih uzročnih zaključaka i problema sa predviđanjem. Izvlačimo ključne razlike između ove dve vrste problema i ukazujemo na različite alate koji su lideri potrebni kada se suoče sa svakim od njih.

Uobičajeni problemi uzročnog zaključivanja

Menadžeri se redovno suočavaju sa odlukama koje uključuju razmišljanje o uzročnom uticaju različitih opcija. Da li će angažovanje konsultanata poboljšati produktivnost naše kompanije? Da li će veće plate smanjiti promet? Hoće li oglašavanje na društvenim mrežama privući nove kupce?

Na sva ova pitanja je odgovoreno korišćenjem metoda kauzalnog zaključivanja iz društvenih nauka. Na primer, ekonomisti Ema Harington i Natalija Emanuel, u saradnji sa velikom tehnološkom kompanijom, ispitale su plate u pozivnim centrima i skladištima kompanije. Kompanija je 2019. povećala plate za skladišne radnike sa 16 dolara na sat na 18 dolara po satu. Gledajući vreme povećanja plata, istraživači su mogli da vide efekat viših plata na produktivnost. Otkrili su da je ne samo povećana produktivnost, već i da povećanje od 1 dolara smanjuje šanse da će zaposleni dati otkaz za 19%. Kako se ispostavilo, ovo povećanje plata je bilo profitabilno.

Kao drugi primer, razmotrite nedavnu analizu Breta Gordona, Florijana Zetelmajera, Nehe Bargave i Dana Čapskog koja se bavi reklamnim kampanjama koje se vode na Fejsbuku. Posmatrajući 15 reklamnih kampanja u SAD koje se sastoje od otprilike 1,6 milijardi reklamnih impresija, istraživači upoređuju procene uticaja reklama na Fejsbuku iz eksperimenata sa procenama iz neeksperimentalnih korelacija. Tim je otkrio da su neeksperimentalne korelacije između reklama i namera kupovine bile pogrešne, jer su reklame ciljane i imaju tendenciju da se prikazuju korisnicima koji su već skloni da kupe proizvod. Na primer, oglasi za deterdžente za veš će se prikazivati ljudima koji su već skloni da kupe deterdžent za veš čak i u odsustvu oglasa. Autori su zatim istraživali različite neeksperimentalne pristupe kontrolisanja karakteristika korisnika i otkrili da je korelacija ostala pogrešna uprkos kontrolama. Čak i naprednije statističke kontrole nisu eliminisale ovaj problem „pristrasnosti izbora“. To je zato što je pristrasnost izbora posebno ozbiljna u kontekstu onlajn reklama, gde su reklame u velikoj meri ciljane i gde su efekti obično mali po utisku, što znači da čak i male količine pristrasnosti mogu dovesti do veoma pogrešnih procena u celini. U tom kontekstu, eksperimenti mogu biti moćan način da se prevaziđe pristrasnost selekcije i da se identifikuje uzročni uticaj reklama.

Treći primer dolazi iz sveta finansijskih proizvoda, gde je jedan od nas (Din), sa kolegama Džeremijem Berkom, Džulijanom Džejmisonom, Katom Mihali i Džonatanom Zinmanom, vodio studiju sa kreditnom unijom u Sent Luisu. Osvrnuo se na popularni kreditni proizvod „Kredit Builder“ dizajniran da pomogne onima koji žele da uspostave kreditnu istoriju. Zaista, ako biste samo pogledali korelaciju, otkrili biste da su ljudi koji su koristili proizvod dizajniran za izgradnju kreditnih rezultata nastavili da grade kreditne rezultate! Ali pošto je kreditna unija nasumično izvršila izbor ponuda, pronašli su dosta ljudi sličnih onim uspešnim klijentima kojima taj proizvod nije bio ponuđen, takođe su sami izgradili dobre kreditne rezultate. Opet, imamo problem korelacije fakultetske diplome - ljudi koji su tip ljudi koji je žele, obično su tipovi koji su uspešni. Ako posmatramo diplomu kao proizvod, nije ih proizvod učinio uspešnima,  ali korelacija bi vas mogla navesti da mislite da jeste.

Ovo su samo tri od mnogih primera kako alati za kauzalno zaključivanje mogu da odgovore na kritična pitanja u oblastima koje se kreću od operacija preko strategije do marketinga.

Uobičajeni problemi sa predviđanjem

Ako su vaši zaposleni ili klijenti grupa koja sama bira, da li to znači da nemate sreće? Ne, činilo se da otkrivanje proizvoda za poboljšanje kreditne sposobnosti ne dovodi do povećanja rezultata, može se protumačiti kao neuspeh proizvoda, ali to nije greška u informacijama. Podsetimo se da se pokazalo da je odluka korisnika da koristi proizvod prilično predvidljiva da li će se njihov rezultat poboljšati. Ako ste banka, to su informacije koje možete koristiti. Na primer, možda ćete želeti da koristite slične informacije za procenu kreditnog rizika. Banke bi mogle biti spremnije da daju kredit pojedincima sa niskim kreditnim rezultatom koji odluče da koriste proizvod za poboljšanje kredita u poređenju sa pojedincima koji ne koriste proizvod. Razlog je jednostavan: upotreba proizvoda predviđa buduće ponašanje, iako ne uzrokuje takvo ponašanje.

Menadžeri u svim industrijama se redovno suočavaju sa odlukama koje uključuju predviđanje.

Mašinsko učenje i veštačka inteligencija su izuzetno dragoceni u ovim kontekstima. Naše sopstveno istraživanje je dokumentovalo potencijal da algoritmi dovedu do efikasnijeg procesa zapošljavanja i napredovanja u oblastima u rasponu od nastavnika do policajaca. Nedavni rad dodatno je istražio ove ideje i otkrio da algoritmi imaju potencijal da povećaju i efikasnost i pravičnost zapošljavanja. Na primer, uzmite u obzir nedavni rad ekonomista Danielle Li, Lindsei Raimond i Peter Bergman, koji ispituje vrednost korišćenja algoritma za pregled CVja – sa podacima o otprilike 90.000 prijava za posao u firmi Fortune 500 između 2016. i 2019. godine. algoritme ljudima koji donose odluke, istraživači su otkrili da su algoritmi pomogli da se identifikuju bolji kandidati u skriningu od ljudi, što je dovelo do veće verovatnoće da su kandidati angažovani. Štaviše, kada su pažljivo dizajnirani, algoritmi su doveli do kvalitetnijih kandidata i demografski raznovrsnijih kandidata. Ali, da bi stigla do toga, organizacija je morala da shvati da postoji element predviđanja u zapošljavanju i da bude jasnija o tome šta su njeni ciljevi zapošljavanja.

Kao treći primer, pretpostavimo da ste videli korelaciju između najpopularnijih kuhinja date godine u Bostonu i najpopularnijih kuhinja prethodne godine u Njujorku. Čak i ako veza nije uzročna, korelacija je vredna. Na primer, može biti pronicljivo za restorane koji žele da inoviraju svoje menije. Jedan od nas (Majk) je video ovu vrstu pitanja kako se pojavljuje u svom radu sa Yelp-om, gde je moguće pogledati skupove podataka velikih razmera da bi se odgovorilo na ovu vrstu pitanja. Ovaj rad je pomogao da se otkriju načini na koje podaci tehnoloških kompanija mogu da rasvetle evoluciju ekonomske aktivnosti. Na primer, Yelp podaci mogu pomoći da se pruži uvid u načine na koje gentrifikacija utiče na različite tipove poslovanja. Takođe može pomoći u predviđanju promena u ekonomskoj aktivnosti. U širem smislu, podaci iz tehnoloških kompanija bili su jedan važan novi izvor informacija – i sada se široko koriste za uzročno zaključivanje i probleme predviđanja.

Izbor prave mašine

„Davimo se u informacijama, ali gladujemo za mudrošću.“ Ovaj citat biologa E.O. Vilsona, obuhvata suštinu modernog poslovnog ekosistema. Svet je preplavljen podacima. A napredak u analizi podataka tokom poslednjih decenija ima potencijal da poboljša menadžerske odluke u gotovo svim sektorima i za širok spektar problema. Velika količina ekonomske i statističke literature istraživala je načine na koje je veštačka inteligencija smanjila troškove predviđanja, u okruženjima u rasponu od zapošljavanja preko ulaganja do automobila bez vozača. Paralelno, razvoj alata za kauzalno zaključivanje prepoznat je i Nobelovim nagradama za ekonomiju 2019. i 2021. godine. I jedno i drugo je važno za poslovne odluke.

Ipak, lideri prečesto pogrešno tumače empirijske obrasce i propuštaju prilike da se uključe u razmišljanje zasnovano na podacima. Da bi bolje iskoristili podatke, lideri treba da razumeju vrste problema koje podaci mogu da pomognu u rešavanju, kao i razliku između onih problema koji se mogu rešiti poboljšanim predviđanjem i onih koji se mogu rešiti boljim razumevanjem uzročnosti.