RAZGOVORI PETKOM: PRIJATELJI ILI NEPRIJATELJI? Sklonost kupovini naspram analize preživljavanja

01. 06. 2019.

friday talks friends or foes propensity to purchase vs survival analysis

Industrija maloprodaje. U slavu nauke o podacima, sva se tiče podataka i prilagođenog targetiranja. Ako želite da se pohvalite time, rekli biste – imam jedinstveni, omni-kanalni, 360 i nešto, što može savršeno da modelira ponašanje kupaca, pa čak i da ode na Mars. Ono što se zaista dešava je da se bukvalno osećate izgubljeno. Postoji mnogo različitih modela, mnogo korisnih i bučnih podataka, izazova u vezi sa resursima, konkurencijom, troškovima,… Kako se nosite sa svim tim? Pa, to nije tema ovog posta, ali će se sigurno naći u budućim postovima.

Modeliranje ponašanja kupaca je težak zadatak. Navike i preferencije kupaca mogu se vremenom promeniti, uvek se zaglavite između zarade više novca i zadržavanja date baze klijenata. I morate imati na umu da ste na konkurentnom tržištu, tako da ako je vaš proizvod totalno bez veze, preskup ili loše komunicira – osuđeni ste na propast. Dakle – ne radi se samo o kupcu, već i ukupnom poslovnom procesu, uključujući nekoliko odeljenja – i sve mora biti koherentno i usklađeno kako bi se postigli najbolji rezultati. Prilično ambiciozno, zar ne? 😀

Kad god imate ambiciozne planove, uzastopna realizacija je dobar put. „Misli veliko, deluj malo“, kažu. To je ono čemu je Things Solver namenjen. Uvek delimo problem na manje probleme. Modeliranje ponašanja kupaca je složen zadatak i sa njim treba postupati pažljivo, iz različitih (recimo 360, samo da bismo bili u toku 😀) uglova i kroz nekoliko faza.

Kako biste to uokvirili, ako postavite cilj, na primer – da poboljšate korisničko iskustvo – znate odakle da počnete. Kupac je spreman da nešto plati, ako će to nešto ispuniti njegova očekivanja i zadovoljiti njegove potrebe. Kako doći do tog nečega? Nauka o podacima je tu da pomogne.

Postoji nekoliko ključnih komponenti koje treba da analizirate:

  • karakteristike (informacije o klijentima i demografija),
  • nivo aktivnosti (učestalost kupovine, recentnost i trendovi),
  • navike (u vezi sa tržišnom korpom, vremenom, potrošnjom,…),
  • preferencije (u pogledu proizvođača, prodavnica, materijala,…).

Ovo je veoma zahtevna i sveobuhvatna analiza. Uključuje različite module, od generisanja potencijalnih kupaca, ocenjivanja i segmentacije, preko procene životne vrednosti za kupce, modeliranja sklonosti i analize preživljavanja, do analize tržišne korpe i sistema preporuka. Ako znate kako da konsolidujete njihove rezultate, možete reći da ste pronašli sveti gral targetiranja po meri. Pošto je svaki od ovih modula posebna oblast istraživanja i razvoja, ima dovoljno materijala da se svakom od njih posveti ceo blog-post.

Ono o čemu ću govoriti je mali fragment slagalice, veoma atraktivan problem u modeliranju ponašanja kupaca, koji se bavi sklonošću i nivoom aktivnosti korisnika. Govoriću o dva različita pristupa koji se često pogrešno tumače kao nezavisna polja analize. To su: sklonost kupovini i analiza preživljavanja.

Sklonost kupovini

 

Ono na šta se mašinsko učenje često oslanja jeste da postoje određeni skriveni obrasci ponašanja koji se mogu identifikovati i koji pružaju duboke uvide. Identifikacija tih obrazaca ponašanja kupaca može biti prilično dragocena za upravljanje kampanjom i fokusirano targetiranje. Merenje verovatnoće da će kupac obaviti kupovinu u nekom budućem vremenskom periodu objašnjava se kao sklonost kupca za kupovinu.

Zašto je ovo važno? Pa, svaki kupac ima neke tendencije u kupovini. Ako možemo da izmerimo verovatnoću da će kupac obaviti kupovinu, možemo da formiramo našu kampanju u vezi sa tim. Targetiranje kupaca koji će sigurno doći može dovesti do troškova. Ako ne ciljate na pospane kupce, to će rezultirati iscrpljivanjem i još većim troškovima.

Analiza sklonosti kupovini uključuje analizu kupaca, transakcijskih i internih podataka. Ovo je važno, jer želimo da razumemo sve okolnosti i komponente koje utiču na odluku kupca da dođe u prodavnicu (ili poseti sajt). Važno je analizirati podatke kupaca, ako su dostupni, pošto tinejdžeri i bračni parovi mogu imati različite obrasce ponašanja. Ako je dostupno, takođe je važno pratiti ponašanje na mreži i pridružiti mu ponašanje van mreže da biste dobili potpunu sliku.

S druge strane, transakcije su riznica informacija. One mogu da pokažu kakve su navike i preferencije, bez ijedne reči kupca. Interni podaci mogu pružiti dodatne informacije o dostupnosti, zalihama, akcijama i popustima.

U ovoj analizi postoji mnogo karakteristika koje treba uključiti. Ove karakteristike treba da odražavaju navike kupaca i nivo aktivnosti. Važno je analizirati učestalost, recentnost, količinu potrošenog novca, ali je takođe važno uključiti vreme međukupovine i trend kupovine. Kada govorimo o maloprodaji, tu su i sezonske karakteristike, poput praznika i sezonskih rasprodaja.

U kompaniji Things Solver blisko sarađujemo na ovoj sveobuhvatnoj analizi, pokušavajući da rešimo sve izazove na koje smo naišli tokom celog procesa. A ima ih mnogo. Neki su tehnički, na primer kako možete da identifikujete kupca (ovo je važno ako želite da prikupite bilo kakve demografske informacije), dok su neki analitički, na primer da li treba da analizirate sve klijente odjednom, ili koliko istorije da uključite, itd. …

Modeliranje sklonosti kupaca da obave kupovinu je veoma zahtevan zadatak, ali može biti od velike pomoći. Mada, postoje neki nedostaci poput – kada će se kupovina dogoditi? Ili, ako ovaj kupac neće obaviti kupovinu u posmatranom periodu, da li će kupovati u nekom narednom periodu? I tada na scenu stupa analiza preživljavanja.

 

Analiza preživljavanja

 

Analiza preživljavanja, kao i mnogi drugi pristupi, nalazi svoje korene u medicinskim istraživanjima i biološkim studijama, i predstavlja modeliranje na relaciji vreme-događaj. Shvatate ideju, zar ne? Analiza preživljavanja se bavi procenom vremenskog perioda od akcije do datog događaja. Veličanstveno!

Iako prilično intuitivna i oštra, analiza preživljavanja je složen zadatak. I moćnija je nego što možete zamisliti. Osnovni cilj ove analize je da se proceni vreme do određenog događaja, i da se kvantitativno objasni kako ovo vreme zavisi od različitih svojstava tretmana, kupaca i drugih varijabli. Šta je događaj? Pa, u našem slučaju to je kupovina. Šta je tretman? Promocija kojom ciljamo kupca.

Zašto je ova analiza tako divna i moćna? Zato što rešava neke od glavnih nedostataka na koje smo naišli u sklonosti modeliranju kupovine. Prvo, sklonost kupovini, kao što je rečeno, daje samo verovatnoću kupovine, ali želimo da znamo kada će to biti. Drugo, u modeliranju sklonosti kupovini, postoji mnogo nepoznatih ili nedostajućih ishoda (kupac nije obavio drugu kupovinu do trenutka kada posmatramo podatke, što ne znači da to neće učiniti u budućnosti), što može predstavljati problem kada se radi o zadacima klasifikacije. Zapisi (klijenti) za koje ne znamo ishod nazivaju se cenzurisanim zapisima i analiza preživljavanja se uspešno bavi njima.

Srž ove analize su dve funkcije, funkcija preživljavanja i funkcija opasnosti.

Funkcija preživljavanja je definisana kao verovatnoća da pojedinac „preživi“ od vremena nastanka (vreme nekog okidačkog događaja) do vremena t. Vrednost funkcije preživljavanja u vremenskoj tački t odgovara delu kupaca koji još nisu doživeli događaj u toj tački. Dok se funkcija preživljavanja fokusira na verovatnoću da se događaj ne dogodi, dakle – vreme preživljavanja; funkcija opasnosti opisuje „rizik“ događaja, što je pogodnije za isključen slučaj.

Funkcija opasnosti je definisana kao verovatnoća događaja u beskonačno malom vremenskom periodu između t i t+dt, s obzirom da je pojedinac preživeo do vremena t. Drugim rečima, to je verovatnoća da će se događaj desiti u određenom vremenskom okviru. Ako sam uneo zabunu, toplo preporučujem da konsultujete Gugl, on će vam dati mnoga detaljna objašnjenja ta dva pojma.

Druga prednost ove analize je što može da modelira vreme za događaj različitih grupa koje želimo da targetiramo.  Neke napredne tehnike i prošireni parametarski i neparametarski modeli mogu proceniti vreme do događaja, dajući skup karakteristika kao što su demografska svojstva i svojstva ponašanja ili informacije o targetiranju. A može se fokusirati i na pojedinca. Ako želite da saznate više, pogledajte ovu Python biblioteku: https://lifelines.readthedocs.io/en/latest/index.html.

1+1=3

 

Moj saradnik Strahinja uvek ističe da je ključ za pronalaženje najboljeg rešenja isprobavanje hibridnog pristupa. Jednom smo imali predavanje na univerzitetu, a na slajdu prezentacije bio je napisan veliki naslov. „1+1=3“. To je bilo inspirisano timskim radom i objedinjenom snagom. To je ono što želimo da dobijemo. Hajde da kombinujemo najbolje od oba pristupa i stvorimo veću vrednost (prilično slično priči o Master algoritmu, zar ne? 🙂 ).

Kako nam ovi pristupi mogu pomoći u optimizaciji upravljanja kampanjama? Ako je prisutna verovatnoća da će kupac kupiti (sklonost kupovini), i ako imamo procenjeno vreme do tog događaja (analiza preživljavanja), lako možemo planirati vremensku oznaku i učestalost targetiranja. Ne želimo da naše kupce zatrpavamo hiljadama promocija za koje nisu zainteresovani ili ako jednostavno nemaju običaj da kupuju u datom vremenskom periodu. Ostali moduli kao što su segmentacija, sistem preporuka i CLV mogu pomoći u kreiranju kampanje po meri.

Obratite pažnju da se upravljanje kampanjom može uspešno postići ako se ovi moduli sveobuhvatno razviju. U seriji blog-postova, moje kolege i ja ćemo pokušati da objasnimo ove module detaljnije, pa ostanite sa nama! Hvala vam! 🙂