Bliži pogled na realizaciju nauke o podacima

01. 03. 2021.

delivery 1

Prema Gartneru, samo 15% do 20% projekata nauke o podacima bude završeno. Od projekata koje se završe, izvršni direktori kažu da samo oko 8% njih generiše vrednost. Uprkos ovim činjenicama, nauka o podacima se i dalje smatra šansom za rast poslovanja. Ove činjenice su nešto što uvek stoji u pozadini svih uključenih u projekat nauke o podacima. One motivišu naučnike podataka, ali još više menadžere zadužene za realizaciju da poboljšaju svoj rad i stalno preispituju pristupe realizacije i upravljanja projektima. Šta se krije iza visoke stope neuspeha i kako to možemo promeniti?

Hajde da ispitamo tok projekta kojeg se pridržavamo u kompaniji Things Solver kada radimo na proizvodima i rešenjima za klijente koji dolaze iz različitih industrija i očekuju različite poslovne koristi od onoga što isporučimo.

Na samom početku partnerstva između klijenta i dobavljača, pošto nam se pristupa kao nekome ko može da učini da kompanija X postane vođena podacima i stoga donosi pametne i automatizovane odluke u vezi sa održavanjem ili napredovanjem u beskrajnoj igri tržišnog takmičenja, mi prvo pokušavamo da dobijemo tačne ideje o prednostima, slabostima, mogućnostima i pretnjama za klijente. Te četiri dimenzije treba ispitati i kroz poslovnu i kroz optiku nauke o podacima. Iz iskustva od pola decenije snabdevanja klijentima rešenjima problema zasnovanim na podacima, došli smo do dva obrasca partnerstva u ranoj fazi. Kompanija X (klijent) želi da obezbedimo proizvod/rešenje za nauku o podacima jer su pročitali о/saznali za pozitivan uticaj koji nauka o podacima može da ima na njihovo poslovanje ili zato što se očekuje da nauka o podacima bude poslednja nada kompanije da pronađe dodatne tokove prihoda i na taj način spasi budućnost kompanije. Slede dva uobičajena scenarija. Prvo, kompanija X apsolutno nema pojma kako će postati vođena podacima, na koje oblasti poslovanja treba da utiče promena i kako može da iskoristi naše predmete isporuke kako bi maksimizirala njihovu vrednost i poslovni uticaj. Oni samo znaju da žele da postanu kompanija vođena podacima i da budu percipirani kao takvi. Drugo, kompanija X ima prilično dobru ideju šta želi od naučnika podataka. Primetili su da su za njihovo poslovanje potrebna poboljšanja u određenoj oblasti, da mogu da stave na raspolaganje svoju stručnost u domenu za rešavanje problema i očekuje se da će naučnici podataka materijalizovati rešenje na kraju. Iako drugi scenario zvuči bolje, to ne znači da će počinjanje od prvog scenarija učiniti projekat manje uspešnim ili će na kraju propasti.

Dakle, kada klijent želi da započne putovanje kroz nauku o podacima, ali ima nejasne ideje kako, volimo da organizujemo nekoliko radionica sa poslovnim predstavnicima u različitim odeljenjima kompanije i razgovaramo i slušamo MNOGO. Na taj način možemo pomoći klijentu da smisli konture svoje buduće strategije podataka. U početku želimo da razgovaramo o sledećem:

  • Poslovna strategija
  • Portfolio kompanije
  • Poslovanje
  • Problemi na koje se nailazi (strateški i operativni)
  • Poslovni planovi i ciljevi
  • Važni KPI koje prate

Na taj način možemo identifikovati potencijalne slučajeve korišćenja na kojima ćemo raditi. Uprkos činjenici da smo obično već radili u istoj industriji i na sličnim slučajevima korišćenja, ovo je uvek savršena prilika za nas, kao dobavljača da unapredimo naše razumevanje poslovanja i da držimo korak sa trendovima u industriji.

Kada završimo sa definisanjem potencijalnih slučajeva korišćenja, volimo da razgovaramo o samim podacima. Može nam pomoći potraga za odgovorima na sledeća pitanja:

  • Koja je trenutna strategija kompanije za prikupljanje podataka i upravljanje podacima?
  • Koja infrastruktura to podržava?
  • Da li je to fleksibilno?
  • Koji su izvori podataka dostupni i u kojoj meri?
  • Kakav je kvalitet podataka (procena visokog nivoa)?
  • Da li postoji mogućnost prikupljanja dodatnih podataka (bilo da ih je dobro imati ili su parametri u vezi sa identifikovanim slučajevima korišćenja apsolutno neophodni)?

Nakon što steknemo razumevanje poslovanja i opšte razumevanje podataka, volimo da sprovodimo evaluaciju potencijalnih slučajeva korišćenja na nekoliko nivoa. Želeli bismo da naš klijent ostvari poslovni uticaj i prioritetnu procenu slučajeva korišćenja dok radimo na proceni tehničke složenosti i potrebnog truda. Ovo nam može pomoći da odvojimo slučajeve upotrebe u četiri kategorije:

  1. Brza pobeda
  2. Strateški
  3. Niska vrednost
  4. Artikli za eliminisanje

Data Science Delivery

Slučajevi korišćenja brze pobede su generalno najbolja početna opcija. Ovi slučajevi korišćenja imaju značajan poslovni uticaj, pa ih stručnjaci iz domena procenjuju kao slučajeve visokog prioriteta. Pored toga, oni ne izgledaju previše složeni i kao takvi ne zahtevaju ogroman napor u segmentu nauke o podacima. Brze pobede su relativno brzi i vidljivi dobici projekta. One mogu poslužiti kao graditelji poverenja između dobavljača i poslovnih aktera.

U datom trenutku, mi kao prodavac i kompanija X kao klijent imamo sledeće: početno razumevanje poslovanja, jasnu definiciju poslovnih problema, listu potencijalnih slučajeva korišćenja i razumevanje početnih podataka. Sledeći korak je da se definiše:

  • Na kom slučaju ćemo prvo raditi?
  • Ko je vlasnik slučaja?
  • Ko je odgovoran za blagovremenu isporuku sa naše strane (strane prodavca)?
  • Koji će domen i tehnički stručnjaci biti dodeljeni projektu sa strane klijenta?
  • Kada su interni i eksterni kontrolne tačke i rokovi u vremenskom rasporedu projekta?

Ovo je trenutak kada radimo na fazi izrade projekta. Faza utvrđivanja delokruga rada u vezi sa izabranim slučajem korišćenja treba da počne sa zahtevima za proizvod/rešenje koji dolaze sa strane poslovanja. Ovo može zvučati kao sledeće „želimo da znamo koji su glavni pokretači odliva i kako sprečiti odliv kupaca“. Faza utvrđivanja delokruga rada takođe uključuje definisanje ideje inicijalnog rešenja i obično se oslanja na naučnike za podatke. Ovo definisanje ideje inicijalnog rešenja podrazumeva izradu različitih grubih skica za moguća rešenja. Nakon toga, inženjeri podataka (i/ili naučnici podataka) pristupaju fazi pripreme i pristupačnosti podataka. Faza utvrđivanja delokruga rada treba da se završi finalizovanim obimom i odobrenim KPI (poslovnim i tehničkim) koji će se dalje pratiti.

Faza istraživanja dolazi odmah nakon faze utvrđivanja delokruga. Ova faza se bavi istraživanjem podataka, pregledom literature i rešenja, tehničkom proverom validnosti, pregledom istraživanja i opsegom i validacijom KPI-ja. Tokom istraživanja važno je da se ne izgubi fokus i da ne dođe do paralisanja mogućim pristupima za pronalaženje rešenja.

U fazi razvoja, tim radi na postavljanju okvira eksperimenata, razvoju modela i testiranju i proveri KPI-ja. Važno je reći da su i faza istraživanja i faza razvoja veoma iterativni procesi i obično traju nekoliko nedelja po iteraciji.

Konačno, u fazi implementacije fokus je na moućnosti proizvodnje rešenja i praćenju podešavanja. Na taj način smo završili ciklus isporuke i ostalo je održavanje isporučenog rešenja i dugotrajno partnerstvo.

Proces isporuke koji sam upravo opisao je nešto što pokušavamo da pratimo kad god je to moguće i razumno, ali, naravno, to ne znači da 100% projekata ima tačan tok isporuke. Pošto sam do sada radio na brojnim projektima nauke o podacima, želeo bih da ukažem na neke nalaze ili bolje rečeno naučene lekcije:

  • Ne postoji jedinstven pristup i metodologija kada se isporučuje proizvod/rešenje zasnovano na nauci o podacima;
  • Nije svaki slučaj korišćenja predodređen da bude veoma uspešan. Ponekad čak i ne tako precizni modeli daju dovoljno vrednosti, odluke koje su vođene podacima, odluke koje su dovoljno dobre i dovoljno brze;
  • Neće svaki visokoprecizan model mašinskog učenja generisati očekivanu poslovnu vrednost;
  • Ne može/treba se svaki poslovni problem rešavati nekim (kompleksnim) modelima mašinskog učenja čak i kada poslovni akteri polažu sve nade na njega. Ponekad su „jednostavna i glupa“ rešenja mnogo bolja opcija;
  • Ponekad počevši od faze razvoja rešenja za određeni problem, projekat će se odvojiti u neočekivanim različitim pravcima. Uvidi iz početnog projekta će otkriti interesantnije i/ili hitnije probleme koje treba rešiti;
  • Ponekad će poslovni akteri imati potpuno suprotne ili samo različite vizije delokruga problema i rešenja u odnosu na tim za podatke. To je trenutak kada naučnici podataka treba da uzmu u obzir sve informacije i uvide koji dolaze sa obe strane i počnu da rade na objektivno najboljoj opciji.