
U svom prethodnom postu pokušala sam da objasnim evolutivni proces Data Science-a. Budući da je reč o širokoj disciplini, s obzirom na kontekst definisanog problema, Data Science može da obuhvati nekoliko oblasti, od statistike i mašinskog učenja, do marketinga i modelovanja poslovnih procesa.
Generalno, Data Science je multidisciplinarna oblast koja uključuje kombinovanje domena (biznisa) sa statistikom i razvojem softvera. Šta to znači? U poslovnom svetu, osnovna uloga primene Data Science-a jeste izvlačenje poslovne vrednosti. Mogućnosti su beskrajne. Korišćenje prediktivne analitike za razvoj scenarija i u svrhe donošenja odluka postalo je suština strateškog planiranja. S druge strane, napredna analitika je presudna za optimizaciju operativnih delova u organizaciji. Ali, kako se sve to realizuje?
Prvi korak u nauci o podacima je definisanje poslovnog problema koji treba rešiti. Na primer, poslovni problem može se definisati preko nekih merljivih ključnih pokazatelja poslovanja – KPI-eva. KPI, na primer, može biti niska stopa konverzije, velika stopa churn-a ili visoki operativni troškovi. Postoje metodologije koje objašnjavaju šta znači definisati poslovni problem, ali ukratko – osim identifikacije samog problema, ovaj korak uključuje i širu definiciju – u smislu svih izvora podataka i KPI-eva koji opisuju problem i treba ih uključiti u analizu. Važno je odgovoriti i na glavna pitanja – zašto taj problem treba rešiti i koji su glavni benefiti? Jedna od najčešćih grešaka koju menadžeri čine je da uhvate neku modernu reč o kojoj svi pričaju (i koju u većini slučajeva ne razumeju u potpunosti) i veruju da je to čarobni štapić koji bi mogao da reši svaki problem. Ono što je važno jeste da se spreči „l’art pour l’art“ način objektifikacije.
Rešenje poslovnog problema krije se među podacima. Često se kaže – podaci pričaju priču. Treba samo kopati dovoljno duboko, a odgovori će biti otkriveni. Međutim, u stvarnosti – to nije uvek slučaj. Podaci samo odražavaju istoriju. Ona je u većini slučajeva vođena nekim prethodnim akcijama i reakcijama, koje definišu određeni skup okolnosti pod kojima se posmatra definisani problem. Statistika je tu da nam pomogne da osiguramo da imamo reprezentativan skup podataka i razumemo glavne zavisnosti između KPI-eva. Pomoću statističke analize možemo utvrditi prediktivnu moć skupa podataka i razumeti njegova ograničenja. Štaviše, statistika je srce mašinskog učenja i ključni deo napredne analitike, putem koje možemo analizirati paterne unutar podataka, modelovati istorijsko ponašanje i dobiti projekcije budućnosti.
Razvoj softvera igra važnu ulogu u Data Science-u. Menadžeri često žele rešenja koja su pouzdana, skalabilna i automatizovana – što zahteva uključivanje razvoja softvera u proces analitike. To znači da bi svi algoritmi trebalo da budu smešteni u skripte, upakovane u fancy kontejnere, i da se pozivajupreko nekih API servisa. Tu se pojavljuje jedan od najvećih problema primene Data Science-a u poslovanju – menadžeri smatraju da je za Data Science dovoljan samo jedan čovek, dok bi to trebalo da bude zadatak čitavog tima, uključujući pojedince sa različitim setom komplementarnih veština, od poslovnih i soft veština, preko programiranja i informatike, do matematike i statistike. Drugo pitanje je što mnogo organizacija pati od nedostatka tzv. “data literacy”, bez definisane strategije podataka i procene i lošeg (ili bez ikakvog) iskustva sa digitalizacijom i transformacijom poslovanja. Ovo su glavni preduslovi uspešne primene Data Science-a u poslovanju.
Kada se radi ispravno, primene napredne analitike u poslovnom kontekstu su mnogobrojne. Od prediktivne analitike, pa sve do “šta-ako” scenarija i procesa data mining-a i optimizacije. Od maloprodaje, bankarstva, osiguranja, do nafte i gasa, vazduhoplovstva, telekomunikacija, …
Sve što možete da mislite – može biti plodno tlo za naprednu analitiku. Ideja je jednostavna – podaci pričaju priču. Priča koja može dati odgovore na pitanja poput:
- kako povećati zadovoljstvo korisnika / poboljšati iskustvo kupca?
- kako maksimizovati ROI (povrat investicije)?
- kako optimiziovati CAPEX (kapitalna ulaganja)?
- šta se može učiniti da bi se povećale performanse?
- zašto je stopa churn-a tako visoka?
Ova lista je samo kratak pregled pitanja koje menadžeri često postavljaju. Međutim, napredna analitika i postojeće metode nisu svemoguće, a ne može se na svako pitanje odgovoriti samo pukom analizom uzoraka podataka, ali jedno je sigurno – „svi su modeli pogrešni, neki su samo korisni“, i to je ono što u ovoj beskonačnoj igri opstanka u biznisu važno – da tražite korisne modele i primenite ih, kako biste podstakli rast i unapredili svoje poslovanje.
U sledećem postu govorićemo o mašinskom učenju i njegovim aplikacijama, kao i njegovoj povezanosti sa naukom o podacima i veštačkom inteligencijom. Pratite nas i dalje!
Be the first to comment