Data Science & co.

Osim ako niste poslednjih deset godina proveli zarobljeni u nekoj dubokoj pećini okruženim ničim drugim do samo mrakom – vrlo verovatno ste čuli za Data Science. Možda ste čak i pokušali da oklonite misteriju o tome šta je zapravo Data Science, i na tom putu otkrili skoro sve – i ništa zapravo. Zašto je tako teško pronaći jedinstveni odgovor na sva pitanja? To je ono što ćemo pokušati da vam demistifikujemo u seriji tekstova na temu Data Science-a koji slede. 

Data Science, ili kako je najcesće prevodjeno – nauka o podacima, je jedna široka oblast koja se bavi proučavanjem fenomena u nekom domenu, posmatrajući njihovo pojavljivanje i ponašanje. Pojava, odnosno ponašanje ovih fenomena se najbolje opisuje podacima, tako da bih ja za Data Science koristila prikladniji prevod – nauka kroz podatke. Budući da je nauka, poseduje osnovne elemente naučno-metodološkog principa, kao što su definisanje hipoteza, njihovo testiranje vršenjem eksperimenata, odbacivanje i formulisanje novih hipoteza, a sve u cilju širenja postojećeg, odnosno stvaranja novog  znanja. Pored ovoga, jako je bitno razumeti da ova nauka ukljucuje različite faze, od prikupljanja podataka, njihovog usaglašavanja i skladištenja, do same obrade, koja uključuje eksploraciju i modelovanje, koji treba da opišu neke šablone u ponašanju, i na osnovu toga generišu buduće paterne. Ovakav pristup omogućuje ne samo analizu prošlosti, već i sagledavanje budućnosti, sto je ključno za bilo koje poslovanje, kao i definisanje strateških odluka. Upravo zbog toga što nam daje odgovore na pitanja šta, gde, kada, zašto, i kako – nauka kroz podatke je postala srebrni metak za svakog menadzera kome je cilj unapređivanje poslovanja.

Evolucija Data Science-a

Napredak Data Science-a je uglavnom uslovljen napretkom softverskog inženjerstva i informacionih tehnologija. Danas imamo dovoljno procesorske moći i memorijskih kapaciteta za izvršavanje zahtevnih računskih operacija u nekom prihvatljivom vremenskom opsegu. To znači da analiza poslovanja sada više nije ograničena na ručni rad i čovekovu sposobnost da danonoćno pretura po debelim registrima papira koji prikazuju neke brojke i čuvaju odgovore na pitanja. Danas mašine mogu da nam daju odgovore u minutima, ili čak sekundama.

Kompjuterska efikasnost omogućuje upotrebu sofisticiranijih metoda analize, kao što je primena algoritama mašinskog učenja. Algoritmi mašinskog učenja imaju sposobnost da utvrde šablone koji se kriju među podacima koji opisuju neko ponašanje, i da vrate predikcije tog ponašanja u budućnosti. U konkurentskom svetu kakav je danas, pravovremene odluke su preduslov za one koji žele da ostanu u igri i napreduju, dok mogućnost dobijanja projekcija budućnosti osigurava da uvek budemo jedan korak ispred konkurencije, ali i ispred klijenta.

U svetu analitike, postoje tri osnovna tipa analize – deskriptivna, prediktivna i preskriptivna analiza. U tradicionalnim sistemima, analitika je uglavnom svedena na izveštavanje i deskriptivnu analizu. Deskriptivna analiza je dobra za objašnjavanje prošlosti i ocenu rezultata donetih odluka. Ali ne daje odgovore na to šta će se desiti. Tu dolazi na red prediktivna analiza. U prediktivnoj analizi, izvlače se projekcije budućnosti, koje pomažu u definisanju narednih akcija i donošenju nekih odluka. Preskriptivna analiza je još jedan korak dalje – izvlačenje projekcija budućnosti, uzimajući u obzir različite “šta-ako” scenarije, u posebnim kontekstima definisanim datim uslovima i ograničenjima. I to je ono što je srž Data Science-a – upotreba prediktivne i preskriptivne analize, koje su najčešće jednim imenom nazivane napredna analitika.

Još jedan veliki napredak napredne analitike je upotreba “data-lake” arhitekture umesto tzv.silosa, gde su se podaci svakog odseka čuvali u odvojenim skladištima koja nisu međusubno komunicirala. Upotreba “data-lake” arhitekture omogućuje skladištenje svih podataka na jednom mestu, putem čega kompanije mogu da koriste podatke iz različitih odseka kako bi imali celokupnu sliku poslovanja, iz svih uglova. Međutim, posedovanje tzv. “big data” skupova ne osigurava moć i dominaciju, ali može biti jako korisno kako bi se analiziralo poslovanje u različitim kontekstima, i kako bi se ukrštavanjem tih informacija utvrdila njihova međuzavisnost, kao i na koji način zastoji i problemi u jednom odseku poslovanja mogu da utiču na slabe performanse drugih odseka, itd.

Budite u toku, jer ćemo u seriji tekstova koja sledi zagrebati malo dublje u oblast Data Science-a, kao i mašinskog učenja i veštačke inteligencije.

About Valentina Đorđević 12 Articles
Valentina Djordjevic is a huge Data Science enthusiast. Graduating from the Faculty of Organizational Sciences, she faced the challenge of packing her (then irreconcilable) interests into a unique career path-cutting machine. Still, she is a real "fox" when it comes to her areas of interest, so we have no doubt that this has given her good signposts. Valentina finds motivation in challenging projects and in working with equally enthusiastic team members. She believes that working on the Data Science challenges helps her to continually grow, examine (her) boundaries, and develop her imagination. Still, she has not yet determined whether the fact that she has never solved the same problem in exactly the same way is a good or bad thing. She hopes her colleagues, or maybe someone in the community, will help her finally come up with the correct answer.

Be the first to comment

Leave a Reply

Your email address will not be published.


*