Data Scientist

Data Scientist, czyli jak zosta膰 badaczem danych

Zacznijmy od rzeczy podstawowej. Po co zdobywamy kompetencje? Po co si臋 uczymy? Czemu poszerzamy nasze mo偶liwo艣ci? To oczywiste, by by膰 bardziej konkurencyjnym na rynku pracy. A m贸wi膮c wprost: by zarabia膰 wi臋cej.

Bran偶a IT to jedna z najszybciej rozwijaj膮cych si臋 bran偶 zar贸wno w 艣wiatowej, jak i polskiej gospodarce. Wed艂ug publikacji „Raport p艂acowy Antal 2017”, 艣rednie miesi臋czne wynagrodzenie brutto w bran偶y IT wynios艂o 12 600 z艂 (w por贸wnaniu do 10 893 z艂 rok wcze艣niej). Najbardziej poszukiwani kandydaci w bran偶y IT to programi艣ci wszystkich specjalizacji, ale na pierwszy plan w Polsce wysuwaj膮 si臋 programi艣ci Java oraz eksperci Data Scientist, czyli badacze danych. O ile wiemy, czym zajmuj膮 si臋 programi艣ci Java, to nazwa Data Scientist brzmi tajemniczo. Po raz pierwszy informacja o takim zawodzie jak badacz danych pojawi艂a si臋 raptem sze艣膰 lat temu w 2012 roku w czasopi艣mie „Harvard Business Review”. Oczywi艣cie wyznaczanie dat nie ma tu specjalnie sensu, bo fakt, i偶 jakie艣 poj臋cie istnieje od konkretnego czasu nie znaczy, 偶e wcze艣niej ludzie nie zajmowali si臋 danym zagadnieniem. Tylko nikt po prostu go nie nazwa艂.

Data Scientist? „To nie dla mnie”

Czym w艂a艣ciwie zajmuje si臋 Data Scientist, czyli badacz danych? Si臋gnijmy – nomen omen – do danych, by odpowiedzie膰 na to pytanie. Odpowiedzi dostarczy nam Kaggle, znana na ca艂ym 艣wiecie platforma, skupiaj膮ca specjalist贸w od danych z ca艂ego 艣wiata. Ot贸偶 Kaggle przeprowadzi艂o interesuj膮ce badanie spo艂eczno艣ci analityk贸w, programist贸w i ludzi generalnie zajmuj膮cych si臋 zbiorami danych. Raport ten mia艂 na celu pokazanie kim s膮 ludzie, kt贸rzy zajmuj膮 si臋 danymi. Jakie maj膮 zainteresowania, wykszta艂cenie, z jakich narz臋dzi korzystaj膮 itp. Przy okazji polecam obejrzenie poni偶szego filmu, na kt贸rym Jeremy Howard z Kaggle wy艂uszcza zebranym konsekwencje faktu, 偶e komputery mog膮 si臋 uczy膰. Je偶eli w przysz艂o艣ci chcecie mie膰 prac臋, to bycie badaczem danych to dobra droga.

Zainteresowanych wspomnianym raportem odsy艂am do 藕r贸d艂a w Kaggle. Chc臋 jedynie zwr贸ci膰 uwag臋 na istotne zastrze偶enie poczynione przez zesp贸艂 badawczy Kaggle: badanie mia艂o posta膰 ankietow膮 (uda艂o si臋 uzyska膰 ponad 16 tysi臋cy odpowiedzi, wi臋c ca艂kiem poka藕n膮 liczb臋, zw艂aszcza w sytuacji, gdy rzecz dotyczy os贸b o konkretnych umiej臋tno艣ciach), przy czym osoba uznawana za „Data Scientist”, czyli badacza danych, zosta艂a przez Kaggle zdefiniowana jako „osoba, kt贸ra tworzy kod, aby analizowa膰 dane”. To podstawowa r贸偶nica pomi臋dzy analitykiem danych wykorzystuj膮cym gotowe narz臋dzia (aplikacje itp.) a data scientist. Badacz danych musi by膰 i analitykiem i programist膮. W tym momencie ju偶 widz臋 w oczach wielu czytaj膮cych rezygnacj臋, „programist膮? To nie dla mnie”. Mam jedn膮 pro艣b臋 – doczytajcie do ko艅ca.

Bootcamp, czyli odpowiednie szkolenie

Badacz danych (Data Scientist) to zaw贸d o bardzo szerokich kompetencjach technicznych, jak i szerokim zakresie praktycznych zastosowa艅. Badacze danych mog膮 pracowa膰 w bran偶y finansowej, gdzie analizuj膮 np. dane o transakcjach bankowych, wspomagaj膮 podejmowanie decyzji kredytowych, czy specjalizuj膮 si臋 w wyszukiwaniu nadu偶y膰 finansowych i wykrywaniu podejrzanych operacji. Badacz danych mo偶e pracowa膰 r贸wnie偶 w bran偶y marketingowej, gdzie z kolei b臋dzie zajmowa膰 si臋 np. analiz膮 zachowa艅 u偶ytkownik贸w na stronach internetowych, a w dalszej kolejno艣ci mo偶e wsp贸艂tworzy膰 systemy rekomendacyjne, albo 艣ledzi膰 w sieci opinie o marce. Zakres zada艅, kt贸re mog膮 realizowa膰 badacze danych jest bardzo szeroki. Ale przecie偶 podobnie jest z programowaniem.

Najwa偶niejsza informacja brzmi: osoby, kt贸re odebra艂y gruntowne wykszta艂cenie w nietechnicznej dziedzinie wcale nie musz膮 rezygnowa膰 z kariery w bran偶y IT. Du偶a w tym zas艂uga nowoczesnego systemu szkole艅 nazywanych bootcampami, kiedy w relatywnie kr贸tkim czasie (znacz膮co kr贸tszym ni偶 klasyczna 艣cie偶ka edukacyjna), liczonym w miesi膮cach, a nie w latach, poznajemy zar贸wno narz臋dzia, warsztat, jak i rzeczywiste realia pracy programist贸w i badaczy danych. Zatem na pytanie „czy mog臋 by膰 programist膮” mo偶na odpowiedzie膰 nieco przewrotnie: ka偶dy mo偶e biega膰, ale przecie偶 nie ka偶dy b臋dzie olimpijczykiem.

艁ukasz Kobyli艅ski - Kodo艂amacz.pl
艁ukasz Kobyli艅ski z Kodo艂amacz.pl przekonuje, 偶e programista nie musi mie膰 wykszta艂cenia technicznego (fot. kodo艂amacz.pl)

Zaw贸d programisty, a tym samym r贸wnie偶 badacza danych jest dzi艣 zdecydowanie bardziej otwarty ni偶 jeszcze kilka, kilkana艣cie lat temu. Najbardziej istotn膮 umiej臋tno艣ci膮, kt贸ra charakteryzuje dobrych programist贸w jest po prostu umiej臋tno艣膰 logicznego my艣lenia. Znane s膮 przypadki os贸b, kt贸re odebrawszy znacznie wcze艣niej zupe艂nie inne wykszta艂cenie (np. w gastronomii, czy muzyce) zosta艂y 艣wietnymi programistami. Wed艂ug bada艅 statystycznych przeprowadzonych w Stanach Zjednoczonych, statystyczny uczestnik bootcampu raczej nie przypomina „klasycznego” ucznia. To 30-latek, z ok. 7-letnim sta偶em pracy, z wykszta艂ceniem przynajmniej licencjackim i – to istotne – nigdy wcze艣niej nie pracuj膮cy jako programista.

A jak to wygl膮da u nas? Si臋gnijmy po badania przeprowadzone w Polsce. Wydzia艂 Bada艅 i Analiz Centrum Zarz膮dzania Innowacjami i Transferem Technologii Politechniki Warszawskiej przeprowadzi艂 badania dotycz膮ce os贸b zainteresowanych udzia艂em w bootcampach realizowanych w ramach projektu Kodo艂amacz.pl. Wnioski jakie mo偶na otrzyma膰 z analizy zebranych podczas badania danych s膮 jednoznaczne. Jak wyja艣nia 艁ukasz Kobyli艅ski z Kodo艂amacz.pl: –Dane pokazuj膮, 偶e 艣cie偶k臋 rozwoju zawodowego w formule bootcamp贸w wybieraj膮 nie tylko ludzie zwi膮zani z IT – a偶 42 procent uczestnik贸w to osoby spoza bran偶y.

艁ukasz Kobyli艅ski dodaje te偶, 偶e „bootcampy zyskuj膮 popularno艣膰 w艣r贸d os贸b z wykszta艂ceniem innym ni偶 艣cis艂e, ponad 1/3 uczestnik贸w naszych kurs贸w to osoby z wykszta艂ceniem humanistycznym lub innym, nietechnicznym„. Ponadto w艣r贸d wszystkich uczestnik贸w 17 procent stanowi膮 kobiety, przy czym ich liczba sukcesywnie ro艣nie.

Od ekonomii i arabistyki do badania danych

Przyk艂adem doskonale ilustruj膮cym mo偶liwo艣ci wynikaj膮ce z przebran偶owienia samego siebie jest historia Klaudii Jankowskiej, absolwentki ekonomii i arabistyki oraz studi贸w podyplomowych zwi膮zanych z pomoc膮 Humanitarn膮, prowadzonych na Uniwersytecie Warszawskim. Bardzo d艂ugo pr贸bowa艂a znale藕膰 dla siebie 艣cie偶k臋 rozwoju, kt贸ra 艂膮czy艂aby wiedz臋 z r贸偶nych kierunk贸w studi贸w i pozwala艂a wykorzystywa膰 j膮 do pomocy humanitarnej. Wybra艂a bootcamp Kodo艂amacz.pl dotycz膮cy data science, czyli w艂a艣nie badaniu danych. Dzi臋ki nowym umiej臋tno艣ciom rozpocz臋艂a prac臋 w Mi臋dzynarodowej Federacji Towarzystw Czerwonego Krzy偶a i Czerwonego P贸艂ksi臋偶yca (IFRC) w Genewie.

Klaudia Jankowska - kodo艂amacz
Klaudia Jankowska po艂膮czy艂a wiedz臋 badacza danych z wcze艣niej zdobytymi umiej臋tno艣ciami w zakresie pomocy humanitarnej (fot. kodo艂amacz.pl)

Jak przyznaje Jankowska: Nie mia艂am wcze艣niej wi臋kszego do艣wiadczenia z programowaniem, wi臋c by艂 to dla mnie skok na bardzo g艂臋bok膮 wod臋. Dzi艣 w swojej pracy monitoruj臋 dzia艂ania misji 鈥 zbieram i analizuj臋 dane dotycz膮ce beneficjent贸w, naszych dzia艂a艅, ich potrzeb i satysfakcji ze 艣wiadczonej pomocy. Bez dost臋pu do takich danych nie byliby艣my w stanie oceni膰 potrzeb a tym samym skuteczno艣ci i jako艣ci niesionej pomocy聽 dodaje Jankowska.

Data Science to coraz wa偶niejsza dziedzina w bran偶y IT. Ten obszar le偶膮cy na styku programowania i analizy danych ma coraz wi臋ksz膮 warto艣膰 dla firm, organizacji oraz ca艂ych spo艂ecze艅stw. Nic dziwnego – praca badacza danych polega na zaprz臋gni臋ciu wsp贸艂czesnych technologii programistycznych i rozwi膮za艅 infrastruktury IT do analizy potencjalnie bardzo du偶ych ilo艣ci danych i poszukiwania interesuj膮cej, nieznanej wcze艣niej wiedzy w owych danych. Dla przyk艂adu wystarczy wspomnie膰 cho膰by firmy produkuj膮ce autonomiczne pojazdy (kt贸re musz膮 analizowa膰 dane wok贸艂 siebie, aby podj膮膰 decyzj臋 o dalszej trasie), czy 艣wiat reklamy internetowej (gdzie decyzje na rynku wymiany reklam podejmuje si臋 w ci膮gu milisekund, optymalizuj膮c cele kupuj膮cego i zysk sprzedaj膮cego).