Poslovna statistička analiza korištenjem programa “R”
Ova radionica je 3. modul programa Certified Data Scientist
Opis i cilj modula:
Cilj modula 3 je upoznavanje polaznika s programskim jezikom R – trenutno jednim od vodećih za statistiku i data science. Pregršt gotovih paketa i funkcija pojednostavljuje rad U R-u pa će se tijekom modula polaznici upoznati s njih nekoliko. Prediktivne i statističke analize prezentirane su kroz „case study“ prilikom kojih će polaznici steći razumijevanje promatranog poslovnog procesa te načine predikcije primjenom više tehnika (Primjerice ponašanja klijenta – „Churn“ u telekom industriji, „Default“ u poslovanju banaka). Znanjem pokrivenim ovim modulom, polaznici će biti spremni za analizu podataka korištenjem R-a, primjenu prediktivnih modela te interpretaciju rezultata izračuna.
SADRŽAJ RADIONICE
1. DAN:
08:30 - 09:00 Registracija i preuzimanje materijala
09:00 - 10:30 Uvod u programski jezik R
• Razvoj i primjene u Big Data-i
10:30 - 10:45 Stanka za kavu
10:45 - 12:15 Najčešće korišteni paketi - CRAN
• Instalacija konzole i razvojna okolina
12:15 - 13:15 Stanka za ručak
13:15 - 14:45 Osnovni objekti i tipovi podataka
• Funkcije
14:45 - 15:00 Stanka za kavu
15:00 - 16:30 Jednostavne transformacije podataka
PRAKTIČNE VJEŽBE:
Upoznavanje s razvojnom okolinom i osnovnim tipovima podataka potrebnim za rad u programskom jeziku. Pridruživanja, jednostavne naredbe i transformacije nad podacima.
2. DAN:
09:00 - 10:30 Učitavanje podataka (txt, xls, db, ...)
• Pregled i osnovne obrade podataka
10:30 - 10:45 Stanka za kavu
10:45 - 12:15 Napredne obrade podataka (čišćenje podataka, manipulacija i join - dplry, …)
• Export podataka
12:15 - 13:15 Stanka za ručak
13:15 - 14:45 Osnove vizualizacije podataka
14:45 - 15:00 Stanka za kavu
15:00 - 16:30 Napredne vizualizacije (ggplot)
PRAKTIČNE VJEŽBE:
Drugi dan modula polaznicima daje pregled tehnika koja je moguće istraživati podatke. Rad počinje učitavanjem podataka iz raznih izvora i pregledom podataka (osnovne kontrole i obrade). Polaznici se upoznavanju s naprednim tehnikama rada u dplry paketu (jedan od vodećih paketa za data mining u R-u). Kraj cjeline čini osnove vizualizacije podataka korištenjem R-a (paket ggplot).
3. DAN:
09:00 - 10:30 Korelacije
• Case Study: Povrati od ulaganja i Value-at-Risk (Quantitative Risk Management)
10:30 - 10:45 Stanka za kavu
10:45 - 12:15 Uvod u regresijski model
• Linearna i logistička regresija
• Case Study: Primjena logističke regresije za Probability of Default
12:15 - 13:15 Stanka za ručak
13:15 - 14:45 Predviđanje primjenom vremenskih nizova
14:45 - 15:00 Stanka za kavu
15:00 - 16:30 Case Study: Primjena vremenskih nizova za predviđanje potrošnje energenta
PRAKTIČNE VJEŽBE:
Nakon uvoda u R i pripreme podataka za analizu, zadnji dan modula daje pregled osnovnih prediktivnih tehnika. Uz prethodni teoretski uvod u pojedini Case-Study, korištenjem paketa i funkcija u R-u polaznici samostalno izvršavaju prediktivne tehnike te interpretiraju rezultate predikcija.
PREDAVAČI:
Mr. sc. Tomislav Grebenar, dipl. ing. el., diplomirani inženjer elektrotehnike, a stekao je i titulu magistra znanosti iz područja ekonomije. Trenutačno je polaznik doktorskog studija Poslovne ekonomije na Ekonomskom fakultetu u Zagrebu. Ima dugogodišnje iskustvo u upravljanju rizicima, u bankarstvu (kreditni rizik, CRM), gdje je stekao i menadžersko iskustvo, a trenutačno je zaposlen kao savjetnik u Hrvatskoj narodnoj banci. Unazad više godina sudjeluje kao predavač na međunarodnim i domaćim seminarima i edukacijama iz područja kreditnog rizika, CRM-a, SAS-a, R-a i sl. Predavač je i član ECCBSO odbora u sklopu kojeg sudjeluje u radu radnih skupina Risk Assesment i BACH u kojima sudjeluju ostale središnje banke.
Uz dobro poznavanje regulative i prakse, poznaje BI/DWH tehnologije, baze podataka, tehnike modeliranja, rejting sustave, IT/DataMining alate (R, Oracle/SQL developer, SAS,..) te ima iskustvo u razvoju DWH, prediktivnih modela, rejtinga. Sklon je i tzv. „out-of-the-box“ razmišljanju i pronalaženju efikasnih poslovnih i tehničkih rješenja. Uz istraživački duh, zanimaju ga nove tehnologije kao što su strojno i duboko učenje, te umjetna inteligencija od kojih neke razvija i primjenjuje u poslovnim rješenjima.
Održane edukacije