Poslovna statistička analiza korištenjem programa “R”

Datum i mjesto održavanja:
Četvrtak, 26.09.2024.  -  Petak, 27.09.2024.
Zagreb
Rok za prijavu: Utorak, 24.09.2024.
 

Ova radionica je 3. modul programa Certified Data Scientist.

Opis i cilj modula:

Cilj modula je upoznavanje polaznika s programskim jezikom R – jednim od vodećih za statistiku, manipulaciju podacima, vizualizaciju, predviđanja i strojno učenje (Machine Learning). Prednosti korištenja R-a su raspoloživost velikih broja paketa koji sadrže gotove metode i funkcije za gotovo sva područja statistike i analize velikih podataka, koji se kontinuirano unapređuju i razvijaju.  Korisnici će se sa osnovama R-a, ali isto tako i nekim naprednijim metodama statističke i prediktivne analize upoznati kroz niz jednostavnih, ali ilustrativnih primjera ("Case Study") koji su dobra osnova za samostalno daljnje razvijanje i primjenu u složenijim poslovnim primjerima te ispravnu interpretaciju dobivenih rezultata.

SADRŽAJ RADIONICE

1. DAN, Uvod u "R"

08:45 - 09:00 Registracija i preuzimanje materijala
09:00 - 10:30 Uvod u R (RStudio)

  • Okolina, vrste podataka, osnovne operacije nad skupovima podataka, pregled rezultata

10:30 - 10:45 Pauza za kavu
10:45 - 12:15 Najčešće korišteni paketi: dplyr, ggplot2, openxls/xlsx

  • Instalacija paketa i korištenje paketa
  • Funkcije i definiranje vlastitih funkcija

12:15 - 13:15 Pauza za ručak
13:15 - 14:45 Učitavanje podataka (txt, xls, db, ...)

  • Osnovne operacije nad podacima i bazama podataka: import, export, connect, transformacije...

14:45 - 15:00 Pauza za kavu
15:00 - 16:30 Napredne obrade podataka (manipulacije, transformacije, pridruživanje,..)

  • paket dplyr: select, filter, summarize, join,...

Vizualizacija podataka

  • paket ggplot2: histogram, distribucije, scatter plot i sl. vizualizacije podataka

PRAKTIČNE VJEŽBE:    
Upoznavanje s razvojnom okolinom i osnovnim tipovima podataka potrebnim za rad u programskom jeziku. Pridruživanja, jednostavne naredbe i transformacije nad podacima. Uvoz i izvoz podataka, spajanje na podatkovne izvore (baze, web servisi,...), čišćenje podataka i transformacije u ispravne podatkovne tipove. Potom slijedi pregled i vježbe s naprednijim (SQL-like) manipulacijama podataka (select, join, filter, sumarizacija podataka,..) te osnovni i napredniji prikazi podataka (vizualizacija).
 

2.  DAN, Regresije i Machine Learning u R-u

09:00 - 10:30 Uvod u regresijske metode

  • Linearna i logistička regresija
  • Case Study: Primjena logističke regresije u procjeni rizika

10:30 - 10:45 Pauza za kavu
10:45 - 12:15 Uvod u strojno učenje

  • Extreme Gradient Boosting (XGBoost)

12:15 - 13:15 Pauza za ručak
13:15 - 14:45 Praktične vježbe

  • Pregled i osnove korištenja regresijskih tehnika: linearne i logističke regresije

14:45 - 15:00 Pauza za kavu
15:00 - 16:30
Uvod u strojno učenje na primjerima

  • Korištenje Extreme Gradient Boosting (XGBoost) algoritma metode koja trenutno daje vjerojatno najbolje rezultate korištenjem nadziranog klasifikacijskog strojnog učenja
 

PREDAVAČI:

Tomislav Grebenar
 

Mr. sc. Tomislav Grebenar, dipl. ing. el., diplomirani inženjer elektrotehnike, a stekao je i titulu magistra znanosti iz područja ekonomije. Trenutačno je polaznik doktorskog studija Poslovne ekonomije na Ekonomskom fakultetu u Zagrebu. Ima dugogodišnje iskustvo u upravljanju rizicima, u bankarstvu (kreditni rizik, CRM), gdje je stekao i menadžersko iskustvo, a trenutačno je zaposlen kao savjetnik u Hrvatskoj narodnoj banci. Unazad više godina sudjeluje kao predavač na međunarodnim i domaćim seminarima i edukacijama iz područja kreditnog rizika, CRM-a, SAS-a, R-a i sl. Predavač je i član ECCBSO odbora u sklopu kojeg sudjeluje u radu radnih skupina Risk Assesment i BACH u kojima sudjeluju ostale središnje banke.

Uz dobro poznavanje regulative i prakse, poznaje BI/DWH tehnologije, baze podataka, tehnike modeliranja, rejting sustave, IT/DataMining alate (R, Oracle/SQL developer, SAS,..) te ima iskustvo u razvoju DWH, prediktivnih modela, rejtinga. Sklon je i tzv. „out-of-the-box“ razmišljanju i pronalaženju efikasnih poslovnih i tehničkih rješenja. Uz istraživački duh, zanimaju ga nove tehnologije kao što su strojno i duboko učenje, te umjetna inteligencija od kojih neke razvija i primjenjuje u poslovnim rješenjima.