Ova radionica je 1. modul programa Certified Data Scientist.

Cilj i opis modula:

Cilj ove radionice je osposobljavanje polaznika za pripremu potrebnih podataka za analizu. To znači da će na kraju modula polaznici moći kreirati tablice kakve su im potrebne kao ulazne informacije za danju analizu. Osim osnovnog upoznavanja sa select, insert i ostalim SQL naredbama niz vježbi fokusiran je na preradu i transformaciju podataka. Podaci kakvi se nalaze u bazama podataka nisu bez te dodatne obrade pogodni za analizu već ih je potrebno pripremiti. Vježbe se rade na ORACLE XE bazi podataka.

SADRŽAJ RADIONICE

1.    DAN
Uvod u baze podataka i osnove dohvata podataka

Upoznavanje s osnovnim pojmovima
•    ER modeliranje
•    Spajanje i klijenti za bazu podataka

Kreiranje tablica
•    Dohvat podataka (select naredba)

Upoznavanje sa uvjetima u select naredbama (WHERE)
•    Sortiranje podataka

Agrergiranje podataka (SUM, COUNT, …)
•    Pojam transakcije
PRAKTIČNE VJEŽBE:
Kreiranje modela i pisanje različitih SELECT upita. Upoznavanje sa osnovama i konceptima upita nad bazama podataka. Razumijevanje alata za pisanje upita. Snalaženje sa tablicama, kolonama, pisanje WHERE uvjeta u dohvatu.
 
2.    DAN
Obrada podataka

Vrste objekata u bazama  (view, job, procedure)
•    Povezivanje tablica (JOIN)

Masovno učitavanje podataka

Korištenje funkcija u upitima
•    Prerada i prilagodba podataka (UPDATE)

Kreiranje novih tablica na osnovi upita (INSERT, CREATE AS SELECT…)
PRAKTIČNE VJEŽBE:
Obrada postojećih podataka i kreiranje podataka (update, delete, insert). Kopiranje dijela podataka u nove tablice, danje razrade select upita (kompliciraniji primjeri), upotreba subselect upita, korištenje najvažnijih baznih funkcija (poput onih za obrade teksta i datuma) , upoznavanje sa ostalim baznim objektima (view, …).
Koncept drugog dana je proširenje znanja od dohvata podataka do njihove obrade i početka pripreme za alate koji će podatke na kraju i koristiti.
 
3.    DAN
Primjeri pripreme podataka za analizu

Rad s velikim tablicama
•    Indexi i njihova uloga, vrste indexa

Optimizacija upita, spori upiti

Kompleksni SQL upiti i zadaci

Vježbe kroz primjere iz prakse – priprema podataka za analizu

PRAKTIČNE VJEŽBE:
Primjeri rada sa velikim tablicama tipičnim za poslovno okruženje. Fokus je na vježbama kako bi polaznici usvojili logiku korištenja SQL-a pri čemu se misli da vježbe  sa nizom različitih situacija iz prakse gdje se upoznaje kako riješiti probleme upotrebom SQL jezika.
Drugim riječima, niz primjera gdje će se koristeći usvojena znanja, podaci preraditi i pripremiti u tablice za njihovu obradu u statističkim alatima.