Uvod u rad s bazama podataka
Ova radionica je 1. modul programa Certified Data Scientist.
Cilj i opis modula:
Cilj ove radionice je osposobljavanje polaznika za pripremu potrebnih podataka za analizu. To znači da će na kraju modula polaznici moći kreirati tablice kakve su im potrebne kao ulazne informacije za danju analizu. Osim osnovnog upoznavanja sa select, insert i ostalim SQL naredbama niz vježbi fokusiran je na preradu i transformaciju podataka. Podaci kakvi se nalaze u bazama podataka nisu bez te dodatne obrade pogodni za analizu već ih je potrebno pripremiti. Vježbe se rade na ORACLE XE bazi podataka.
SADRŽAJ RADIONICE
1. DAN
Uvod u baze podataka i osnove dohvata podataka
Upoznavanje s osnovnim pojmovima
• ER modeliranje
• Spajanje i klijenti za bazu podataka
Kreiranje tablica
• Dohvat podataka (select naredba)
Upoznavanje sa uvjetima u select naredbama (WHERE)
• Sortiranje podataka
Agrergiranje podataka (SUM, COUNT, …)
• Pojam transakcije
PRAKTIČNE VJEŽBE:
Kreiranje modela i pisanje različitih SELECT upita. Upoznavanje sa osnovama i konceptima upita nad bazama podataka. Razumijevanje alata za pisanje upita. Snalaženje sa tablicama, kolonama, pisanje WHERE uvjeta u dohvatu.
2. DAN
Obrada podataka
Vrste objekata u bazama (view, job, procedure)
• Povezivanje tablica (JOIN)
Masovno učitavanje podataka
Korištenje funkcija u upitima
• Prerada i prilagodba podataka (UPDATE)
Kreiranje novih tablica na osnovi upita (INSERT, CREATE AS SELECT…)
PRAKTIČNE VJEŽBE:
Obrada postojećih podataka i kreiranje podataka (update, delete, insert). Kopiranje dijela podataka u nove tablice, danje razrade select upita (kompliciraniji primjeri), upotreba subselect upita, korištenje najvažnijih baznih funkcija (poput onih za obrade teksta i datuma) , upoznavanje sa ostalim baznim objektima (view, …).
Koncept drugog dana je proširenje znanja od dohvata podataka do njihove obrade i početka pripreme za alate koji će podatke na kraju i koristiti.
3. DAN
Primjeri pripreme podataka za analizu
Rad s velikim tablicama
• Indexi i njihova uloga, vrste indexa
Optimizacija upita, spori upiti
Kompleksni SQL upiti i zadaci
Vježbe kroz primjere iz prakse – priprema podataka za analizu
PRAKTIČNE VJEŽBE:
Primjeri rada sa velikim tablicama tipičnim za poslovno okruženje. Fokus je na vježbama kako bi polaznici usvojili logiku korištenja SQL-a pri čemu se misli da vježbe sa nizom različitih situacija iz prakse gdje se upoznaje kako riješiti probleme upotrebom SQL jezika.
Drugim riječima, niz primjera gdje će se koristeći usvojena znanja, podaci preraditi i pripremiti u tablice za njihovu obradu u statističkim alatima.