Osnove statistike za nematematičare
Ova radionica je 2. modul programa Certified Data Scientist.
Cilj i opis modula:
Cilj ovog modula je osobama koje matematiku i statistiku poznaju samo na osnovnoj razini pružiti uvod u statističku analizu podataka. Ovdje se misli na one čije poznavanje ovih struka je na razini srednjoškolskog obrazovanja te kraćeg (jedan ili eventualno nekoliko kolegija) tijekom fakultetskog studija ekonomije ili drugih studija.
Tijekom ovog dvodnevnog modula polaznicima će se objasniti svrha, namjena i upotrebljivost statistike u ekonomiji i drugim znanostima postupnim uvođenjem u način statističkog razmišljanja, kroz niz primjera iz svakodnevne poslovne i znanstvene prakse. S obzirom na ranije definirani cilj, od polaznika se ne očekuje određena razina predznanja osim osnovnog poznavanja matematičkih pojmova.
SADRŽAJ RADIONICE
1. DAN
Osnovno o statistici kao znanosti
• Vrste podataka, načini mjerenja i zapisa
• Organiziranje podataka za statističku analizu
Deskriptivne (opisne) metode i mjere varijabilnosti podataka
• Normalnost razdiobe
• Grafički prikaz
Vjerojatnost i distribucije vjerojatnosti
• Inferencijalna statistika
• Uzorak i uzorkovanje (sampling)
Zavisni i nezavisni uzorci
• Usporedba dvaju uzoraka
2. DAN
Rekapitulacija i ponavljanje gradiva iz prvog dana
• Pristup u analizi kvalitativnih, semikvantitativnih i kvantitativnih podataka
• Parametrijski i neparametrijski testovi
• Omjer šansi
Osjetljivost i specifičnost
• Usporedba više skupina
• Korelacija i regresija – osnovni koncepti
• Jednostavna linearna regresija
• Multipla regresija
• Ordinalna i logistička regresija
Analiza preživljenja i njena primjena u ekonomiji
• Vremenske serije
• Dizajn ispitivanja
• Izračun uzorka
Zamke u statističkoj obradi
• Programska podrška analizi i prikazu podataka
PRAKTIČNE VJEŽBE:
Svi navedeni pojmovi i koncepti analizirat će se kroz niz vježbi u softverskom paketu SPSS, korištenjem skupova podataka (datasets) koji dolaze s programom te onih koji se nalaze u vlasništvu autora modula i/ili predstavljaju standardne datasetove kojima se ilustriraju pristupi organiziranju i analizi podataka.
Na kraju drugog dana modula polaznici će moći samostalno pristupiti rješavanju jednostavnijih statističkih problema korištenjem navedenog softvera.