Upoznati studente sa suvremenim konceptima koji se koriste u pohrani i analizi podataka u poslovanju i znanosti te osposobiti studente za upotrebu tih koncepata u praksi, posebice skladišta podataka.
Suvremeni koncepti upravljanja digitaliziranim podacima
Omasovljenje podataka. Nestrukturirani, polustrukturirani i strukturirani repozitoriji podataka. Upravljanje kvalitetom podataka. Organizacijski problemi vezani za pohranu i dohvaćanje podataka u repozitorijima podataka. Moć i nemoć relacijskih baza podataka. Suvremena rješenja u pohrani, dohvatu i distribuciji velikih količina podatka.
Produkcijski i analitički repozitoriji podataka u poslovanju i znanosti
Organizacija digitaliziranih podataka kroz povijest. Podaci i meta podaci. Datotečni sustav pohrane podataka (tekstualne i binarne datoteke). Organizacija podataka u datotekama (slobodna forma, formatirani zapisi – HTML, XML i dr.). Sustavi za upravljanje bazama podataka. Modeli organizacije podataka u bazama podataka (Ravni (tablični), Jedinka-veza, Hijerarhijski, Mrežni, Odnosni (relacijski), Objekti, Dimenzijski, Atribut-veza-vrijednost, Ne odnosni (ne relacijski, NeSQL), Grafički, Dokumentu orijentirani, Autonomni, Semantički, Hadopp, Kombinirani i dr.). Modeliranje baza podataka. Organizacija podataka u bazama podataka s obzirom na sustav pohrane (centralizirani sustav, distribuirani sustav, klijentsko-poslužiteljski sustav, paralelni sustav, sustav pohrane u oblaku, mobilne baze i dr.). Životni ciklus baze podataka. Baze podataka u poslovnoj praksi. Baze podatka u znanosti (baze podataka s cijelim tekstom, citatne baze podataka, bibliografske baze podataka). Uporaba znanstvenih baza podataka (Wos, Scopus, Hrvatska znanstvena bibliografija, Hrčak i dr.). Baze znanja. Organizacija podataka i znanja u Web okružju. Interakcija s bazom podataka (sučelje, jezici, pohrana, replikacija, sigurnost i tajnost, transaktivnost, migracije, instalacija, administracija, održavanje, ugađanje sustava za upravljanje, sigurnosne kopije i vraćanje izgubljenih podataka, upotreba, optimizacije upotrebe i dr.). Zanimanja vezana za podatkovne repozitorije i analizu podataka. Planiranje i dizajniranje podatkovnih repozitorija sukladno potrebama informiranja u poslovnom sustavu. Analitički potencijali podatkovnih repozitoria.
Upravljanje podacima u budućnosti (koncept velikih količina podataka – Big Data)
Koncept Big Data (direktive i parametri koji definiraju koncept). Izvori velikih količina podataka u poslovanju. Vrste podataka. Odlike podataka (voluminoznost, brz pristup podacima, raznolikost izvora podataka, varijabilnost (promjenjivost podataka tijekom vremena), istinitost – kvaliteta podataka). Računalstvo visokih performansi. Repozitoriji voluminoznih podataka (skladišta podataka, pohrana u oblaku). Tehnologije vezane uz koncept upravljanja velikim količinama podataka (Baze podataka, Računalstvo u oblaku, Poslovna inteligencija, Analiza i vizualizacija podataka, i dr.). Algoritmi obrade, analize i prikaza velikih količina podataka u stvarnom ili kratkom vremenu uz minimalno opterećenje informacijsko-komunikacijske infrastrukture. Produktivni i učeći potencijali velikih količina podataka. Statistika u funkciji obrade velikih količina podataka. Analitička dimenzija koncepta (Opisna – što se dogodilo, Dijagnostička – zašto se dogodilo, Prediktivna – što će se dogoditi, Prestkriptivna – što treba učiniti). Diferenciranje Big Data analize podataka od klasičnih analiza podataka. Planiranje i provedba Big data analitičkog procesa (ciljevi istraživanja, definiranje pitanja, definiranje strategije odgovora na pitanja, prikupljanje podataka, provođenje analize, ponavljanje istraživanja). Pravni aspekt analize velikih količina podataka. Osobni podaci i zaštita osobnih podataka.
Skladišta podataka kao repozitoriji u funkciji poslovne inteligencije i Big Data koncepta
Produkcijske i analitičke baze podataka. Strukturirani i polustrukturirani izvori podataka u funkciji poslovne analitike. Dimenzijsko modeliranje podataka. ETL proces. Spremište operativnih podataka. Poslovno skladište podataka. Tablice činjenica. Dimenzijske tablice. Struktura zvijezde. Struktura pahuljice. Višedimenzionalne podatkovne strukture (kocke). Principi formiranja: od gore prema dolje i od dolje prema gore. Izvješćivanje iz skladišta podataka. (Pravovremeni) Alati poslovne inteligencije. Analitičko izvještajni servisi. MDX Upiti. Vizualizacija podataka iz skladišta podataka.
1.5. Vrste izvođenja nastave
1. Analizirati informacijske potrebe određenog poslovnog subjekta radi dimenzioniranja podatkovnog produkcijskog i podatkovnog analitičkog repozitorija te planiranja provedbe analize podataka.
2. Modelirati dimenzijski repozitorij podataka u funkciji poslovne analize podataka.
3. Vrednovati pohradbenu i analitičku upotrebljivost raspoloživih repozitorija podataka.