Suvremeni repozitoriji podataka

Cilj

Upoznati studente sa suvremenim konceptima koji se koriste u pohrani i analizi podataka u poslovanju i znanosti te osposobiti studente za upotrebu tih koncepata u praksi, posebice skladišta podataka.

Dodatne informacije

Suvremeni koncepti upravljanja digitaliziranim podacima
Omasovljenje podataka. Nestrukturirani, polustrukturirani i strukturirani repozitoriji podataka. Upravljanje kvalitetom podataka. Organizacijski problemi vezani za pohranu i dohvaćanje podataka u repozitorijima podataka. Moć i nemoć relacijskih baza podataka. Suvremena rješenja u pohrani, dohvatu i distribuciji velikih količina podatka.
Produkcijski i analitički repozitoriji podataka u poslovanju i znanosti
Organizacija digitaliziranih podataka kroz povijest. Podaci i meta podaci. Datotečni sustav pohrane podataka (tekstualne i binarne datoteke). Organizacija podataka u datotekama (slobodna forma, formatirani zapisi – HTML, XML i dr.). Sustavi za upravljanje bazama podataka. Modeli organizacije podataka u bazama podataka (Ravni (tablični), Jedinka-veza, Hijerarhijski, Mrežni, Odnosni (relacijski), Objekti, Dimenzijski, Atribut-veza-vrijednost, Ne odnosni (ne relacijski, NeSQL), Grafički, Dokumentu orijentirani, Autonomni, Semantički, Hadopp, Kombinirani i dr.). Modeliranje baza podataka. Organizacija podataka u bazama podataka s obzirom na sustav pohrane (centralizirani sustav, distribuirani sustav, klijentsko-poslužiteljski sustav, paralelni sustav, sustav pohrane u oblaku, mobilne baze i dr.). Životni ciklus baze podataka. Baze podataka u poslovnoj praksi. Baze podatka u znanosti (baze podataka s cijelim tekstom, citatne baze podataka, bibliografske baze podataka). Uporaba znanstvenih baza podataka (Wos, Scopus, Hrvatska znanstvena bibliografija, Hrčak i dr.). Baze znanja. Organizacija podataka i znanja u Web okružju. Interakcija s bazom podataka (sučelje, jezici, pohrana, replikacija, sigurnost i tajnost, transaktivnost, migracije, instalacija, administracija, održavanje, ugađanje sustava za upravljanje, sigurnosne kopije i vraćanje izgubljenih podataka, upotreba, optimizacije upotrebe i dr.). Zanimanja vezana za podatkovne repozitorije i analizu podataka. Planiranje i dizajniranje podatkovnih repozitorija sukladno potrebama informiranja u poslovnom sustavu. Analitički potencijali podatkovnih repozitoria.
Upravljanje podacima u budućnosti (koncept velikih količina podataka – Big Data)
Koncept Big Data (direktive i parametri koji definiraju koncept). Izvori velikih količina podataka u poslovanju. Vrste podataka. Odlike podataka (voluminoznost, brz pristup podacima, raznolikost izvora podataka, varijabilnost (promjenjivost podataka tijekom vremena), istinitost – kvaliteta podataka). Računalstvo visokih performansi. Repozitoriji voluminoznih podataka (skladišta podataka, pohrana u oblaku). Tehnologije vezane uz koncept upravljanja velikim količinama podataka (Baze podataka, Računalstvo u oblaku, Poslovna inteligencija, Analiza i vizualizacija podataka, i dr.). Algoritmi obrade, analize i prikaza velikih količina podataka u stvarnom ili kratkom vremenu uz minimalno opterećenje informacijsko-komunikacijske infrastrukture. Produktivni i učeći potencijali velikih količina podataka. Statistika u funkciji obrade velikih količina podataka. Analitička dimenzija koncepta (Opisna – što se dogodilo, Dijagnostička – zašto se dogodilo, Prediktivna – što će se dogoditi, Prestkriptivna – što treba učiniti). Diferenciranje Big Data analize podataka od klasičnih analiza podataka. Planiranje i provedba Big data analitičkog procesa (ciljevi istraživanja, definiranje pitanja, definiranje strategije odgovora na pitanja, prikupljanje podataka, provođenje analize, ponavljanje istraživanja). Pravni aspekt analize velikih količina podataka. Osobni podaci i zaštita osobnih podataka.
Skladišta podataka kao repozitoriji u funkciji poslovne inteligencije i Big Data koncepta
Produkcijske i analitičke baze podataka. Strukturirani i polustrukturirani izvori podataka u funkciji poslovne analitike. Dimenzijsko modeliranje podataka. ETL proces. Spremište operativnih podataka. Poslovno skladište podataka. Tablice činjenica. Dimenzijske tablice. Struktura zvijezde. Struktura pahuljice. Višedimenzionalne podatkovne strukture (kocke). Principi formiranja: od gore prema dolje i od dolje prema gore. Izvješćivanje iz skladišta podataka. (Pravovremeni) Alati poslovne inteligencije. Analitičko izvještajni servisi. MDX Upiti. Vizualizacija podataka iz skladišta podataka.
1.5. Vrste izvođenja nastave

Predavanja: 15
Seminari: 0
Vježbe: 15

1. Analizirati informacijske potrebe određenog poslovnog subjekta radi dimenzioniranja podatkovnog produkcijskog i podatkovnog analitičkog repozitorija te planiranja provedbe analize podataka.
2. Modelirati dimenzijski repozitorij podataka u funkciji poslovne analize podataka.
3. Vrednovati pohradbenu i analitičku upotrebljivost raspoloživih repozitorija podataka.

magnifiercrossmenuplus-circlecircle-minus linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram Skip to content