Úvod
Tato diplomová práce se zabývá tématem českých veřejně dostupných dat. Zaměřuje se konkrétně na oblast ekonomiky. Nejdříve provádí průzkum aktuální situace, prochází běžné i méně známé zdroje a sestavuje z nich přehled. Následně se věnuje podrobněji Registru ekonomických subjektů, popisuje jeho atributy a způsob přípravy těchto dat v databázovém prostředí PostgreSQL do podoby vhodné pro analýzy. Jedním z kroků je i vlastní návrh operace geokódování, kdy jsou k prvkům přiřazovány prostorové souřadnice porovnáváním s databází RÚIAN.
Analytická část je rozdělena do tří případových studií. V první je využito potenciálu dlouhého časového rozsahu databáze RES a zkoumá se vývoj ekonomického prostředí v České republice od roku 1990 do současnosti, nejčastěji formou vizualizace kumulativních součtů aktivních ekonomických subjektů. Současně je na datech provedena analýza přežití. V druhé případové studii se práce soustředí na popis oblastí České republiky z pohledu koncentrace různých cílových skupin ekonomických subjektů. Koncentrace je stanovená pro obce v přepočtu na počet obyvatel, a opět je brán v potaz jak aktuální stav, tak minulý, nebo rozdíl mezi nimi. V poslední případové studii je provedeno vícerozměrné shlukování s cílem vytvořit nové prostorové rozdělení České republiky z pohledu ekonomických aktivit.
Cíle práce
- Odkrytí informačního potenciálu českých veřejně dostupných dat
- Rešerše současného stavu, výběr vhodné datové vrstvy
- Podrobný popis přípravy dat specifický z pohledu velké datové vrstvy
- Provedení vybraných vícerozměrných, časových a prostorových statistických analýz
- Vizualizace a interpretace výsledků