• Úvod
  • Data
  • Soubory
    ke stažení
  • Příprava dat a
    geokódování
  • Případové studie
  • Závěr
  • Abstract

© Vojtěch Cícha 2015
katedra Geoinformatiky
Univerzita Palackého v Olomouci

Designed by FCT

Závěr

Hlavní myšlenkou diplomové práce bylo pokusit se odkrýt informační potenciál českých veřejně dostupných dat. Rešerše aktuálního stavu ukázala, že veřejně dostupných dat s ekonomickou tematikou je mnoho a vzhledem k tomu, že podle současného trendu se množství neustále zvětšuje, roste s tím i zmiňovaný informační potenciál. Z nalezených datových sad byla vybrána databáze Registru ekonomických subjektů udržovaná Českým statistickým úřadem. Při zpracování dat takového rozsahu (více než 4 miliony záznamů) se osvědčilo databázové prostředí PostgreSQL s prostorovým rozšířením PostGIS. Ze začátku je sice náročné zvyknout si na způsob práce pomocí příkazu SQL, nicméně s rostoucími zkušenostmi začíná být využito efektivity nástrojů PostgreSQL jako jsou hromadné příkazy nebo skripty. V rámci práce bylo vytvořeno několik skriptů ve skriptovacím jazyku PHP. Všechny jsou skládány univerzálně, aby mohly být dále využity v situaci, kdy případný zájemce narazí na podobný problém.

Největší výzvou při přípravě dat bylo geokódování ekonomických subjektů. Bylo rozhodnuto nevyužít nabízených webových služeb, nýbrž pokusit se o vytvoření vlastního způsobu geokódování s přesností na ulici pomocí databáze RÚIAN. Byl navržen algoritmus, který porovnává textové řetězce adresy subjektů s názvy ulic a obcí z RÚIAN, snaží se ověřovat jedinečnost adresy podle kódu PSČ a zjištěné údaje doplňuje k tabulce subjektů. Algoritmus byl úspěšně vyzkoušen na všech datech RES, záznamů s korektně definovanou adresou se nepodařilo přesně lokalizovat 1400 z 2 636 000 možných (chybovost 0,05 %). Algoritmus sice obsahuje některé nedokonalosti, ale i tak společně s návodem na vlastní sestavení databáze RÚIAN může sloužit jako základ pro další využití na libovolných datech.

Snaha o odkrytí informačního potenciálu RES se uskutečňuje v rámci případových studií. Podařilo se hodnotit vývoj ekonomických subjektů, porovnávat obce nebo vytvořit novou klasifikaci oblastí ČR podle koncentrací ES v jejich odvětví a mnohé další.

Když už se ve společnosti daří rozšiřovat množství dostupných dat, byla by škoda současně nevyužít rostoucího informačního potenciálu. Přáním autora je tak nejen obohatit čtenáře o zjištěné informace, ale nejlépe aby nastíněné postupy a použité metody analýz sloužily jako inspirace v dalších pracích odkrývajících informační potenciál, čímž je možné docílit většího užitku práce a podílet se tak na větším množství zjištěných informací, než by vůbec šlo zahrnout zde.