Metódy a postup spracovania
Použité metódy
Záznam histórie polohy bol získaný stiahnutím z Google účtu. Vedúci práce stiahol záznam svojej histórie polohy a autorovi ho poskytol. Študenti KGI boli požiadaní o poskytnutie záznamu svojej polohy prostredníctvom sociálnej siete. Hranica Accuracy, pod ktorou dáta nemajú príliš veľkú odchýlku a hranica pravdepodobnosti (confidence), nad ktorou sa záznam zhoduje s realitou boli určené pozorovaním bodového záznamu polohy a jeho porovnávaním so skutočnosťou. Dáta o pohybe boli vizualizované formou agregovaných bodových znakov, líniových znakov a heatmáp. Na štatistické vyhodnotenie záznamov boli použité tabuľky, grafy a boxploty. Mapové výstupy aj výsledky štatistických analýz boli slovne interpretované.
Použité dáta
Pri práci boli použité záznamy histórie polohy z Google Location, ktoré je možné stiahnuť vo formáte JSON. Bol použitý záznam polohy autor z obdobia od 2.5.2018 do 17.3.2019(s výnimkou Animovanej mapy histórie polohy autora, pre účely ktorej bol 25.4.2019 stiahnutý nový záznam), záznam polohy RNDr. Jaroslava Buriana, Ph.D. z obdobia od 24.5.2017 do 18.2.2019. Boli taktiež použité záznamy 15 študentov KGI, ktoré pochádzali z rôznych časových období, boli z nich však vybraté len záznamy z územia mesta Olomouc z obdobia od 1.1.2019 do 26.3.2019. Na konverziu dát do formátu SHP bol použitý skript read_location_data.py z GitHubu, konkrétne zo stránky Android Location Converter. Pôvodný skript však nekonvertoval do formátu SHP všetky údaje o typoch aktivity, preto bol upravený a bol vytvorený skript read_location_data_upgrade.
V mapách aktivity autora práce boli ako topografický podklad zvolené hranice štátov (NUTS 2016 z Eurostatu) a krajské mestá (pre Česko z ArcČR500 v3.3, pre Slovensko z dát zo ZB GIS voľne dostupných na stiahnutie), v prípade Poľska sídla vojvodstiev (novovytvorená bodová vrstva podľa podkladovej mapy). V mapách aktivity vedúceho práce boli ako topografický podklad zvolené hranice krajov, krajské mestá a tieňovaný reliéf z dátovej sady ArcČR500 v 3.3. V mapách aktivity študentov KGI boli topografickým podkladom železnice, cesty a tieňovaný reliéf z dátovej sady ArcČR500 v 3.3.
Použité programy
Na štruktúru záznamu histórie polohy vo formáte JSON som nahliadal prostredníctvom programu PSPad Editor. Úpravami v tomto programe boli zo stiahnutého vzoru vytvorené webové stránky práce. Skript na konverziu do formátu SHP, resp. GEOJSON bol prepísaný v programe PyScripter. Skript bol spustený pomocou príkazového riadku OSGEO4W.bat. Výber záznamov polohy použiteľných pre ďalšie analýzy a vizualizácie, rovnako ako aj niektoré analýzy a vizualizácie boli prevedené v programe ArcGIS 10.6 od spoločnosti ESRI. Pomocou tohto programu boli dáta aj publikované do ArcGIS Online. Vizualizácie pohybu v rámci Olomouca prostredníctvom líniových trajektórií boli vytvorené v softvéri V-Analytics, ver.18.20.2018. Webové mapové aplikácie boli vytvorené v prostredí ArcGIS Online pomocou nástroja WebApp Builder. Konverzie z formátu GEOJSON do formátu SHP a z formátu SHP do formátu CSV boli vykonané v programe QGIS Desktop 3.2.3. Boxploty približujúce štruktúru a komplikovanosť záznamov polohy boli vytvorené v programe RStudio. Tabuľka a grafy vyjadrujúce presnosť záznamov a početnosť jednotlivých typov aktivít boli vytvorené v programe MS Excel. Poster k bakalárskej práci bol vytvorený v programe Adobe Illustrator CC 2015.
Postup spracovania

Na začiatku bola naštudovaná odborná literatúra. Boli študované hlavne články a diplomové práce, ktoré sa venovali analýzam priestorových vzorcov pohybu osôb, dostupná dokumentácia od Google, ktorá sa venuje Google Location a niekoľko krátkych internetových článkov od ľudí, ktorí skúmali štruktúru záznamu histórie polohy vo formáte JSON.
Ďalším krokom bolo stiahnutie samotného záznamu histórie polohy vo formáte JSON. Ako jediný spôsob vizualizácie dát v tomto formáte bola nájdená aplikácia Location History Visualizer, ktorej sa podrobnejšie venujú kapitoly 3 a 4. Dáta boli konvertované pomocou skriptu read_location_data.py z GitHubu spúšťaného pomocou príkazového riadku OSGEO4W.bat , ktorý bol čiastočne rozšírený a uložený ako read_location_data_upgrade.py. skript ponúka konverziu do formátov SHP, GEOJSON a KML. Pri konverzii do formátu SHP sa ale pravdepodobnosti niektorých typov aktivity nekonvertujú správne, preto bolo potrebné záznam najprv prekonvertovať do formátu GEOJSON a záznam v tomto formáte potom v programe QGIS 3.2.3 vyexportovať ako SHP. Rovnaký postup konverzie bol následne použitý aj pri dátach vedúceho práce a študentov katedry geoinformatiky.
Po konverzii nasledovalo vyhodnotenie vzniknutej bodovej vrstvy. Presnosť dát bola vyhodnotená pozorovaním záznamov a ich porovnávaním so skutočnosťou. Ešte pri štúdiu odbornej literatúry bolo zistené, že Atribút Accuracy vyjadruje odchýlku polohy záznamu od skutočnosti (nie je však jasné, v akých jednotkách) a hodnoty pri jednotlivých typoch aktivít vyjadrujú ich pravdepodobnosť (istotu). Na základe pozorovania vlastných bodových dát bolo rozhodnuté, že sa bude pracovať s dátami, ktoré majú hodnotu Accuracy 100 a menej. Ak mala aktivita v zázname hodnotu pravdepodobnosti (confidence) 50 a viac, bola vyexportovaná ako daný typ aktivity, nakoľko pri pozorovaní sa zistilo, že keby sa pracovalo len s pravdepodobnosťou 100, záznamy by boli neúplné a keby zas bol ako aktivita zvolený každý záznam s jej pravdepodobnosťou nad 25, novovzniknuté dáta by často neodpovedali realite. Podrobnejší popis vyhodnocovania zhodnosti záznamu s realitou je uvedený v kapitole Vlastné riešenie. Pri dátach od vedúceho práce a dátach spolužiakov boli už automaticky vybrané záznamy s Accuracy väčšou alebo rovnou 100 a typ aktivity bol určený, pokiaľ mal v zázname pravdepodobnosť 50 a viac. Dáta študentov KGI boli spojené do jedného súboru, z nich boli vybrané záznamy čisto pre mesto Olomouc a z nich záznamy z času od 1.1.2019 do 26.3.2019.
Nad novovzniknutými dátami boli prevedené štatistické analýzy v programoch MS Excel a RStudio. Cieľom štatistických analýz v MS Excel bolo zistiť, aké presné sú dáta a aká je početnosť jednotlivých typov aktivity v záznamoch. Pre účely štatistických analýz v RStudio boli dáta prekonvertované do formátu CSV a záznam v tomto formáte bol následne do RStudio nahraný. Cieľom štatistických analýz v RStudio bolo zistiť, ako sa v záznamoch prekrývajú jednotlivé typy aktivity.
Následným krokom bola vizualizácia priestorových vzorcov pohybu osôb. Bola prevedená v programe ArcGIS 10.6, kde boli vytvorené heatmapy pomocou nástroja Kernel Density, V Analytics, kde boli zvizualizované trajektórie pohybu v meste Olomouc a WebApp Builder v ArcGIS Online, kde boli vytvorené mapové aplikácie. Pred nahraním do programu V-Analytics boli dáta prekonvertované do formátu CSV a čiastočne upravené.
Na záver boli interpretované výsledky štatistických analýz a kartografických vizualizácií. Interpretáciou štatistických analýz sa zistilo, ako veľmi sa hodnoty pravdepodobnosti jednotlivých typov aktivity prekrývajú a interpretáciou kartografických vizualizácií sa určilo, kde sa pohybovali autor práce, vedúci práce a študenti KGI a aké typy aktivity vykonávali. V prípade autora práce a vedúceho práce bola aj snaha porovnať výsledky kartografických vizualizácií so skutočnosťou.