Analýza dat vytíženosti železniční infrastruktury

Tato webová stránka je věnována prezentaci diplomové práce, jejíž tématem je analýza dat o vytížení železniční infrastruktury z hlediska analýzy časové složky dat a kategorizace. Diplomová práce vznikla na Katedře geoinformatiky Univerzity Palackého v Olomouci ve spolupráci s organizací Správa železnic státní organizace a jejím vedoucím je
doc. Ing. Zdena Dobešová, Ph.D.

Výsledky

Výsledky této práce mají 3 roviny: datovou, analytickou a interpretační. První část práce byla zaměřena na získání takové podoby z poskytnutých dat, aby byla použitelná v dalších analýzách a zpracovatelné i nad rámec této diplomové práce v GIS a datamining softwarech. Dále pak na získání výsledných datových sad s výslednými kategorizacemi železničních stanic. Druhá část byla zaměřena na provedení analýzy časových řad a kategorizace tak, aby byly zohledněny dostupné metody a postupy. V poslední rovině byl kladen důraz na vhodnou interpretaci zmíněných analýz a kategorizací s ohledem na geografickou polohu železniční sítě v ČR a získané znalosti z problematiky železniční provozu.

Data

Poskytnutá data nebyla v prvotní formě příliš přehledná a vhodná pro další zpracování. Z hlediska potřeby dále data používat v rámci této diplomové práce bylo přistoupeno k jejich úpravě tak, aby byla vhodná pro vybrané analýzy. Pro kategorizace vznikly tabulky ve formátu XLSX s ročními úhrny, poskytnutých dat za rok 2016 s polohovou informací monitorovacího bodu. Souběžně s tabulkami vznikly prostorové třídy prvků, na základě opravených GPS souřadnic, ve formátu Esri geodatabase se stejnými informacemi použitelné pro prostorové analýzy. Pro analýzu časových řad byla vstupní data ponechána v úhrnech za měsíce, ale byly upraveny tak, aby jednotlivé úseky obsahovali informace o počtu vlakových souprav za jednotlivé měsíce let 2016, 2017, 2018 a 2019. Na základě seznámení se s daty vznikl z úsekových dat zjednodušený liniový model železniční sítě, ke kterému mohou být jednoduše připojeny tabulky zpracované pro analýzu časových řad a vznikne tak prostorová liniová vrstva s měsíčními údaji za 4 po sobě jdoucí roky. Na základě tvorby kategorizací vznikla třída prvků ve formátu ESRI geodatabase s pěti výslednými kategorizacemi. Všechny výsledné datové sady budou použitelné ve výuce i ke zpracování, pod podmínkou neporušení dohody o zapůjčení primárních dat a dohody o využití dat odvozených.

Časová analýza vybraných úseků

V rámci této analýzy museli být kvůli přílišnému množství úseků nejdříve definovány kategorie, které zúžili dostupné úseky na menší množství. Na základě toho vznikly analýzy dat formou dekompozice časových řad pro jednotlivé kategorie. Koridorové úseky, které obsahovali 9 úseků. Tyto úseky byly vybrány tak aby co nejlépe popisovali časový průběh počtu osobních vlakových souprav na čtyřech hlavních tranzitních koridorech v ČR. Hraniční přechody, které byly reprezentovány sedmi úseky v místech, kde hlavní tranzitní koridory protínají hranice ČR. Zde byl výběr motivován především analýzou průběhu počtu vlakových souprav, které proudí z a do ČR. Poslední kategorií byly zajímavé úseky, u kterých byl předpoklad výstředního chování z hlediska průběhu nákladní nebo osobní dopravy. Tyto kategorie byly popisovány na základě grafu měsíčních průběhů jednotlivých úseků, grafu trendu a grafu sezónní složky. Výsledkem této části jsou vypracované grafy dostupné v příloze a interpretace, které jsou dostupné v textové části. Zejména v této části je pak možné také uvažovat jako výsledek samotný postup práce. Postup byl tvořen tak, aby bylo možné jej opakovat a v případě získání dat za další roky pokračovat v analýze.

Kategorizace stanic

V rámci této části byla realizována kategorizace na základě několika kombinací vstupních atributů a dvou metod. První metodou byl procentuální poměr typu dopravy v jednotlivých bodech zájmu rozdělený po 20 % s prostřední neutrální kategorií. Jako vstup při použití této metody, která dává relativní pohled na rozložení dopravy v ČR, byly použity roční úhrny počtu a hmotnosti vlakových souprav. Druhou metodou bylo shlukování. Po testování různých metod bylo nakonec, s přihlédnutím k rešerši odborných článků, vybráno hierarchické shlukování Wardovou metodou při použití Euklidovské metriky. Shlukovány byly nejdříve roční úhrny počty osobní a nákladních vlakových souprav a poté také hmotnost. Na závěr bylo přistoupeno ke shlukování měsíčních dat, při kterém byl kladen důraz na zahrnutí relativního průběhu roční křivky hmotnosti vlakových souprav. Výsledkem této části jsou mapové výstupy každého z pěti přístupů dostupné v příloze a intepretace dostupné v textu práce.

Mapa A1 Procentuální vyjádření počtu osobních a nákladních vlakových souprav za rok (PDF)

Mapa A2 Procentuální vyjádření hmotnosti osobních a nákladních vlakových souprav za rok (PDF)

Mapa B1 Počet osobních a nákladních vlakových souprav za rok (PDF)

Mapa B2 Hmotnost osobních a nákladních vlakových souprav za rok(PDF)

Mapa C1 Hmotnost osobních a nákladních vlakových souprav za měsíce (PDF)