Analýza dat vytíženosti železniční infrastruktury

Tato webová stránka je věnována prezentaci diplomové práce, jejíž tématem je analýza dat o vytížení železniční infrastruktury z hlediska analýzy časové složky dat a kategorizace. Diplomová práce vznikla na Katedře geoinformatiky Univerzity Palackého v Olomouci ve spolupráci s organizací Správa železnic státní organizace a jejím vedoucím je
doc. Ing. Zdena Dobešová, Ph.D.

Závěr

Hlavním cílem této diplomové práce bylo provést analýzu časové složky dat vytíženosti železniční infrastruktury. Dále pak vyhodnocení dat o železniční infrastruktuře a jejich kategorizaci. Poskytnutá data za jednotlivé monitorovací body a úseky mezi nimi měla rozsah od roku 2016 do roku 2019. Data byla poskytnuta státní organizací Správa železnic.

Před samotnou praktickou částí této práce bylo nutné získat teoretický základ pro jednotlivé řešené oblasti. V první řadě šlo o legislativní rámec vývoje železnice v ČR a správce železniční dopravní cesty, které bylo nutné pochopit zejména z hlediska následné interpretace a pojmenování jednotlivých funkcí, které jsou vázány k problematice železnic v ČR. Další oblastí bylo položení teoretického základu k problematice železniční sítě v ČR, kde byl kladen důraz zejména na rozdělení železničních tratí a lokalizaci významných osobních a nákladních železničních koridorů. Teoretická část poté pokračovala průzkumem odborných publikací a článků zveřejněných na podobné téma, jako je řešené v této práci, nebo pracujících s daty o podobné povaze. Závěr teoretické části byl naplněn rešerši problematiky shlukování a časových řad, jakožto dvou metod, které jsou klíčové pro předkládanou diplomovou práci.

V rámci praktického řešení, ještě před samotnými analýzami, bylo nutné provést seznámení s daty a jejich předzpracování. Data nebyla v poskytnutém stavu vhodná pro okamžité použití a bylo nutné je upravit. Předzpracování dat proběhlo na základě požadavků daných analýzou časových řad a kategorizacemi. Data byla upravena do vhodné podoby filtrací, doplněním, odstraněním duplicit a kontingenčními tabulkami. Seznámení s daty proběhlo na základě popisu struktury a atributů dat pro jednotlivé monitorovací body a úseky mezi nimi. Dále byly vytvořeny jednoduché vizualizace formou základních mapových výstupů a grafů pro bližší pochopení situace zatížení železniční sítě v ČR.

První ze dvou provedených analýz nad poskytnutými daty byla analýza časových řad úsekových dat v časovém období 2016-2019. Analýza byla prováděna pomocí aditivního rozkladu na složky, pomocí kterých byly následně jednotlivé časové řady popisovány. Z důvodu velkého množství vstupních dat byly definovány 3 kategorie, jejíž zástupci byli poté podrobeni analýze. Byly to koridorové úseky, hraniční přechody a zajímavé úseky. Výsledek této analýzy jsou interpretace na základě vizuální analýzy grafů jednotlivých složek z rozkladu časových řad.

Druhou analýzou je kategorizace dat o železniční infrastruktuře za jednotlivé monitorovací body. Na počátku analýzy bylo definováno několik přístupů, na základě, kterých byla následně data kategorizována. Přístupy byly definovány metodami kategorizace a kombinací vstupních atributů. První metodou bylo procentuální vyjádření poměru osobní a nákladní dopravy z hlediska počtu a hmotnosti vlakových souprav. Zde šlo o relativní vyjádření bez vlivu absolutních dat. Druhou metodou byla kategorizace formou shlukování. Na základě testování a rešerše bylo vybráno hierarchické shlukování Wardovou metodou s použitím euklidovské metriky. Vstupními atributy byly roční úhrny dat o počtu nebo hmotnosti osobních a nákladních vlakových souprav a měsíční úhrny hmotnosti vlakových souprav celkem. Použití těchto dat nevykazovalo požadované výsledky, a tak bylo přistoupeno k testování dalších variant, tak, aby výsledky co nejvíce reflektovali relativní kolísání časových řad. Výsledkem této části je datová sada kategorizovaných dat, mapové výstupy všech kategorizací a intepretace s hodnocením jednotlivých shluků.

Tato práce je pilotním příkladem zpracování těchto unikátních dat o vytížení železniční infrastruktury v takovémto formátu, která byla takto uvolněna zcela poprvé. Výsledné analýzy nabízejí zajímavý pohled na situaci železniční dopravy na sítích SŽ v ČR. Kompletní pohled na variabilitu monitorovacích bodů dávají kategorizace, u kterých je v rámci práce nabídnuto hned několik variant, které jsou náležitě okomentovány. Bližší pohled na časovou variabilitu vybraných kategorií stanic ze čtyř po sobě jdoucích let, dává analýza časových řad. Zde je situace chování v rámci tohoto časového období popsána s přesností na jednotlivé měsíce v rámci čtyř let, s důrazem kladeným zejména na hlavní tranzitní koridory, hraniční přechody a dopravně zajímavé monitorovací body. Datové sady, vzniklé jako výsledek předkládané diplomové práce, budou dostupné pro další zpracování na katedře geoinformatiky, tak aby nebyla porušena dohoda s poskytovatelem původních dat. Výsledky práce budou představeny SŽ.