Metody a postupy zpracování
Použitá data
Pro řešení diplomové práce v souladu se zadáním byla využita data o kvalitě života vyplývající ze studie Murgaše a Klobučníka [1] a k tomu referenční studie datových novinářů Českého rozhlasu, sociologa Daniela Prokopa, agentury Median a Aspen Institutu (prezentované v příspěvku Bočka a Cibulky [2] z roku 2018). Tuto dvojici dále doplňuje vlastní hodnocení kvality života, vzniklé na podkladě první ze jmenovaných studií.
Datovou sadu indexu kvality života podle Murgaše a Klobučníka [1] se podařilo získat přímo od jejich autorů, respektive prostřednictvím vedoucího práce. Ostatní sady pak vznikly svépomocí. Procesu jejich vzniku (jakožto jednomu ze stanovených dílčích cílů) i podrobnějšímu přehledu užitých datových sad je věnován prostor v kapitole 4.
Data o příslušnosti obcí České republiky k venkovskému a městskému prostoru, vzešlá ze studie Pászta et al. [3, 4], byla ve dvou variantách aktuálnosti (rok 2010, 2019) poskytnuta jedním z autorů studie, Mgr. Vítem Pásztem, Ph.D. z katedry geoinformatiky Univerzity Palackého v Olomouci.
S datovými sadami bylo pracováno jak v neprostorové, tak i prostorové podobě vzniklé napojením záznamů příslušných sad na definiční plochy obcí České republiky (součástí RÚIAN, jehož správcem je Český úřad zeměměřický a katastrální).
Postupy zpracování (včetně použitých metod)
Úvodem byla provedena literární rešerše, v jejíž první části bylo nahlédnuto do komplexní problematiky konceptu kvality života se zřetelem na charakteristické rysy kvality života, na její geografický (prostorový) aspekt, dimenze, domény a indikátory. Podstatná část byla rovněž věnována měření kvality života a realizovaným studiím na úrovni obcí České republiky. Ve druhé části literární rešerše jsou představeny vybrané definice venkovského a městského prostoru a existující přístupy pro jejich vymezení. Následně je pojednáno o fuzzy přístupu a jeho aplikaci při vymezování uvažovaných prostorů, jakožto protipólu (alternativě) ke klasickému dichotomickému přístupu město versus venkov. Třetí, závěrečná část, rešerše je zaměřena na existující studie prostorové diferenciace kvality života ve venkovském a městském prostoru. Důležitým počinem bylo shrnutí aspektů jednotlivých rešeršovaných studií do tabelárního přehledu použitých metod, způsobu měření kvality života i způsobu definice městského a venkovského prostoru, popisovaného území, stáří (časové aktuálnosti) studií i závěrečných poznatků o diferenciaci kvality života napříč prostory. Tento přehled se stal východiskem pro stanovení našeho dalšího postupu při naplňování dílčích cílů této diplomové práce.
V následující fázi bylo realizováno zajištění, popřípadě sestavení datových sad, které se staly podkladem pro provedení příslušných analýz.
V rámci explorační neprostorové analýzy byly vypočteny základní popisné statistiky polohy a variability hlavních proměnných (agregovaných, souhrnných ukazatelů hlavních jevů). Rovněž bylo využito grafických metod (histogram, kvantil-kvantil graf) a statistických testů (Kolmogorovův–Smirnovův test, Shapirův-Wilkův test) pro ověření normality užitých datových souborů. Detailněji je vše popsáno v kapitole 5.2.
Dále byly provedeny transformace indexů kvality života za účelem sjednocení jejich rozsahů na škálu 0–10 (tj. nejhorší–nejlepší) prostřednictvím min-max normalizace (standardizace rozpětím). V případě příslušnosti k městskému a venkovskému prostoru došlo k vytvoření dvou nových (oddělených) hodnot stupňů příslušnosti v rozsahu 0–1 („0“ znamená absolutní nepříslušnost k prostoru, „1“ znamená absolutní příslušnost k prostoru). Vzniklá hodnota stupně příslušnosti k městskému prostoru je doplňkem druhé, nově vzniklé, hodnotě příslušnosti k venkovskému prostoru.
Následoval vypočet Mahalanobisovy vzdálenosti s následným stanovením prahové hodnoty, která zajistila detekci odlehlých hodnot (viz kapitola 5.4). Mahalanobisova metrika určuje vzdálenost mezi dvěma (kvantitativními) proměnnými a přitom zohledňuje jejich vzájemnou lineární závislost pomocí kovarianční matice (více viz např. Meloun, Militký [5]).
Závěr explorační analýzy patřil zkoumání vzájemných vztahů (viz kapitola 5.5). Nejprve byla věnována pozornost vztahům mezi hlavními jevy (agregovanými ukazateli), poté jsme přistoupili ke hlubšímu zkoumání vzájemných vztahů na úrovni indikátorů hlavních jevů i napříč všemi uvažovanými indikátory. K tomu byly využity korelační diagramy a Spearmanův korelační koeficient s následným sestavením korelačních matic. Právě zmíněný korelační koeficient je neparametrickým kvantifikátorem síly (těsnosti) vztahu mezi veličinami (proměnnými), u nichž nelze předpokládat normální rozdělení, případně linearitu posuzovaného vztahu.
Dlužno podotknout, zkoumání vzájemných vztahů mezi hlavními jevy (ať už v případě explorační analýzy, nebo u nadcházejících analýz) vždy probíhalo na základě předem stanovených komplementárních dvojic – ve smyslu sdružení datových sad zástupců hlavních jevů podle jejich podobné časové aktuálnosti – viz následující tabulka.
Dvojice | Zástupce hlavního jevu č. 1 (popisované období) | Zástupce hlavního jevu č. 2 (varianta aktuálnosti) |
---|---|---|
1 | Index kvality života podle Murgaše, Klobučníka (2001–2011) | Příslušnost obce k městskému, venkovskému prostoru podle Pászta a dalších (2010) |
2 | Index kvality života podle Bočka, Cibulky a dalších (2012–2017) | Příslušnost obce k městskému, venkovskému prostoru podle Pászta a dalších (2019) |
3 | Index kvality života podle Rypla (2014–2018) | Příslušnost obce k městskému, venkovskému prostoru podle Pászta a dalších (2019) |
V další fázi jsme se zabývali prostorovým vyhodnocením vztahů – a to prostorovou autokorelací (viz kapitola 6.1) a prostorově váženou korelací (kapitola 6.2). Při analýze prostorové autokorelace indexů kvality života bylo vycházeno z výpočtu lokálního Moranova I a následně sestaveného Moranova diagramu. Moranovo I kritérium je v současné době „jedním z nejpoužívanějších ukazatelů pro měření prostorové autokorelace kvantitativních dat spojitého měřítka“ (Spurná [6]). Kladná hodnota znamená pozitivní prostorovou autokorelaci, záporná hodnota pak negativní prostorovou autokorelaci. Hodnota blízká nule poukazuje na nulovou prostorovou autokorelaci. Konkrétní prostorové shluky pak byly identifikovány pomocí metody LISA.
Taktéž bylo řešeno zkoumání vztahů mezi hlavními tématy metodou prostorově vážené korelace, za použití jádrové funkce typu tricube a specifické šířky pásma. Výsledné kvantifikaci prostorového vztahu mezi indexem kvality života a stupněm příslušnosti však předcházelo rozsáhlé pozorování vlivu šířky pásma na korelační koeficient, které mělo za cíl určit finální konfiguraci výpočtu. Při volbě jádrové funkce jsme měli na zřeteli Toblerův první zákon geografie, podle kterého „vše souvisí se vším, ale blízké věci spolu souvisejí více než ty vzdálené“ (viz Tobler [7]).
Následující fáze patřila kvantifikaci významnosti indikátorů pro popis (vysvětlení) nízké, střední a vysoké úrovně kvality života, respektive kvantifikaci významnosti indikátorů pro popis venkovského, přechodného a městského prostoru, to jest prostřednictvím regresních modelů (logistické regrese, kapitola 7 a její podkapitoly). Logistickou regresi lze obecně využít v případech, kdy potřebujeme na základě určitých známých skutečností (nezávisle proměnných) odhadnout pravděpodobnost, se kterou nastane (respektive nenastane) určitý jev (dichotomická závisle proměnná). Kromě toho ji lze využít pro odhalení faktorů, které ovlivňují, zda sledovaný jev nastane, včetně posouzení míry (statistické významnosti) takovýchto faktorů na sledovaný jev. K ověření spolehlivosti vyvinutých modelů bylo využito konfusních matic a ROC křivek (jedná se o prostředky pro hodnocení a grafické znázornění chování modelu – klasifikátoru – při klasifikaci do dvou tříd).
V závěrečné fázi vznikly tři varianty typologií obcí ČR podle úrovně kvality života a příslušnosti k venkovskému (městskému) prostoru (viz kapitola 8.2), které byly vizualizovány prostřednictvím dvourozměrných barevných schémat (Bivariate colors). Tyto varianty pak byly podrobeny testům nezávislosti a vzájemně porovnány. Specifika jednotlivých typů, jež byla formulována na základě poznatků získaných z krabicového grafu (boxplotu) či grafu paralelních os, přinášíme v kapitole 8.3. Rovněž byla lokalizována místa jejich výskytu v republikovém měřítku.
Použité programy
Vznik datových sad a výpočet indexů kvality života se odehrával v prostředí tabulkového procesoru (tj. v programu Microsoft Excel, součásti kancelářského balíku Microsoft Office). Pro práci s textem a tabulkami byl využit textový procesor Microsoft Word, který je součástí téhož balíku.
Pro propojení záznamů datových sad s definičními plochami obcí a tvorbu doprovodných vizualizací (mapových kompozic) byl využit program ArcGIS Pro od společnosti Esri.
Statistické prostorové i neprostorové analýzy byly prováděny prostřednictvím programovacího jazyka R ve vývojovém prostředím RStudio, s využitím celé řady extenzí pro manipulaci s daty, výpočty a testování hypotéz, prostorovou statistiku a vizualizaci.