Data
V práci byla použita umělá data náhodně generovaná v programu R Project pomocí funkce grf. Data byla generována ve třech variantách, které simulovaly různě členitý terén. V každé variantě bylo vygenerováno 1024 bodů v pravidelné mřížce. Každý bod obsahoval souřadnici x a y a výšku z.
Programy
V této práci byly zejména použity programy GRASS GISS 6.4 a statistický open source software R Project a jeho nadstavba s grafickým uživatelským rozhraním RStudio. Interpolace byla prováděna v softwaru GRASS GIS, kde hlavními použitými moduly byly v.surf.idw a ann.* a dále v programu R Project pomocí balíčků pro neuronové sítě nnet a neuralnet. Pro kriging a IDW byly využity balíčky gstat, geoR, automap a epiR. Výpočet RMSE a dalších statistik probíhal v softwaru R Project.
Postup práce
Nejdříve bylo vytvořeno několik neuronových sítí s rozdílným počtem neuronů ve skrytých vrstvách. Poté byly natrénovány pomocí algoritmu backpropagation a otestovány na tréninkovém datasetu. Tímto testem bylo spočítání střední kvadratické chyby (RMSE). Z tohoto testu byl určen interval počtu neuronů, při kterém sítě vykazovaly nejlepší výsledky. Sítě s počtem neuronů v tomto intervalu byly znovu natrénovány na datech, která představovala různě členitý terén. Pro každou z navržených sítí byla vypočítána RMSE pro každý dataset a byla vybrána síť, která vykazovala nejmenší průměrnou RMSE na testovacích datech.
Na datasetu, který nebyl součástí výběru vhodné sítě, byla provedena interpolace pomocí metod IDW, kriging a neuronové sítě, která vyšla z předchozího testu jako nejlepší, v programech GRASS GIS a R Project. Interpolace proběhla jednou pro každou členitost povrchu. V softwaru GRASS GIS bylo vytvořeno celkem dvanáct rastrů (tři pomocí neuronové sítě natrénované na rastrových datech, šest pomocí neuronové sítě natrénované na vektorových datech a tři pomocí IDW), v softwaru R Project bylo vytvořeno dvanáct rastrů (šest pomocí neuronových sítí ze dvou balíčků, šest pomocí metod IDW a kriging).
Pro všechny výsledné interpolované povrchy byla spočítána RMSE podle vzorce
kde n je počet počet bodů, pro které je RMSE počítána, zdi je hodnota v bodě i z interpolovaného povrchu, zri je původní hodnota v tomto bodě.
Aby bylo možné vizuálně porovnávat rozdíly mezi metodami, byly od sebe odečteny výsledné rastry a získány hodnoty rozdílů mezi nimi. Vždy byl odečítán rastr vytvořený metodami IDW a kriging od rastru vytvořeného pomocí neuronových sítí. Těchto rozdílových rastrů bylo vytvořeno celkem dvacet sedm.
Srovnání probíhalo na základě grafů a tabulek s hodnotami RMSE, dále byla srovnávána časová náročnost jednotlivých metod. Porovnání zahrnovalo i celkové možnosti nastavení a práce s jednotlivými metodami v obou softwarech. Výsledně jsou srovnávány metody v programech GRASS GIS a R Project mezi sebou v rámci programu a možnosti neuronových sítí mezi oběma programy.
- autor:
- Veronika Nevtípilová
- vedoucí práce:
- Mgr. Justyna Pastwa
- kontakt na autora:
- v.nevtipilova@gmail.com
- text práce v pdf
Tato práce byla zpracována v rámci bakalářského studia na Katedře geoinformatiky přírodovědecké fakulty Univerzity Palackého v roce 2013.