Zhodnocení kvality interpolace pomocí modulu ann.* v programu GRASS GIS 6.4.3
Nejdříve byla hodnocena kvalita interpolace u neuronové sítě natrénované z rastrových dat. Rozsah hodnot z interpolovaného rastru pro členitost 1 byl nižší než u původního rastru. Při výpočtu tedy neuronová síť neinterpolovala krajní hodnoty. Toto mohlo být způsobeno špatným rozmístěním náhodných vektorových bodů. Hodnota RMSE byla v tomto případě 0.0646. V případě členitosti 2 je zde opět vidět, že neuronová síť vynechala krajní hodnoty, v tomto případě je však rozdíl v menší, náhodné vektorové body byly pravděpodobně rozmístěny lépe. Hodnota RMSE byla 0.0427. Pro členitost 3 bylo chování sítě podobné jako v předchozích dvou případech. Hodnota RMSE byla 0.0085. Když byla porovnána procentuální hodnota RMSE podle rozsahu dat, bylo zjištěno, že neuronová síť interpolovala povrchy s RMSE lišící se pouze o 1 %.
Neuronová síť z modulu ann.*, která byla natrénována pomocí vektorových dat měla podobné chování, jako síť trénovaná z rastrových dat. Při interpolaci neuronová síť opět vynechávala krajní hodnoty. V případě členitosti 2 byla dolní hranice intervalu hodnot z nižší než u původních dat. Hodnoty RMSE byly pro členitost 1 - 0.1407, pro členitost 2 - 0.0982, pro členitost 3 - 0.0252.
Srovnání modulu ann.* s interpolačními metodami IDW a kriging
Pro srovnávání metod byly použity výsledky neuronových sítí, které byly natrénovány pomocí vektorových dat. Pro trénování sítě z rastrových dat totiž sloužil jako původní trénovací rastr ten, který byl vytvořen pomocí krigingu. Metody byly srovnávány podle hodnoty RMSE, dále z hlediska časové náročnosti a uživatelské přívětivosti.
Hodnoty RMSE rastrů vytvořených pomocí neuronových sítí byly srovnatelné s hodnotami u ostatních dvou metod (idw a krigingu), ale vždy byly mírně vyšší. Větší odchylky mohly být způsobeny přetrénováním sítě v důsledku špatně zvolených parametrů.
Časová náročnost metod byla velmi rozdílná, nejdéle trvala interpolace pomocí neuronových sítí, největší čas zabralo natrénování sítě, samotný výpočet byl velmi rychlý. Naopak kriging měl nejdelší výpočetní čas, celkově nejrychlejší metodou byla metoda IDW.
Z hlediska uživatelské přívětivosti na tom byly lépe metody IDW a kriging, pro které byla dostupná kvalitní nápověda. Naopak pro modul ann.* byla nápověda jen stručná a nedostatečná. Využití neuronových sítí pro nezkušené uživatele náročnější než použití metod IDW a kriging.
Porovnání interpolace pomocí neuronových sítí v programu GRASS GIS a R Project
Srovnávání bylo provedeno z několika hledisek. Pokud byly sítě srovnány podle RMSE, není zde patrná výraznější odlišnost. Pro členitost 1 byly hodnoty vyrovnané, kromě sítě (32, 38, 27) z programu GRASS GIS, kde došlo v důsledku nevhodného nastavení parametrů pravděpodobně k přetrénování sítě. K přetrénování této sítě došlo nejspíš i v případě členitosti 2. Hodnoty RMSE ostatních sítí si byly opět podobné, nejlépe na tom byla síť z balíčku nnet. Pro členitost 3 byly hodnoty opět vyrovnané, jenom síť (20, 25, 17) a síť z balíčku neuralnet jevily známky přetrénování. Nejlepší výsledky pro tuto členitost měla síť (32, 38, 27). Použité neuronové sítě v obou programech, které byly zvoleny jako jedny z nejvhodnějších, jsou si velmi podobné podle hodnoty RMSE. Pokud by byly použity sítě s jinými parametry, není vyloučeno, že by se hodnoty RMSE lišily více nebo méně.
Rychlost učení sítě v modulu ann.* a v balíččcích z programu R Project závisí především na počtu neuronů ve skrytých vrstvách a na členitosti vstupních dat. U neuronové sítě z modulu ann.* také záleží na vhodnosti nastavených parametrů vzhledem k vlastnostem dat. Celkově se však neuronové sítě z balíčků v R Project učí rychleji než sítě z modulu ann.*.
- autor:
- Veronika Nevtípilová
- vedoucí práce:
- Mgr. Justyna Pastwa
- kontakt na autora:
- v.nevtipilova@gmail.com
- text práce v pdf
Tato práce byla zpracována v rámci bakalářského studia na Katedře geoinformatiky přírodovědecké fakulty Univerzity Palackého v roce 2013.