Uživatelské testování a optimalizace vizualizací nejistoty prostorových dat

Postup a metody zpracování

Použité metody

Během práce nejprve došlo k sestavení znakových sad vhodných pro znázornění nejistoty. Tyto znaky byly navrženy s důrazem na intuitivní grafické provedení. Jejich návrh byl také založen na studiích, které se danou problematikou zabývaly. Především to byla práce, kterou provedl Brus (2014) a MacEachren a kol. (2012) a Berjawi a kol. (2014).

Tato práce ve vysoké míře využívá analýzu kognice, která podává informace o způsobu práce s mapou a vlivu jejího provedení na proces čtení mapy. K jejímu vyhodnocení bylo využito metod, které poskytuje současný eye-tracking software. Kromě vizuálních podob ve formě Heat Map, Scanpath a podobně, se jedná především o zpracování metrik charakterizujících lidský pohled. V této práci především doby sledování stimulu, počtu zaznamenaných fixací a délky oční trajektorie. Samotné sestavení experimentu, jeho provedení a zpracování dat bylo provedeno na základě poznatků práce Popelky (2015), který se na eye-tracking technologii specializuje a to především na její využití v oblasti kartografie. Získaná data z eye-tracking experimentu byla dále zpracována pomocí statistického softwaru, ve kterém byl proveden dvouvýběrový Wilcoxonův test. Ten slouží k rozeznání statisticky významného rozdílu mezi dvěma datovými soubory, v této práci se jednalo o skupiny respondentů s odlišným vzděláním. Tyto skupiny byla dále podrobeny analýze metodou Loci similarity a Sequence similarity. Ty porovnávají jednotlivé řetězce znaků, které odpovídají místům na stimulu, kterým respondent věnoval pozornost, a hledají mezi nimi podobnost. U první metody výsledek nezávisí na pořadí znaků v řetězci. Není tedy důležitá posloupnost míst podle toho jak byla navštívena, ale pouze zda se tak stalo či nikoliv. Druhá metoda pak vyhodnocuje i pořadí navštívení jednotlivých míst.

Kromě dat popisující kognici byly získány hodnoty vnímané vhodnosti navržených znakových sad pro potřebu znázornění nejistoty. Jejich vyhodnocení proběhlo na základě statistických parametrů jako je aritmetický průměr, medián, kvartil a rozložení hodnot.

Použitá data

Většina dat, která tato práce využívá, byla sestavena nebo naměřena v rámci jejího zpracování. Výjimku tvoří pouze návrhy plošných znakových sad použitých v rámci dotazníkového šetření, které sestavil Brus (2014). Dále bylo využito podkladových map, které pocházely ze serveru Mapy.cz a Maps.google.com. Konkrétně se jednalo o historickou mapu z 19. století a aktuální ortofoto snímek znázorňující území České republiky.

Použité programy

K návrhu znakových sad a sestavení mapových kompozic bylo využito softwaru Corel Draw X7 a Adobe Photoshop CS5. První je především specializovaný na vektorovou grafiku a druhý na rastrovou. U plošných metod bylo nejprve nutné vytvořit náhodně vygenerovaný rastr, pro tento úkol byl použit program ArcGIS for Desktop 10.3. Ten byl dále upraven a pomocí aplikace grafických efektů na něm došlo ke znázornění nejistoty v Adobe Illustrator CS6.

Pro vytvoření dotazníku a následné získání dat bylo využito prostředí Google Forms. Jeho výhodou je snadné šíření v prostředí internetu a z toho plynoucí snadné oslovení širokého spektra respondentů.

Pro získání eye-tracking dat bylo nutné nejprve sestavit experiment, pro tento účel a následné naměření dat byl zvolen produkt společnosti SMI Experiment Center 3.6. Analýza naměřených dat byla provedena v softwaru SMI BeeGaze 3.6 a OGAMA 5. Aby bylo možné naměřená data importovat do druhého jmenováno programu, bylo nutné provést nejprve jejich konverzi do podporovaného formátu. Tento převod byl uskutečněn pomocí online nástroje Katedry geoinformatiky SMI2OGAMA. Statistické zpracování dat bylo provedeno v softwaru RSTUDIO 0.99 a Microsoft Excel 2013. Pro vizualizaci výsledků Sequence similarity byl použit online nástroj ScanGraph 0.9.

Postup zpracování

Postup zpracování lze rozdělit do dvou základních částí. V první došlo k návrhu znakových sad vhodných pro znázornění kvality prostorových dat s důrazem na intuitivnost. Tento návrh byl proveden v návaznosti na již existující studie, jednalo se především o práce Bruse (2014) a MacEachrena (2012). Znaky byly vytvořeny ve vektorové podobě v programu Corel Draw X7, to především z důvodu jejich možného použití v různých velikostech bez ztráty kvality. V další části byly následně umístěny do dotazníku vytvořeném v prostředí Google Forms. Jeho úkolem byla získat informace o jejich působení na případné budoucí uživatele. Ti jednotlivé sady hodnotili pomocí hodnot 1 až 7, kdy vyšší hodnota odpovídala větší vnímané vhodnosti pro znázornění nejistoty.

Na základě těchto informací došlo k selekci nejlépe hodnocených sad, které byly vhodně doplněny i hůře hodnocenými pro ověření výsledku. A ty byly následně umístěny do mapových kompozic. Z těchto kompozic byl sestaven eye-tracking experiment, který měl za cíl ověřit, zda tyto znaky je možné použít pro znázornění nejistoty. Hlavními sledovanými metrikami byla správnost a rychlost jejich interpretace.

Jednotlivé stimuly byly doplněny otázkami, které v sobě zahrnovaly nepřímý dotaz na míru nejistoty. Tento krok byl zvolen z důvodu, aby respondenti pouze automatizovaně nevybírali znaky s nejnižší mírou nejistoty, ale museli obsah mapy vyhodnotit a kvalitu informace zahrnout do rozhodovacího procesu.

Pro získání maximálního množství dat, které by bylo možné využít pro posouzení možného využití znaků v praxi, došlo i k sestavení map s více jevy. Ty měly odhalit případné problémy při znázornění více jevů pomocí jednoho typu znaků. Mapové kompozice využívaly dvě různé varianty provedení legendy přizpůsobené pro účel znázornění nejistoty. Cílem bylo určit, který způsob se jeví jako vhodnější.

Základ trialů s plošnými znaky tvořil rastr vytvořený v programu ArcGIS. K interpolaci byla využita metoda ordinary kriging. Jako její vstupní data byly vybrány náhodně sestavené body nesoucí informací o teplotě. Hodnoty byly určeny náhodně, ale se snahou vystihnout reálnou situaci. K tomuto kroku bylo možné přikročit proto, 12 že posuzovaným parametrem byla především míra nejistoty v jednotlivých částech rastru, nikoliv samotné hodnoty. K vytvoření zón míry nejistoty byla použita extenze ArcGIS Geostatistical Analyst. Její funkce spočívá ve vyhodnocení odmocniny z rozptylu krigingu, který charakterizuje chybu odhadu v daném bodě. Tato chyba závisí prostřednictvím variogramu na vzdálenosti mezi odhadovaným bodem a měřenými hodnotami a na jejich konfiguraci (Ježek, 2015). Tyto zóny byly využity k rozčlenění základního rastru do kategorií s odpovídající mírou obsažené nejistoty. V programu Adobe Illustrator CS6 byly graficky upraveny do podoby navržené znakové sady.

Sestavení experimentu a jeho provedení bylo realizováno v SMI Experiment Center 3.6. Celkem se ho zúčastnilo 45 osob, ale v některých případech došlo k nízké kvalitě záznamu (Tracking Ration), pro kterou byla hranice stanovena na 95 %. Proto bylo vybráno pouze 40 nejlepších, z toho 20 kartografů a 20 kartografických laiků. Tato struktura byla zvolena z důvodu možnosti vyhodnocení vlivu tohoto vzdělání na proces čtení mapy. Záznam dat byl proveden pomocí zařízení SMI RED 250 se vzorkovací frekvencí 250 Hz. Rozlišení trialů bylo 1 920 x 1 200 px.

Každý respondent byl po absolvování testování podroben druhému dotazníkovému šetření, ve kterém byly obsaženy znaky z eye-tracking experimentu s ukázkou výřezu mapy, která je obsahovala. Pokud byla znaková sada vyhotovena s různými variantami legendy, byly hodnoceny všechny provedení. Úkolem bylo opět hodnotit vnímanou vhodnost konkrétní sady pro vyjádření nejistoty, avšak již se zkušenosti s jejím použitím a také znalostí její podoby v mapě. Zde nastává významný rozdíl ve srovnání s prvním dotazníkovým šetřením, kde byly znaky umístěny na bílém podkladu, tedy v ideálním prostředí. Nedocházelo tak k jejich ovlivnění podkladem a případnému potlačení proměnného parametru znaku určujícího míru nejistoty. Dotazník byl opět vyhotoven v prostředí Google Forms.

Naměřená eye-tracking data byla následně vyexportována pomocí softwaru SMI BeeGaze. V něm by bylo možné provést i jejich vyhodnocení, ale pro tento účel byl vybrán open source program OGAMA. To především z důvodu autorovy zkušenosti s jeho použitím a také v něm obsažených funkcí, které řešení SMI nenabízí. Před importem dat bylo nutné nejprve provést jejich konverzi do formátu podporovaného programem OGAMA. Pro tento krok byl použit online nástroj OGAMA2SMI vyvíjený Katedrou geoinformatiky v Olomouci.

Vyhodnocení v programu OGAMA spočívalo především v analýze doby strávené respondenty v jednotlivých částech trialu pomocí definovaných oblastí zájmu. Dále byly pomocí statistického modulu vypočítány kognitivní metriky, které byly následně vyhodnoceny v programu RSTUDIO a Microsoft Excel.

V průběhu této části práce bylo zjištěno, že software OGAMA nedokáže zpracovat data obsahující záznamy o kliknutích tlačítkem myši v jednotlivých částech trialu. Tyto kliky odpovídaly odpovědím respondentů na otázky položené během experimentu. Z tohoto důvodu byl pro tento úkol využit program SMI BeeGaze.

Posouzení jednotlivých znakových sad bylo provedeno na základě statistických parametrů, jako je aritmetický průměr, medián, kvartil nebo rozložení hodnot. Ve všech případech došlo k posouzení charakteru datového souboru a určení nejvhodnějšího z nich. Míra podobnosti mezi skupinami respondentů byla stanovena pomocí metody Loci a Sequence similarity provedené v modulu Scanpaths programu OGAMA. A také pomocí dvouvýběrového Wilcoxonova testu, který slouží k nalezení statisticky významného rozdílu mezi dvěma datovými soubory. Tento rozdíl byl hledán v parametrech doby sledování stimulu, počtu fixací a délce oční trajektorie a to vždy pro skupiny trialů se stejným typem znaků. Test byl proveden v programu RSTUDIO.