Celkové výsledky
Analýza celkové použitelnosti
Tato kapitola se zabývá celkovými výsledky experimentu a hodnotí použitelnost analyzovaných žurnalistických článků. Hlavní pozornost je věnována hodnocení efektivity, přičemž je postupně analyzována úspěšnost respondentů při řešení úkolů, obtížnost jednotlivých otázek, průměrná doba jejich plnění a složená metrika kombinující úspěšnost, čas a obtížnost. Druhým sledovaným aspektem použitelnosti je chybovost, která je rozebrána v závěru této části.
Měření úspěšnosti
Pro základní hodnocení efektivity byl využit přístup, kdy úspěšnost plnění úkolů byla kvantifikována pomocí matice úspěšnosti. Respondenti, kteří odpověděli správně, obdrželi hodnotu „2“, nesprávné nebo chybějící odpovědi byly hodnoceny „1“. Na základě těchto dat byla vypočítána úspěšnost pro jednotlivé otázky a respondenty.
- Úspěšnost respondentů (%) = (Počet správných odpovědí / Počet otázek) × 100
- Úspěšnost otázek (%) = (Počet správných odpovědí / Počet respondentů) × 100
Nejméně úspěšnou byla otázka Q8 (20,45 %), nejvyšší úspěšnost dosáhla otázka Q3. Průměrná úspěšnost činila 57,67 %. Laici měli 59,09 %, experti 56,25 %. Nejlepší byl P33, nejhorší P18 a P22.
Obtížnost otázek
Obtížnost byla stanovena na základě průměrné úspěšnosti otázek. Otázky byly rozděleny do tercilů:
- Tercil 3 (nejlehčí): Q3, Q4, Q6, Q7
- Tercil 2: Q2
- Tercil 1 (nejobtížnější): Q1, Q5, Q8
Doba plnění úkolů
Maximální doba plnění byla 120 sekund. Nejdelší čas vykazovala otázka Q8, nejkratší Q6.
Skóre respondenta
Pro komplexní hodnocení efektivity byla vytvořena metrika „Skóre respondenta“. Zohledňuje úspěšnost, obtížnost a čas.
Vzorec: Skóre = ∑ (Ús / ObT × ČaT)
- Ús – úspěšnost otázky (2/1)
- ObT – obtížnost otázky (tercil 1–3)
- ČaT – rychlost řešení (tercil 1–3)
Maximální skóre bylo 29. Nejvyšší skóre: P03 a P33 (24,33). Nejnižší: P22 (7,17), P18 (8,83). Experti měli nižší rozptyl výsledků, laici vyšší variabilitu.
Chybovost
Metrika chybovosti zohledňuje možnost opravy odpovědi. Klasifikace otázek dle chybovosti:
- Kategorie 3: Q3, Q4, Q6
- Kategorie 2: Q1, Q2, Q5, Q7, Q8
Otázky Q3 a Q4 měly nulovou chybovost. U Q6 se chyby podařilo většinou opravit. Otázky Q7 a Q8 vykázaly nízkou míru oprav.
Zavedení složené metriky umožnilo komplexnější srovnání respondentů. Efektivita byla určena nejen správností odpovědí, ale také rychlostí a náročností. Výsledky ukazují, že kombinace těchto faktorů lépe vystihuje rozdíly ve schopnostech práce s interaktivními vizualizacemi.