Před samotnou částí statistického zpracování dat pro predikci a další části práce bylo primárně zapotřebí podrobnější seznámení s jednotlivými proměnnými v datech, se kterými bylo pracováno. Za tímto účelem byla provedena popisná statistická charakteristika dat, která nám vypovídá o různých aspektech dat a při níž bylo použito základních metod s ohledem na různorodost typů proměnných.
Pro spojité proměnné (metrické) byl vypočten aritmetický průměr a medián, jako součást charakteristiky střední hodnoty v datech a pro míru rozptýlenosti dat byl vypočten rozptyl a směrodatná odchylka. K charakteristice proměnných nominálního a ordinálního typu byly vytvořeny podle četností grafy, které vypovídají o četnosti každé z hodnot v proměnné s porovnáním jednotlivých revírů. K vyhodnocení vzájemných vztahů mezi všemi proměnnými byla využita korelační analýza, respektive hodnoty korelačního koeficientu.
Z důvodů lepšího vyhodnocení výsledků a rozsáhlé datové sady byly porostní skupiny za období deseti let (1999/2008) seskupeny do jednotlivých revírů, pro které byla následně provedena popisná statistika a četnosti.
Pro zjištění predikce jsou zapotřebí základní metody pro určení vztahu mezi proměnnými, mezi které se řadí hlavně metoda regresní analýzy. Z tohoto důvodu byla použita její speciální forma, logistická regrese, jejíž křivka nejlépe proložila daná data a na jejímž základě byla provedena modelace pravděpodobnosti závislé proměnné - pro mě proměnná Kumulativní NT na nezávislé proměnné – pro mě proměnná Rok a z toho vyplývající zvýšení nahodilé těžby v jednotlivých letech do roku 2025.
K výpočtu bylo použito grafické prostředí RStudia s možností využití Zobecněného lineárního modelu (GLM), ve kterém lze nastavit parametry pro výpočet logistické regrese.
Analýza shluků (Cluster Analysis, CLU) je metoda zabývající se šetřením podobnosti objektů s velkým množstvím naměřených hodnot (vícerozměrné objekty), která vytváří jejich následnou klasifikací do shluků neboli clusterů.
Poskytnutá data se vyznačovala velkým počtem naměřených hodnot, které udávaly mnoho vlastností sledovaných porostních skupin v rozmezí let 1999-2008, a proto byla využita shluková analýza. Kdy byly pomocí této metody porostní skupiny rozděleny na předem daný počet shluků podle vzájemně podobných vlastností mnou nadefinovaných „oblastí“, obsahující proměnné charakterizující jednotlivé oblasti (oblast podle vlastností stanoviště, porostu, NT a poškození porostu). Toto rozdělení sloužilo k další interpretaci daných vlastností porostních skupin. Podle nichž lze porovnávat, jak moc se odlišují jednotlivé shluky porostních skupin daných oblastí mezi sebou. Zda shluky jednotlivých oblastí vykazují podobné zařazení porostních skupin nebo je zařazení porostních skupin jednotlivých oblastí zcela různorodé.
Výsledky shlukové analýzy poskytují určitou představu o podobnosti a nepodobnosti jednotlivých porostních skupin.
© Renáta SLEZÁKOVÁ - 2014 -