Klasický lineární regresní model je jedním z nejjednodušších typů regresního modelu. Do lineárního regresního modelu vstupují dvě proměnné, jedna je vysvětlující (známá, měřená či kovariát) proměnná a druhá vysvětlovaná (odhadovaná či cílová) proměnná. Výsledkem je graf se dvěma osami. Příkladem klasického lineárního regresního modelu je analýza kovariance, která sleduje znak nebo vlastnost objektu a popisuje jejich změnu chování při změně podmínek, například jak budou vznášet různá tělesa v kapalině. Je to vlastně střední hodnota součinu odchylek obou vstupujících veličin od jejich středních hodnot.
Vytvoření modelu v prostředí R:
lm(formula, data, subset, weights, na.action, method = "qr", model = TRUE, x = FALSE, y = FALSE, qr = TRUE, singular.ok = TRUE, contrasts = NULL, offset, ...)
V předchozím modelu je jediný zdroj variability a to je náhodná složka ε. Pro více zdrojů variability, které je nutno popsat, lze použít lineární mixovaný model, kdy se jednotlivé objekty dají přiřadit na základě určité vlastnosti do jedné z K skupin (např. žáky daných středních škol).
Funkce lmer, kterou budeme pro výpočet LMM používat, je obsažena v balíku lme4 či lépe lme4a, který je nutný si stáhnout.
library("lme4")
install.packages("lme4a",repos="http://r-forge.r-project.org")
Vytvoření modelu v prostředí R:
lmer(formula, data, REML = TRUE, sparseX = FALSE, control = list(), start = NULL, verbose = 0L, doFit = TRUE, compDev = TRUE, subset, weights, na.action, offset, contrasts = NULL, ...)
Tento model je výhodný, pokud data nesplňují podmínku normálního rozdělení. Tedy lze mimo normálního rozdělení použít i binomické, gamma, exponenciální či Poissonovo rozdělení. Jako příklad GLM je logistická regrese.
Vytvoření modelu v prostředí R:
glm(formula, family = gaussian, data, weights, subset,na.action, start = NULL, etastart, mustart, offset, control = list(...), model = TRUE, method = "glm.fit",x = FALSE, y = TRUE, contrasts = NULL, ...)
Jak už bylo zmíněno, GLMM je určen pro data, která nesplňují podmínku normalizace a nezávislosti, tedy mají rozdělení exponenciálního typu a zahrnují variabilitu. Spojuje tedy GLM a LMM.
1. Pomocí balíku lme4 (lme4a, lme4b)
2. Pomocí balíku glmm
glmmPQL(fixed, random, family, data, correlation, weights, control, niter = 10, verbose = TRUE, ...)
3. Pomocí balíku glmmPQL
glmm(formula, family=gaussian, data=list(), weights=NULL,offset=NULL, nest, delta=1, maxiter=20, points=10, print.level=0, control=glm.control
(epsilon=0.0001,maxit=10,trace=FALSE))