Regresijas analīze

Lai programmā R veiktu regresijas analīzi, tiek izmantotas funkcija lm(). Ar funkciju lm() tiek definēts modelis, kuru vēlamies analīzēt lm(formula=y~x,data=datu.tabula). Ja vēlas pārbaudīt vairāku faktoru ietekmi, tad pieraksts ir lm(formula=y~x1+x2+...+xn,data=datu.tabula). Regresijas analīzes modeli ir vēlams saglabāt kā atsevišķu mainīgo, jo to vēlāk var izmantot papildus informācijas iegūšanai vai aprēķinu veikšanai.

Ar funkcijas summary() palīdzību var iegūt regresijas analīzes konsavilkumu, kurā dots katra koeficienta novērtējums, determinācijas koeficients, kā arī visa modeļa būtiskuma novērtējums.

> bietes <- read.table(file = "bietes.txt", header = T)
> attach(bietes)
> modelis <- lm(formula = svars ~ udens, data = bietes)
> summary(modelis)
Call:
lm(formula = svars ~ udens, data = bietes)

Residuals:
   Min      1Q   Median     3Q    Max
-3.2541 -0.8541 -0.0317 0.6903 2.6002

Coefficients:
            Estimate Std. Error t value Pr(>|t|)
(Intercept) 12.254121 0.506327 24.202 < 2e-16 ***
udens       0.026914  0.003269 8.232  1.03e-08 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.408 on 26 degrees of freedom
Multiple R-squared: 0.7227, Adjusted R-squared: 0.7121
F-statistic: 67.77 on 1 and 26 DF, p-value: 1.031e-08

Regresijas vienādojuma koefcientus var atrast kopsavilkuma sadaļā Coefficients kolonnā Estimate, kur attiecīgi vērtība pie (Intercept) atbilst koeficientam b0 (vienādojumā y=b0+b1*x) un vērtība pie faktora nosaukuma atbilst koeficientam b1. Tikai regresijas vienādojuma koeficientus var apskatīt ar funkcijas coefficients() palīdzību, kurai kā arguments norādīts saglabātais regresijas analīzes modelis.

> koef <- coefficients(modelis)
> koef
(Intercept)       udens
12.25412112  0.02691369

Regresijas analīzes rezultātu un atlikumu vērtību novērtēšanai var izmantot grafisko analīzi, kas tiek iegūta ar funkcijas plot() palīdzību, kurai kā arguments norādīts saglabātais regresijas analīzes modelis. Dotais grafiks sastāv no četriem mazākiem grafikiem, kas raksturo atlikuma vērtības, kā arī novērtē, vai datos ir kādas "izlēcošas" vai "ietekmīgas" vērtības.


  > par(mfrow = c(2, 2))
  > plot(modelis)