Statistiskie rādītāji

Programmā R gandrīz katram no statistiskajiem rādītājiem ir izveidota atsevišķa funkcija, ar kuru to aprēķināt. Biežāk izmantotos rādītājus kā vidējais aritmētiskais, standartnovirze, dispersija un mediāna aprēķina attiecīgi ar funkcijām: mean(), sd(), var() un median(), kurām kā argumentu norāda mainīgā (kolonnas) nosaukumu, kurai nepieciešams aprēķināt konkrēto statistisko rādītāju. Vairums no šīm funkcijām nestrādās, ja starp datiem būs kāda iztrūkstoša vērtība. Šajā gadījumā iekavās papildus jāizmanto arguments na.rm=TRUE, kas izslēgs no arpēķina iztrūkstošās vērtības.

> data(iris)
> attach(iris)
> names(iris) [1] "Sepal.Length" "Sepal.Width" "Petal.Length" "Petal.Width" "Species"

> mean(Sepal.Length)
[1] 5.843333

> sd(Sepal.Length)
[1] 0.8280661
> var(Sepal.Length)
[1] 0.6856935

> median(Sepal.Length)
[1] 5.8

Minimālo un maksimālo vērtību aprēķina ar funkcijām min() un max(). Ar funkciju range() var apskatīt uzreiz minimālo un maksimālo vērtību.

> min(Sepal.Length)
[1] 4.3

> max(Sepal.Length)
[1] 7.9

> range(Sepal.Length)
[1] 4.3    7.9

Visu kvartiļu aprēķināšanai izmanto funkciju quantile(). Ja nepieciešams aprēķināt tikai kādas konkrētās kvartiles, vai arī procentiles, tad jāizmanto papildus arguments probs=, pie kura norāda kādas procentiles aprēķināt (izteiktas decimāldaļās).

> quantile(Sepal.Length)
 0%   25%   50%   75%   100%
4.3   5.1   5.8   6.4   7.9

> quantile(Sepal.Length,probs=c(0.025,0.975))
 2.5%    97.5%
4.4725   7.7000

Ar funkcijas summary(), kurai kā arguments norādīts mainīgā nosaukums, palīdzību uzreiz var aprēķināt minimālo, maksimālo un vidējo vērtību, kā arī 1. un 3. kvartili un mediānu.

> summary(Sepal.Length)
Min. 1st Qu. Median Mean 3rd Qu. Max.
4.300 5.100   5.800 5.843 6.400 7.900

Ja funkciju summary() attiecina uz visu datu tabulu, tad dotie statistiskie rādītāji tiek aprēķināti katrai no kolonnai. Izņēmums ir kolonna, kuras vērtības ir izteiktas kā faktors vai teksts. Šādai kolonnai nosaka cik reizes katrs no līmeņiem atkārtojas.

> summary(iris[,c(1,2,5)])
Sepal.Length Sepal.Width Species
Min.    :4.300   Min.    :2.000   setosa     :50
1st Qu. :5.100   1st Qu. :2.800   versicolor :50
Median  :5.800   Median  :3.000   virginica  :50
Mean    :5.843   Mean    :3.057
3rd Qu. :6.400   3rd Qu. :3.300
Max.    :7.900   Max.    :4.400