Statistiskie rādītāji
Programmā R gandrīz katram no statistiskajiem rādītājiem ir izveidota atsevišķa funkcija, ar kuru to aprēķināt. Biežāk izmantotos rādītājus kā vidējais aritmētiskais, standartnovirze, dispersija un mediāna aprēķina attiecīgi ar funkcijām: mean(), sd(), var() un median(), kurām kā argumentu norāda mainīgā (kolonnas) nosaukumu, kurai nepieciešams aprēķināt konkrēto statistisko rādītāju. Vairums no šīm funkcijām nestrādās, ja starp datiem būs kāda iztrūkstoša vērtība. Šajā gadījumā iekavās papildus jāizmanto arguments na.rm=TRUE, kas izslēgs no arpēķina iztrūkstošās vērtības.
> data(iris)
> attach(iris)
> names(iris)
[1] "Sepal.Length" "Sepal.Width" "Petal.Length" "Petal.Width" "Species"
> mean(Sepal.Length)
[1] 5.843333
> sd(Sepal.Length)
[1] 0.8280661
> var(Sepal.Length)
[1] 0.6856935
> median(Sepal.Length)
[1] 5.8
Minimālo un maksimālo vērtību aprēķina ar funkcijām min() un max(). Ar funkciju range() var apskatīt uzreiz minimālo un maksimālo vērtību.
> min(Sepal.Length)
[1] 4.3
> max(Sepal.Length)
[1] 7.9
> range(Sepal.Length)
[1] 4.3 7.9
Visu kvartiļu aprēķināšanai izmanto funkciju quantile(). Ja nepieciešams aprēķināt tikai kādas konkrētās kvartiles, vai arī procentiles, tad jāizmanto papildus arguments probs=, pie kura norāda kādas procentiles aprēķināt (izteiktas decimāldaļās).
> quantile(Sepal.Length)
0% 25% 50% 75% 100%
4.3 5.1 5.8 6.4 7.9
> quantile(Sepal.Length,probs=c(0.025,0.975))
2.5% 97.5%
4.4725 7.7000
Ar funkcijas summary(), kurai kā arguments norādīts mainīgā nosaukums, palīdzību uzreiz var aprēķināt minimālo, maksimālo un vidējo vērtību, kā arī 1. un 3. kvartili un mediānu.
> summary(Sepal.Length)
Min. 1st Qu. Median Mean 3rd Qu. Max.
4.300 5.100 5.800 5.843 6.400 7.900
Ja funkciju summary() attiecina uz visu datu tabulu, tad dotie statistiskie rādītāji tiek aprēķināti katrai no kolonnai. Izņēmums ir kolonna, kuras vērtības ir izteiktas kā faktors vai teksts. Šādai kolonnai nosaka cik reizes katrs no līmeņiem atkārtojas.
> summary(iris[,c(1,2,5)])
Sepal.Length Sepal.Width Species
Min. :4.300 Min. :2.000 setosa :50
1st Qu. :5.100 1st Qu. :2.800 versicolor :50
Median :5.800 Median :3.000 virginica :50
Mean :5.843 Mean :3.057
3rd Qu. :6.400 3rd Qu. :3.300
Max. :7.900 Max. :4.400