Datu importēšana

txt failu importēšana

R vidē ir iespējams importēt dažāda formāta datu failus (datu tabulas), piemēram, no programmām Excel, SPSS, SAS. Vienkāršākais veids ir izmantot .txt vai .csv failus.

Lai importētu .txt failus, tiek izmantota funkcija read.table(). Funkcijā tiek norādīts faila nosaukums un ceļš uz to (file). Ja pirmā tabulas rinda satur kolonnu nosaukumus, tad kā papildus arguments jānorāda header=TRUE. Vēl jānorāda skaitļu decimāldaļu atdalītājs (komats vai punkts), izmantojot papildus argumentu dec="." vai dec=",". Tā kā .txt failiem mēdz būt dažādi kolonnu atdalīšanas veidi, tad jānorāda atbilstošais, izmantojot papildus argumentu sep=" ", iespējamās vērtības ir "\t" - tab delimited; "," - kolonnu atdalītājs ir komats; ";" - kolonnu atdalītājs ir semikols.

Obligāti jāievēro tas, ka importējamā failā nedrīkst būt tukšumu, tas ir, iztrūkstošu novērojumu. Ja kāds novērojums iztrūkst, tad tā vietā jāraksta NA.

> dati <- read.table(file = "E:/Dati/R/piem.txt", header = TRUE,
+ sep = "\t", dec = ".")

Pilno ceļu uz importējamo failu var nenorādīt, ja fails atrodas darba direktorijā (Working directory) (var nomainīt ar File/Change dir...).

Pievienojamā faila nosaukumu var arī nenorādīt. Šādā gadījumā kā papildus arguments funkcijai read.table() jānorāda file.choose(). Pēc šīs komandu rindas izpildes, parādīsies logs, kurā varēs izvēlēties .txt failu, kuru vēlaties pievienot darba sesijai. Tomēr arī šajā gadījumā obligāti ir jānorāda vai pirmajā rindā ir kolonnu nosaukumi.

>dati<-read.table(file.choose(),header=TRUE)

Excel failu importēšana

Programmā R ir iespējams importēt arī Excel failus (.xls vai .xlsx) tiešā veidā. Lai to varētu izdarīt, ir jābūt uzinstalētām divām papildus paketēm XLConnect un XLConnectJars, kā arī paketēm, uz kurām balstās šīs divas. Tāpāt uz datora jābūt uzinstalētai Java programmai.

Excel faila importēšanu veic ar funkciju loadWorkbook(), kurai kā argumentu norāda importējamā Excel faila nosaukumu. Šis fails var saturēt arī vairākas lapas. Ar funkcijas summary() palīdzību var apskatīt kādi ir lapu nosaukumi importētajā datu failā.

> library(XLConnect)
> dati<-loadWorkbook("Petijums.xls")
> summary(dati)
*** XLConnect Workbook Summary ***
Filename: 'Petijums.xls'
Sheets (all):
Lapa1, Plans, Paraugi
Hidden Sheets:
NONE
Very Hidden Sheets:
NONE
Names:
NONE
Active Sheet: Lapa1

Lai varētu izmantot darbam kādu no importētā Excel faila lapām, ir jāizmanto funkcija readWorksheet(), kurai kā argumentu norādot objektu, kas satur importēto Excel failu, kā arī konkrētās lapas nosaukumu (sheet=). Funkcija automātiski uzskata, ka pirmajā rindā ir kolonnu nosaukumi, kā arī loģiski cenšas saprast cik lielu daļu no lapas aizņem importējamā informācija. Ar argumentiem startRow=, startCol=, endRow= un endCol= var norādīt konkrēti, kuru apgabalu no lapas importēt.

> lapas.dati<-readWorksheet(dati,sheet="Plans") #tiek importēta visa lapa
> lapas.dati<-read.Worksheet(dati,sheet="Plans",startCol=3,endCol=6) #importē no trešās līdz sestajai kolonnai