Show Menu
Cheatography

Daten und Variablen Cheat Sheet by

Rechnergestützte Datenauswertung

Variable: Arten

Numerische Variable
Interv­all­skala
Katego­riale Variable
Nomina­lskala
Geordnete Kategorien
Ordina­lskala
Text-v­ariable
Logische Variable

Typische Schritte mit neuen Daten

Variab­len­namen festlegen
Daten eingeben oder einlesen
Fehlende Werte kodieren
Katego­riale Variablen kodieren
Plausa­bil­itä­tsp­rüfung
Frageb­oge­n-Items invert­ieren (Kodierung umkehren) - falls nötig
Neue Variable berechnen

Wichtigste Punkte

<-
Namen und Werten ordnen zu den Objekten
heade­r=TRUE / Header­=FALSE
TRUE - erste Zeile als Variable
$
Teile eines Objekts zuzugr­eifen (lets you access variables within a data set)
c labels­=c(­" ", " "­," ")
This is a generic function which combines its arguments. (c = combine)

Umsetzung in R - Einheit 1

textdaten <- read.t­abl­e("0­1_d­ate­n.t­xt", header­=TRUE)
If the parameter "­hea­der­=" is "­TRU­E", then the first row will be treated as the column names
textd­aten2 <- read.t­abl­e("0­1_d­ate­n.t­xt")
Without "­TRU­E" - first row is variable
 
textdaten <- read.t­abl­e("0­1_d­ate­n.t­xt", header­=TRUE, na.str­ing­s="9­99")
Alles, was vorher in der CSV-Datei als -999 oder -9999 stand, müsste jetzt in R ein NA sein.
 
factor()
Erstellen katego­rialer Variablen
textd­ate­n$M­atu­raland <- factor­(te­xtd­ate­n$M­atu­raland, levels­=c(­1,2­,3,4), labels­=c(­"­Sch­wei­z", "­Oes­ter­rei­ch", "­Deu­tsc­hla­nd", "­and­ers­wo"))
Der Text vor dem $-Zeichen gibt dabei den Namen des Datens­atzes an, der Text danach den Namen der Variable
textd­ate­n$M­atu­raland <- factor­(te­xtd­ate­n$M­atu­raland, levels­=c(­1,2­,3,4), labels­=c(­"­Sch­wei­z", "­Oes­ter­rei­ch", "­Deu­tsc­hla­nd", "­and­ers­wo"))
Der Parameter labels gibt an, welche Benenn­ungen die Stufen 1 bis 4 in der neuen Variable erhalten.
textd­ate­n$M­atu­raland <- factor­(te­xtd­ate­n$M­atu­raland, levels­=c(­1,2­,3,4), labels­=c(­"­Sch­wei­z", "­Oes­ter­rei­ch", "­Deu­tsc­hla­nd", "­and­ers­wo"))
Die Reihen­folge der Benennung erfolgt dabei von kleinen zu grossen Werten
 
read.c­sv()
Coma-S­epa­rated Values (CSV)
textdaten <- read.c­sv(­"­01_­dat­en.c­sv­", header­=TRUE, na.str­ing­s="9­99")
 

Comments

No comments yet. Add yours below!

Add a Comment

Your Comment

Please enter your name.

    Please enter your email address

      Please enter your Comment.

          Related Cheat Sheets

          ggplot2-scatterplots Cheat Sheet