Show Menu
Cheatography

Basics in R Cheat Sheet (DRAFT) by

This cheatsheet has been created for a Journocode workshop for data analysis, given in Dusseldorf, Germany in March 2017.

This is a draft cheat sheet. It is a work in progress and is not finished yet.

R als Tasche­nre­chner

1 + 2
Addiert die Zahlen
6 * 9
Multip­liziert die Zahlen
85 / 17
Dividiert die Zahlen
2 ^ 10
Berechnet die zehnte Potenz von 2
sqrt(225)
Berechnet die Wurzel aus 225

Variablen in R

x <- 3
Weist der Variable x die Zahl 3 zu
x = 3
Altern­ative Zuweisung von Variablen
x + y
Addiert die Variablen x und y
y / x
Dividiert die Variable y durch x
y * x
Multip­liziert die Variablen x und y

Mit Vektoren rechnen in R

c(2, 7, 5, 9)
Erstellt einen Vektor und wirft den Inhalt in der Konsole aus
v <- c(2, 7, 5, 9)
Weist der Variable v den Vektor zu
v
Wirft den Inhalt der Variable v in der Konsole aus
v / 2
Teilt alle Werte in Variable v durch 2
v - w
Subtra­hiert die Werte in w* von den Werten in v
v * w
Multip­liziert die Werte in v mit den Werten in w

Dezima­lzahlen und Strings

4.7
Dezima­lze­ichen: "."
"­qwe­rtz­"
Erstellen von Strings mit Anführ­ung­sze­ichen
q <- "­Goo­dby­e"
Zuweisen von Strings
paste(q, w)
Verketten von Vektoren
paste0(q, w)
Verketten von Vektoren ohne Lücken

Datena­nalyse mit dplyr

instal­l.p­ack­ages()
Pakete instal­lieren - Paketname muss in Anführ­ung­sze­ichen
library()
Lädt ein instal­liertes Paket
::
Nimmt Funktion aus spezif­izi­ertem Paket, z.B. dplyr:­:su­mmarise
>%>
magrittr Pipe-O­per­ator, verbindet Funktionen
group_by()
dplyr-­Fun­ktion, gruppiert Datensatz nach einer Spalte
filter()
dplyr-­Fun­ktion, filtert Datensatz nach einer Spalte
summar­ise()
dplyr-­Fun­ktion, fasst Ergebnisse zB durch Summierung zusammen
mutate()
dplyr-­Fun­ktion, fügt eine neue Spalte hinzu
arrange()
dplyr-­Fun­ktion, sortiert Ergebnisse zB der Größe nach
split()
dplyr-­Fun­ktion, schneidet Ergebnis an einer bestimmten Stelle ab

Datens­tru­kturen in R

seq(11, 91, 10)
Erzeugt eine Zahlen­folge nach bestimmten Kriterien
x <- c(seq(11 ,91, 10))
Weist x einen Vektor mit der Sequenz zu
matrix­(c(x, z), 9, 2)
Erzeugt aus x und z eine Matrix mit 9 Zeilen und 2 Spalten
data.f­rame(x, y, z)
Erzeugt aus x, y und z einen Dataframe

Logische Operatoren und Indizes

%in%
Bsp.: 3 %in% c(1,2,3) ist TRUE
$
Zugriff über Spalte­nnamen, Bsp.: data$namen
data[i,j]
Indizi­erung - i-te Zeile, j-te Spalte
|
"­ode­r"
&
"­und­"
== und &&
"ist gleich­" - logischer Operator, ob links gleich rechts ist

Dateni­mport und Datene­xport

getwd()
Zeigt das aktuelle working directory
setwd()
Setzt das working directory
read.csv()
Importiert eine CSV-Datei
?read.csv
Öffnet die Hilfeseite von read.csv in RStudio
View()
Zeigt den Dataframe als Tabelle an
head()
Zeigt die ersten x Einträge eines Dataframes (unsor­tiert)
tail()
Zeigt die letzten x Einträge eines Dataframes (unsor­tiert)
nrow()
Zeigt die Anzahl der Zeilen eines Dataframes an
ncol()
Zeigt die Anzahl der Spalten eines Dataframes an
length()
Zeigt die Anzahl Einträge an, z.B. eines Vektors
class()
Zeigt die Klasse eines Objekts an, z.B. "­dat­a.f­ram­e"
str()
Zeigt Struktur eines Objekts an, z.B. "­dat­a.f­ram­e" + die Struktur der Spalten, z.B. "­num­eri­c"
is.na()
Logical Operator für fehlende Werte in einem Dateno­bjekt
any()
Erfüllt irgendein Wert im Objekt eine bestimmte Bedingung? Bsp.: any(is.na())
unique()
Filtert alle Duplikate heraus
duplic­ated()
Logical Operator für "Bist du ein Duplik­at?­"
na.omit()
Zeigt ein Objekt ohne fehlende Werte an
sum()
Berechnet die Summe von Werten
max()
Zeigt den größten Werte in einem Objekt an
min()
Zeigt den kleinsten Wert in einem Objekt an
mean()
Zeigt den Mittelwert eines Objekts an
table()
Zeigt die Häufig­kei­tst­abelle eines Objekts an
sort()
Sortiert die Einträge eines Objekts
as.cha­rac­ter()
Setzt die Klasse eines Objekts auf "­cha­rac­ter­"
as.fac­tor()
Setzt die Klasse eines Objekts auf "­fac­tor­"
as.num­eric()
Setzt die Klasse eines Objekts auf "­num­eri­c"