R als Taschenrechner
1 + 2 |
Addiert die Zahlen |
6 * 9 |
Multipliziert die Zahlen |
85 / 17 |
Dividiert die Zahlen |
2 ^ 10 |
Berechnet die zehnte Potenz von 2 |
sqrt(225) |
Berechnet die Wurzel aus 225 |
Variablen in R
x <- 3 |
Weist der Variable x die Zahl 3 zu |
x = 3 |
Alternative Zuweisung von Variablen |
x + y |
Addiert die Variablen x und y |
y / x |
Dividiert die Variable y durch x |
y * x |
Multipliziert die Variablen x und y |
Mit Vektoren rechnen in R
c(2, 7, 5, 9) |
Erstellt einen Vektor und wirft den Inhalt in der Konsole aus |
v <- c(2, 7, 5, 9) |
Weist der Variable v den Vektor zu |
v |
Wirft den Inhalt der Variable v in der Konsole aus |
v / 2 |
Teilt alle Werte in Variable v durch 2 |
v - w |
Subtrahiert die Werte in w* von den Werten in v |
v * w |
Multipliziert die Werte in v mit den Werten in w |
Dezimalzahlen und Strings
4.7 |
Dezimalzeichen: "." |
"qwertz" |
Erstellen von Strings mit Anführungszeichen |
q <- "Goodbye" |
Zuweisen von Strings |
paste(q, w) |
Verketten von Vektoren |
paste0(q, w) |
Verketten von Vektoren ohne Lücken |
Datenanalyse mit dplyr
install.packages() |
Pakete installieren - Paketname muss in Anführungszeichen |
library() |
Lädt ein installiertes Paket |
:: |
Nimmt Funktion aus spezifiziertem Paket, z.B. dplyr::summarise |
>%> |
magrittr Pipe-Operator, verbindet Funktionen |
group_by() |
dplyr-Funktion, gruppiert Datensatz nach einer Spalte |
filter() |
dplyr-Funktion, filtert Datensatz nach einer Spalte |
summarise() |
dplyr-Funktion, fasst Ergebnisse zB durch Summierung zusammen |
mutate() |
dplyr-Funktion, fügt eine neue Spalte hinzu |
arrange() |
dplyr-Funktion, sortiert Ergebnisse zB der Größe nach |
split() |
dplyr-Funktion, schneidet Ergebnis an einer bestimmten Stelle ab |
Datenstrukturen in R
seq(11, 91, 10) |
Erzeugt eine Zahlenfolge nach bestimmten Kriterien |
x <- c(seq(11 ,91, 10)) |
Weist x einen Vektor mit der Sequenz zu |
matrix(c(x, z), 9, 2) |
Erzeugt aus x und z eine Matrix mit 9 Zeilen und 2 Spalten |
data.frame(x, y, z) |
Erzeugt aus x, y und z einen Dataframe |
Logische Operatoren und Indizes
%in% |
Bsp.: 3 %in% c(1,2,3) ist TRUE |
$ |
Zugriff über Spaltennamen, Bsp.: data$namen |
data[i,j] |
Indizierung - i-te Zeile, j-te Spalte |
| |
"oder" |
& |
"und" |
== und && |
"ist gleich" - logischer Operator, ob links gleich rechts ist |
Datenimport und Datenexport
getwd() |
Zeigt das aktuelle working directory |
setwd() |
Setzt das working directory |
read.csv() |
Importiert eine CSV-Datei |
?read.csv |
Öffnet die Hilfeseite von read.csv in RStudio |
View() |
Zeigt den Dataframe als Tabelle an |
head() |
Zeigt die ersten x Einträge eines Dataframes (unsortiert) |
tail() |
Zeigt die letzten x Einträge eines Dataframes (unsortiert) |
nrow() |
Zeigt die Anzahl der Zeilen eines Dataframes an |
ncol() |
Zeigt die Anzahl der Spalten eines Dataframes an |
length() |
Zeigt die Anzahl Einträge an, z.B. eines Vektors |
class() |
Zeigt die Klasse eines Objekts an, z.B. "data.frame" |
str() |
Zeigt Struktur eines Objekts an, z.B. "data.frame" + die Struktur der Spalten, z.B. "numeric" |
is.na() |
Logical Operator für fehlende Werte in einem Datenobjekt |
any() |
Erfüllt irgendein Wert im Objekt eine bestimmte Bedingung? Bsp.: any(is.na()) |
unique() |
Filtert alle Duplikate heraus |
duplicated() |
Logical Operator für "Bist du ein Duplikat?" |
na.omit() |
Zeigt ein Objekt ohne fehlende Werte an |
sum() |
Berechnet die Summe von Werten |
max() |
Zeigt den größten Werte in einem Objekt an |
min() |
Zeigt den kleinsten Wert in einem Objekt an |
mean() |
Zeigt den Mittelwert eines Objekts an |
table() |
Zeigt die Häufigkeitstabelle eines Objekts an |
sort() |
Sortiert die Einträge eines Objekts |
as.character() |
Setzt die Klasse eines Objekts auf "character" |
as.factor() |
Setzt die Klasse eines Objekts auf "factor" |
as.numeric() |
Setzt die Klasse eines Objekts auf "numeric" |
|