Show Menu
Cheatography

Pandas 2 Cheat Sheet (DRAFT) by

Pandas second sheet :)

This is a draft cheat sheet. It is a work in progress and is not finished yet.

Eindeutige Werte und Duplikate

isin(): d für jeden Wert einer Serie überpr­üfen, ob er in einer Liste ist
s.isin­(['­a',­'b']) pengui­ns[­pen­gui­ns[­'sp­eci­es'­].i­sin­(['­Ade­lie'])]
unique() gibt die eindeu­tigen Werte aus
import seaborn as sns
pengui­ns[­"­spe­cie­s"].u­ni­que()
duplic­ated()
gibt eine boolean Serie zurück, ob die Zeile schon vorhanden war
Mit drop_d­upl­ica­tes() können die Duplikate entfernt werden

Apply

Anwenden einer Funktion spalte­nweise oder zeilen­weise
df.app­ly(max)
df.app­ly(max, axis=1)
Kombin­ation mit eigener Funktion
df.app­ly(­mei­ne_­fun­ktion)
df.app­ly(­mei­ne_­fun­ktion, axis=1)
Rückgabe von mehreren Elementen
def f(x):
  return pd.Ser­ies­([x.min(), x.max()], index=­['min', 'max'])
df.app­ly(f, axis=1)
 

All, Any

all()
prüfen ob alle Elemente einer boolschen Serie True sind.
titani­c["w­ho"].is­in(­["ch­ild­"­,"wo­man­"­]).a­ll()
any() prüft, ob es mindestens ein Element einer boolschen Serie gibt, welches den Wert True hat
(titan­ic[­"­age­"] > 75).any()

Map und ApplyMap

map ermöglicht das Anwenden einer Funktion auf jedes Element einer Serie
f = lambda x: f'{x:.2f}'
df['We­rt1­'].m­ap­(fo­rmat)
applymap wendet eine Funktion auf jedes Element eines DataFrames an
df.app­lym­ap(­lambda x: f'{x:.2­f}')

Stichprobe

sample() : Zufällige Stichprobe
n gibt die Größe an
replac­e=True : eine Zeile mehrfach auswahlen
train_rate = 0.8
train_n = round(­tra­in_rate * coffee.sh­ape[0])
train = coffee.sa­mple(n = train_n)
test = coffee­[~p­d.S­eri­es(­cof­fee.in­dex­).i­sin­(pd.Se­rie­s(t­rai­n.i­ndex))]
print(­tes­t.s­hape)
 

Kategorien und Ersetz­ungen

value_­cou­nts() gibt die Anzahl der eindeu­tigen Werte aus
cut() sortiert Werte in Intervalle
pd.cut­(pe­ngu­ins­["bo­dy_­mas­s_g­"], bins=3)
replace() : Werte ersetzen
df.rep­lac­e('­alter Wert',­'neuer Wert')
df.rep­lac­e([­'al­t1'­,'a­lt2­'],­'neu')
df.rep­lac­e({­'al­t1'­:'n­eu1­','­alt­2':­'ne­u2'}, inplac­e=True)