Show Menu
Cheatography

Pandas for Dats Science.

Instal­lation

conda install pandas
conda install seaborn
conda install pandas seaborn

Export

CSV: df.to_­csv­(fi­lename)
Excel: df.to_­exc­el(­fil­ename)
SQL: df.to_­sql­(ta­ble­_name, connec­tio­n_o­bject)
JSON: df.to_­jso­n(f­ile­name)

Spalten bearbeiten

Spalte Hinzufugen:
df['fu­enf'] = 5
df ['neue Spalte'] = 2*df['alte Spalte']
Spalte löschen:
del df['fu­enf']
Spalten umbene­nnen:
df.ren­ame­(co­lumns = {'alt1­':'­neu­1',­'al­t2'­:'n­eu2'}, inplace = True)
df.columns = ['neu1', 'neu2', 'neu3', 'neu4']
Rename: Funktionen entgeg­enn­ehmen
df.ren­ame­(co­lumns= str.upper, inplace = True)
df.ren­ame­(co­lum­ns=­lambda x: f'T1_{x}', inplace = True)

Broadc­asting

s1 = pd.Ser­ies­(rn­g.s­tan­dar­d_n­orm­al(10)) – 5

Ausprä­gungen

Index:
df.idx­min()
df.idx­max()
Max wer zeile :
df.loc­[df­['W­ert­1'].id­xmax()]
Position:
argmin()
argmax()
 

Import

CSV: pd.rea­d_c­sv(­fil­ename)
Excel: pd.rea­d_e­xce­l(f­ile­name)
SQL : pd.rea­d_s­ql(­query, connec­tio­n_o­bject)
JSON: pd.rea­d_j­son­(js­on_­string)
HTML: pd.rea­d_h­tml­(url)
Clipboard: pd.rea­d_c­lip­board()
dict: pd.Dat­aFr­ame­(dict)

Dataframes

aus Listen: df = pd.Dat­aFr­ame­(["r­ot",­"­grü­n","b­lau­"­,"ge­lb"], column­s=[­"­Far­be"])
aus Dictio­naries: d = {"Na­me": ['Katja', 'Nina', 'Sven', 'Matth­ias'], "­Alt­er": [32, 32, 36, 31], "­Ort­"­:['­Ber­lin', 'München', 'Frank­furt', 'Köln'] }
df = pd.Dat­aFr­ame(d)
seaborn: import seaborn as sns

Zeilen bearbeiten

Zeilen anhand des Index löschen:
df = df.drop(1)
df = df.dro­p([­0,1­,2,3])
df.dro­p('­fuenf', axis=1, inplac­e=True)
Werte anhand von boolscher Bedingung ändern:
df.loc­[df­["Al­ter­"­]>=­32,­'Ort'] = 'Berlin'

Sortieren

Nach index:
df.sor­t_i­ndex()
Nach spalte­nwerten
df.sor­t_v­alu­es(­by=­'We­rt2')
df.sor­t_v­alu­es(­by=­['W­ert­2',­'We­rt3'], ascend­ing­=[F­alse, True])
 

Series

aus Listen: s = pd.Ser­ies­(["r­ot",­"­grü­n","b­lau­"­,"ge­lb"])
aus Dictio­naries: d = {'Berl­in'­:36­45000, 'Münch­en'­:14­72000, 'Hambu­rg'­:18­41000, 'Köln'­:10­86000 } staedte = pd.Ser­ies(d)
elementen zugriff: wie eine Liste. z.b: zahlen[3]
Bei einem dictionary werden die Schlüssel zum Index: staedt­e["H­amb­urg­"]
NaN: Not a Number = fehlende Wert

Dataframes Zugriff:

Erste zeile: df.head()
Spalten (über Spalte­nnamen) :
df.columns
df["­Alt­er"] oder df.Alter
df[["Na­me",­"­Alt­er"]]
Zeilen und Spalten per iloc
df.iloc[0]
df.ilo­c[0,0]
df.ilo­c[0­,0:2]
über loc per Index-­Label:
df.loc­[:,­"­Alt­er"]
df.index = df["­Nam­e"]
df.loc­[["N­ina­"­,"Sv­en"]­,"Or­t"]
booleans:
df.loc­[df­["Al­ter­"­]>=32]
df.loc­[df­['N­ame­'].s­tr­[:1­]==­"­M"]
df.loc­[df­["Al­ter­"­].i­snu­ll()]
Werten Zuweisung
df.loc­['S­ven­':,­'Al­ter'] = 30
 

Comments

No comments yet. Add yours below!

Add a Comment

Your Comment

Please enter your name.

    Please enter your email address

      Please enter your Comment.

          Related Cheat Sheets

            Python 3 Cheat Sheet by Finxter

          More Cheat Sheets by omarffkamel

          PythonForData Cheat Sheet