Installation
conda install pandas |
conda install seaborn |
conda install pandas seaborn |
Export
CSV: df.to_csv(filename) |
Excel: df.to_excel(filename) |
SQL: df.to_sql(table_name, connection_object) |
JSON: df.to_json(filename) |
Spalten bearbeiten
Spalte Hinzufugen: df['fuenf'] = 5 df ['neue Spalte'] = 2*df['alte Spalte'] |
Spalte löschen: del df['fuenf'] |
Spalten umbenennen: df.rename(columns = {'alt1':'neu1','alt2':'neu2'}, inplace = True) df.columns = ['neu1', 'neu2', 'neu3', 'neu4'] |
Rename: Funktionen entgegennehmen df.rename(columns= str.upper, inplace = True) df.rename(columns=lambda x: f'T1_{x}', inplace = True) |
Broadcasting
s1 = pd.Series(rng.standard_normal(10)) – 5 |
Ausprägungen
Index: df.idxmin() df.idxmax() |
Max wer zeile : df.loc[df['Wert1'].idxmax()] |
Position: argmin() argmax() |
|
|
Import
CSV: pd.read_csv(filename) |
Excel: pd.read_excel(filename) |
SQL : pd.read_sql(query, connection_object) |
JSON: pd.read_json(json_string) |
HTML: pd.read_html(url) |
Clipboard: pd.read_clipboard() |
dict: pd.DataFrame(dict) |
Dataframes
aus Listen: df = pd.DataFrame(["rot","grün","blau","gelb"], columns=["Farbe"]) |
aus Dictionaries: d = {"Name": ['Katja', 'Nina', 'Sven', 'Matthias'], "Alter": [32, 32, 36, 31], "Ort":['Berlin', 'München', 'Frankfurt', 'Köln'] } df = pd.DataFrame(d) |
seaborn: import seaborn as sns |
Zeilen bearbeiten
Zeilen anhand des Index löschen: df = df.drop(1) df = df.drop([0,1,2,3]) df.drop('fuenf', axis=1, inplace=True) |
Werte anhand von boolscher Bedingung ändern: df.loc[df["Alter"]>=32,'Ort'] = 'Berlin' |
Sortieren
Nach index: df.sort_index() |
Nach spaltenwerten df.sort_values(by='Wert2') df.sort_values(by=['Wert2','Wert3'], ascending=[False, True]) |
|
|
Series
aus Listen: s = pd.Series(["rot","grün","blau","gelb"]) |
aus Dictionaries: d = {'Berlin':3645000, 'München':1472000, 'Hamburg':1841000, 'Köln':1086000 } staedte = pd.Series(d) |
elementen zugriff: wie eine Liste. z.b: zahlen[3] |
Bei einem dictionary werden die Schlüssel zum Index: staedte["Hamburg"] |
NaN: Not a Number = fehlende Wert |
Dataframes Zugriff:
Erste zeile: df.head() |
Spalten (über Spaltennamen) : df.columns df["Alter"] oder df.Alter df[["Name","Alter"]] |
Zeilen und Spalten per iloc df.iloc[0] df.iloc[0,0] df.iloc[0,0:2] |
über loc per Index-Label: df.loc[:,"Alter"] df.index = df["Name"] df.loc[["Nina","Sven"],"Ort"] |
booleans: df.loc[df["Alter"]>=32] df.loc[df['Name'].str[:1]=="M"] df.loc[df["Alter"].isnull()] |
Werten Zuweisung df.loc['Sven':,'Alter'] = 30 |
|
Created By
Metadata
Comments
No comments yet. Add yours below!
Add a Comment
Related Cheat Sheets
More Cheat Sheets by omarffkamel