Init
Creating Reading Writing
index_col=0: La primera columna del df, será el índice. usecols=['title']: Solo carga del df, la columna title. sep=';':Tipo de separador que contiene el CSV. header=False: No contiene una fila con nombres de la columna, se sustituyen por números. index=False: Solo se guardan las columnas. copy(): Cambiar en df_copy, no afecta a df. Sin copy, crea una referencia de df, cambios en df_copia puede afectar a df. Indexing Selecting Assigning
loc(): Selecciona filas y columnas basado en una etiqueta, en este caso los que cumplan x condición. iloc(): Selecciona filas y columnas basado en su índice, en este caso las filas del 5 al 10 y las columnas 0, 1, 3. str.startswith(): En este caso, selecicona las películas cuyo título comience por S. str.contains(): En este caso, selecicona las películas cuyo título contengan 'Spider'. median(): Hace la mediana de la columna 'critic_score' |
Summary Functions Maps
mean(): Calcula la media. describe(): Resumen estadístico del df. value_counts(): Cuenta cuantas películas hay de cada tipo. apply(): En la columna nueva (score_ratio) los valores se obtendrán por la función 'score_ratio'. map(): Cambia todos los valores a minúscula con lower(). std(): Mide la dispersión de los datos respecto a la media. agg(): Calcula múltiples estadísticas a la vez (mean y std). Grouping Sorting
df.groupby('production_co').mean(numeric_only=True).sort_values('critic_score', ascending=False): Agrupa por columna, calcula la media de columnas numéricas y ordena por la columna 'critic_score' de mayor a menos. Data_type Missing_values
astype(): convierte una columna a otro tipo de dato. isnull(): detecta valores nulos en el DataFrame. fillna(): reemplaza valores nulos con un valor especificado. dropna(): elimina filas o columnas con valores nulos. str.replace(): reemplaza patrones en texto dentro de una serie. to_datetime(): convierte datos a formato de fecha y hora. Renaming Combining
rename(): cambia nombres de columnas o índices en el DataFrame. concat(): une múltiples DataFrames a lo largo de un eje. set_index(): establece una columna como índice del DataFrame. join(): combina DataFrames usando el índice. df.index.name: asigna o muestra el nombre del índice. df.columns.name: asigna o muestra el nombre de las columnas. |
Cheatography
https://cheatography.com
Pandas - Chopito Cheat Sheet (DRAFT) by AdrianPerogil
CheatSheet Pandas - Chopito
This is a draft cheat sheet. It is a work in progress and is not finished yet.