Show Menu
Cheatography

Pandas Plotting y Bootstrap en Python Cheat Sheet Cheat Sheet (DRAFT) by

Hola Mundo, este es mi nuevo Cheat Sheet

This is a draft cheat sheet. It is a work in progress and is not finished yet.

Introd­ucción

pandas.pl­otting
es un submódulo en Pandas para gráficos avanzados, como gráficos de dispersión y matrices de correl­ación. Se usa para análisis explor­atorio de datos.

Bootstrap es una técnica de remuestreo que estima la distri­bución de una estadí­stica sin suponer una distri­bución especí­fica. Es ideal para calcular intervalos de confianza cuando los datos son limitados.

Funciones Clave

Función
Descri­pción
scatte­r_m­atrix()
Crea una matriz de dispersión para comparar todas las columnas numéricas en un DataFrame.
andrew­s_c­urves()
Visualiza patrones en un DataFrame usando curvas de Andrews.
parall­el_­coo­rdi­nates()
Muestra las columnas de un DataFrame como líneas paralelas para ver agrupa­ciones.
lag_plot()
Grafica una variable contra sus valores despla­zados para ver autoco­rre­lación.

¿Cuándo usar Bootstrap?

- Datos limitados: Si tienes pocos datos, Bootstrap permite estimar intervalos de confianza.
- Estimación de intervalos de confianza: Útil cuando se desconoce la distri­bución de los datos.
- Sin supuestos paramé­tricos: No necesitas asumir normalidad u otras propie­dades de los datos.
 

Código Básico: Bootstrap con pandas.pl­otting

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from pandas.plotting import scatter_matrix

# Datos de ejemplo
data = pd.DataFrame({
    'X': np.random.normal(50, 10, 100),
    'Y': np.random.normal(30, 5, 100),
})

# Aplicar Bootstrap
bootstrap_means = []
samples = 1000  # Número de muestras

for _ in range(samples):
    sample = data.sample(frac=1, replace=True)
    bootstrap_means.append(sample.mean())

bootstrap_df = pd.DataFrame(bootstrap_means)

# Visualización
scatter_matrix(bootstrap_df, alpha=0.5, diagonal='kde')
plt.show()

Person­ali­zación de Gráficos en Matplotlib

Elemento
Código
Título Central
plt.su­pti­tle­("Tí­tul­o", fontsi­ze=16, fontwe­igh­t='­bold', color=­'navy')
Título Ejes X/Y
plt.xl­abe­l("Eje X"), plt.yl­abe­l("Eje Y")
Cambiar Colores
color=­'teal' (en funciones de Matplotlib y pandas.pl­otting)
Leyendas
plt.le­gen­d([­"­Label 1", "­Label 2"]) para etiquetas automá­ticas, o ax.text para leyendas person­ali­zadas.
 

Ejemplo Completo

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from pandas.plotting import scatter_matrix

# Generar datos
np.random.seed(0)
data = pd.DataFrame({
    'A': np.random.normal(60, 15, 200),
    'B': np.random.normal(50, 10, 200)
})

# Aplicar Bootstrap
bootstrap_means = []
samples = 1000  # Número de muestras Bootstrap

for _ in range(samples):
    sample = data.sample(frac=1, replace=True)
    bootstrap_means.append(sample.mean())

bootstrap_df = pd.DataFrame(bootstrap_means)

# Visualización y personalización
fig, ax = plt.subplots(figsize=(10, 8))
scatter_matrix(bootstrap_df, alpha=0.5, figsize=(8, 8), diagonal='kde', color='teal')
plt.suptitle("Distribución Bootstrap de Medias", fontsize=16, fontweight='bold', color='navy')
plt.xlabel("Variables", fontsize=12, fontweight='bold', color='darkred')
plt.ylabel("Valores de la Media", fontsize=12, fontweight='bold', color='darkred')

# Leyenda personalizada
for i, col in enumerate(bootstrap_df.columns):
    ax.text(0.9, 0.1 - i*0.1, f"Media de {col}", transform=ax.transAxes, fontsize=12, color='teal')

plt.show()

imagenes