\documentclass[10pt,a4paper]{article} % Packages \usepackage{fancyhdr} % For header and footer \usepackage{multicol} % Allows multicols in tables \usepackage{tabularx} % Intelligent column widths \usepackage{tabulary} % Used in header and footer \usepackage{hhline} % Border under tables \usepackage{graphicx} % For images \usepackage{xcolor} % For hex colours %\usepackage[utf8x]{inputenc} % For unicode character support \usepackage[T1]{fontenc} % Without this we get weird character replacements \usepackage{colortbl} % For coloured tables \usepackage{setspace} % For line height \usepackage{lastpage} % Needed for total page number \usepackage{seqsplit} % Splits long words. %\usepackage{opensans} % Can't make this work so far. Shame. Would be lovely. \usepackage[normalem]{ulem} % For underlining links % Most of the following are not required for the majority % of cheat sheets but are needed for some symbol support. \usepackage{amsmath} % Symbols \usepackage{MnSymbol} % Symbols \usepackage{wasysym} % Symbols %\usepackage[english,german,french,spanish,italian]{babel} % Languages % Document Info \author{StefPanchana} \pdfinfo{ /Title (librerias-python-resultados-de-cirrhosis.pdf) /Creator (Cheatography) /Author (StefPanchana) /Subject (Librerías Python - Resultados de Cirrhosis Cheat Sheet) } % Lengths and widths \addtolength{\textwidth}{6cm} \addtolength{\textheight}{-1cm} \addtolength{\hoffset}{-3cm} \addtolength{\voffset}{-2cm} \setlength{\tabcolsep}{0.2cm} % Space between columns \setlength{\headsep}{-12pt} % Reduce space between header and content \setlength{\headheight}{85pt} % If less, LaTeX automatically increases it \renewcommand{\footrulewidth}{0pt} % Remove footer line \renewcommand{\headrulewidth}{0pt} % Remove header line \renewcommand{\seqinsert}{\ifmmode\allowbreak\else\-\fi} % Hyphens in seqsplit % This two commands together give roughly % the right line height in the tables \renewcommand{\arraystretch}{1.3} \onehalfspacing % Commands \newcommand{\SetRowColor}[1]{\noalign{\gdef\RowColorName{#1}}\rowcolor{\RowColorName}} % Shortcut for row colour \newcommand{\mymulticolumn}[3]{\multicolumn{#1}{>{\columncolor{\RowColorName}}#2}{#3}} % For coloured multi-cols \newcolumntype{x}[1]{>{\raggedright}p{#1}} % New column types for ragged-right paragraph columns \newcommand{\tn}{\tabularnewline} % Required as custom column type in use % Font and Colours \definecolor{HeadBackground}{HTML}{333333} \definecolor{FootBackground}{HTML}{666666} \definecolor{TextColor}{HTML}{333333} \definecolor{DarkBackground}{HTML}{0B70A3} \definecolor{LightBackground}{HTML}{EFF6F9} \renewcommand{\familydefault}{\sfdefault} \color{TextColor} % Header and Footer \pagestyle{fancy} \fancyhead{} % Set header to blank \fancyfoot{} % Set footer to blank \fancyhead[L]{ \noindent \begin{multicols}{3} \begin{tabulary}{5.8cm}{C} \SetRowColor{DarkBackground} \vspace{-7pt} {\parbox{\dimexpr\textwidth-2\fboxsep\relax}{\noindent \hspace*{-6pt}\includegraphics[width=5.8cm]{/web/www.cheatography.com/public/images/cheatography_logo.pdf}} } \end{tabulary} \columnbreak \begin{tabulary}{11cm}{L} \vspace{-2pt}\large{\bf{\textcolor{DarkBackground}{\textrm{Librerías Python - Resultados de Cirrhosis Cheat Sheet}}}} \\ \normalsize{by \textcolor{DarkBackground}{StefPanchana} via \textcolor{DarkBackground}{\uline{cheatography.com/203068/cs/43215/}}} \end{tabulary} \end{multicols}} \fancyfoot[L]{ \footnotesize \noindent \begin{multicols}{3} \begin{tabulary}{5.8cm}{LL} \SetRowColor{FootBackground} \mymulticolumn{2}{p{5.377cm}}{\bf\textcolor{white}{Cheatographer}} \\ \vspace{-2pt}StefPanchana \\ \uline{cheatography.com/stefpanchana} \\ \end{tabulary} \vfill \columnbreak \begin{tabulary}{5.8cm}{L} \SetRowColor{FootBackground} \mymulticolumn{1}{p{5.377cm}}{\bf\textcolor{white}{Cheat Sheet}} \\ \vspace{-2pt}Not Yet Published.\\ Updated 26th April, 2024.\\ Page {\thepage} of \pageref{LastPage}. \end{tabulary} \vfill \columnbreak \begin{tabulary}{5.8cm}{L} \SetRowColor{FootBackground} \mymulticolumn{1}{p{5.377cm}}{\bf\textcolor{white}{Sponsor}} \\ \SetRowColor{white} \vspace{-5pt} %\includegraphics[width=48px,height=48px]{dave.jpeg} Measure your website readability!\\ www.readability-score.com \end{tabulary} \end{multicols}} \begin{document} \raggedright \raggedcolumns % Set font size to small. Switch to any value % from this page to resize cheat sheet text: % www.emerson.emory.edu/services/latex/latex_169.html \footnotesize % Small font. \begin{multicols*}{3} \begin{tabularx}{5.377cm}{x{1.14471 cm} x{3.83229 cm} } \SetRowColor{DarkBackground} \mymulticolumn{2}{x{5.377cm}}{\bf\textcolor{white}{Librerías Python Usadas}} \tn % Row 0 \SetRowColor{LightBackground} Pandas & Pandas es una librería de Python que se utiliza para la manipulación y análisis de datos. \tn % Row Count 4 (+ 4) % Row 1 \SetRowColor{white} \seqsplit{Matplotlib} & Sirve para crear visualizaciones y gráficos de datos. \tn % Row Count 6 (+ 2) % Row 2 \SetRowColor{LightBackground} Seaborn & Proporciona varias funciones para personalizar los gráficos. \tn % Row Count 9 (+ 3) % Row 3 \SetRowColor{white} Lightgbm & Utilizado para la categorización, clasificación y muchas otras tareas de aprendizaje automático, en las que es necesario maximizar o minimizar una función objetivo mediante la técnica de gradient boosting, que consiste en combinar clasificadores sencillos. \tn % Row Count 18 (+ 9) % Row 4 \SetRowColor{LightBackground} Scikit Learn & Herramientas para preprocesar datos, las funciones para evaluar modelos y los mecanismos para ajustar los parámetros de cada modelo. \tn % Row Count 23 (+ 5) \hhline{>{\arrayrulecolor{DarkBackground}}--} \end{tabularx} \par\addvspace{1.3em} \begin{tabularx}{5.377cm}{x{1.29402 cm} x{3.68298 cm} } \SetRowColor{DarkBackground} \mymulticolumn{2}{x{5.377cm}}{\bf\textcolor{white}{Funciones Usadas de Pandas}} \tn % Row 0 \SetRowColor{LightBackground} head() & Devuelve las n primeras filas del DataFrame df. \tn % Row Count 2 (+ 2) % Row 1 \SetRowColor{white} info() & Devuelve información (número de filas, número de columnas, índices, tipo de las columnas y memoria usado) sobre el DataFrame df. \tn % Row Count 7 (+ 5) % Row 2 \SetRowColor{LightBackground} shape() & Devuelve una tupla con el número de filas y columnas del DataFrame df. \tn % Row Count 10 (+ 3) % Row 3 \SetRowColor{white} isnull() & Devuelve una estructura con las mismas dimensiones que la que se cede como argumento sustituyendo cada valor por el booleano True si el correspondiente elemento es un valor nulo, y por el booleano False en caso contrario. \tn % Row Count 18 (+ 8) % Row 4 \SetRowColor{LightBackground} \seqsplit{value\_counts()} & Obtener cuantos datos tenemos de algo en específico. \tn % Row Count 20 (+ 2) % Row 5 \SetRowColor{white} map() & Se utiliza para asignar valores de dos series que tienen una columna similar. \tn % Row Count 23 (+ 3) \hhline{>{\arrayrulecolor{DarkBackground}}--} \end{tabularx} \par\addvspace{1.3em} \begin{tabularx}{5.377cm}{x{1.09494 cm} x{3.88206 cm} } \SetRowColor{DarkBackground} \mymulticolumn{2}{x{5.377cm}}{\bf\textcolor{white}{Funciones Usadas de Seaborn}} \tn % Row 0 \SetRowColor{LightBackground} \seqsplit{countplot()} & Utilizado para mostrar los recuentos de observaciones en cada contenedor categórico mediante barras. \tn % Row Count 4 (+ 4) % Row 1 \SetRowColor{white} \seqsplit{heatmap()} & Permite crear mapas de calor o gráficos de correlación en Python con seaborn. \tn % Row Count 7 (+ 3) \hhline{>{\arrayrulecolor{DarkBackground}}--} \end{tabularx} \par\addvspace{1.3em} \begin{tabularx}{5.377cm}{x{1.04517 cm} x{3.93183 cm} } \SetRowColor{DarkBackground} \mymulticolumn{2}{x{5.377cm}}{\bf\textcolor{white}{Funciones Usadas de Lightbgm}} \tn % Row 0 \SetRowColor{LightBackground} \seqsplit{dataset()} & Carga data en la librería. \tn % Row Count 2 (+ 2) % Row 1 \SetRowColor{white} train() & Seteo de data para entrenamiento. \tn % Row Count 4 (+ 2) % Row 2 \SetRowColor{LightBackground} \seqsplit{predict()} & Seteo de data para predicción. \tn % Row Count 6 (+ 2) \hhline{>{\arrayrulecolor{DarkBackground}}--} \end{tabularx} \par\addvspace{1.3em} \begin{tabularx}{5.377cm}{x{0.84609 cm} x{4.13091 cm} } \SetRowColor{DarkBackground} \mymulticolumn{2}{x{5.377cm}}{\bf\textcolor{white}{Funciones Usadas de Matplotlib}} \tn % Row 0 \SetRowColor{LightBackground} \seqsplit{figure()} & Elemento base sobre el que se construyen todos los gráficos \tn % Row Count 2 (+ 2) % Row 1 \SetRowColor{white} \seqsplit{title()} & Seteo de un titulo para la gráfica a mostrar. \tn % Row Count 4 (+ 2) % Row 2 \SetRowColor{LightBackground} \seqsplit{show()} & Mostrar figura. \tn % Row Count 5 (+ 1) \hhline{>{\arrayrulecolor{DarkBackground}}--} \end{tabularx} \par\addvspace{1.3em} \begin{tabularx}{5.377cm}{x{1.74195 cm} x{3.23505 cm} } \SetRowColor{DarkBackground} \mymulticolumn{2}{x{5.377cm}}{\bf\textcolor{white}{Funciones Usadas de Scikit Learn}} \tn % Row 0 \SetRowColor{LightBackground} \seqsplit{fit\_transform()} & Ajustar a los datos y luego transformarlos. \tn % Row Count 2 (+ 2) % Row 1 \SetRowColor{white} \seqsplit{train\_test\_split()} & Divida matrices o matrices en subconjuntos de pruebas y trenes aleatorios. \tn % Row Count 5 (+ 3) % Row 2 \SetRowColor{LightBackground} \seqsplit{RandomForestClassifier} & Un bosque aleatorio es un metaestimador que ajusta una serie de clasificadores de árboles de decisión en varias submuestras del conjunto de datos y utiliza promedios para mejorar la precisión predictiva y controlar el sobreajuste. \tn % Row Count 14 (+ 9) % Row 3 \SetRowColor{white} \seqsplit{predict\_proba()} & Proporciona un método predict\_proba para regresión logística, que devuelve las probabilidades predichas para cada clase. \tn % Row Count 19 (+ 5) \hhline{>{\arrayrulecolor{DarkBackground}}--} \end{tabularx} \par\addvspace{1.3em} \begin{tabularx}{5.377cm}{x{2.43873 cm} x{2.53827 cm} } \SetRowColor{DarkBackground} \mymulticolumn{2}{x{5.377cm}}{\bf\textcolor{white}{Análisis del Dataset}} \tn % Row 0 \SetRowColor{LightBackground} Cantidad de Registros: & 7905 \tn % Row Count 2 (+ 2) % Row 1 \SetRowColor{white} Cantidad de Columnas: & 20 \tn % Row Count 4 (+ 2) % Row 2 \SetRowColor{LightBackground} Tipos de datos de las columnas: & float64(10), int64(3), object(7) \tn % Row Count 6 (+ 2) % Row 3 \SetRowColor{white} Información Nula Encontrada: & 0 registros. \tn % Row Count 8 (+ 2) \hhline{>{\arrayrulecolor{DarkBackground}}--} \end{tabularx} \par\addvspace{1.3em} \begin{tabularx}{5.377cm}{p{0.4977 cm} x{4.4793 cm} } \SetRowColor{DarkBackground} \mymulticolumn{2}{x{5.377cm}}{\bf\textcolor{white}{Tareas de EDA aplicadas al Dataset}} \tn % Row 0 \SetRowColor{LightBackground} 1.- & Verificación de Columnas de Información Existentes \tn % Row Count 2 (+ 2) % Row 1 \SetRowColor{white} 2.- & Validación de tipos de datos de los registros. \tn % Row Count 4 (+ 2) % Row 2 \SetRowColor{LightBackground} 3.- & Comprobación del set de datos global. \tn % Row Count 6 (+ 2) % Row 3 \SetRowColor{white} 4.- & Análisis de la distribución de datos por la columna Estado. \tn % Row Count 8 (+ 2) % Row 4 \SetRowColor{LightBackground} 5.- & Verificación de datos nulos en el dataset. \tn % Row Count 10 (+ 2) % Row 5 \SetRowColor{white} 6.- & Transformación de datos categóricos a binarios. \tn % Row Count 12 (+ 2) % Row 6 \SetRowColor{LightBackground} 7.- & Crear visualización de correlación de data. \tn % Row Count 14 (+ 2) % Row 7 \SetRowColor{white} 8.- & Limpieza de columna de id. \tn % Row Count 15 (+ 1) % Row 8 \SetRowColor{LightBackground} 9.- & Configuración de data para entrenamiento y predicción. \tn % Row Count 17 (+ 2) % Row 9 \SetRowColor{white} 10.- & Regresión de datos. \tn % Row Count 18 (+ 1) % Row 10 \SetRowColor{LightBackground} 11.- & Aplicación de entrenamiento y predicción de datos. \tn % Row Count 20 (+ 2) % Row 11 \SetRowColor{white} 12.- & Creación de un archivo plano de los resultados obtenidos. \tn % Row Count 22 (+ 2) \hhline{>{\arrayrulecolor{DarkBackground}}--} \end{tabularx} \par\addvspace{1.3em} \begin{tabularx}{5.377cm}{X} \SetRowColor{DarkBackground} \mymulticolumn{1}{x{5.377cm}}{\bf\textcolor{white}{Distribución de Estados - Matplotlib}} \tn \SetRowColor{LightBackground} \mymulticolumn{1}{p{5.377cm}}{\vspace{1px}\centerline{\includegraphics[width=5.1cm]{/web/www.cheatography.com/public/uploads/stefpanchana_1714144354_imagen_2024-04-26_101158300.png}}} \tn \hhline{>{\arrayrulecolor{DarkBackground}}-} \end{tabularx} \par\addvspace{1.3em} \begin{tabularx}{5.377cm}{X} \SetRowColor{DarkBackground} \mymulticolumn{1}{x{5.377cm}}{\bf\textcolor{white}{Gráfico de Correlación de Datos - Seaborn}} \tn \SetRowColor{LightBackground} \mymulticolumn{1}{p{5.377cm}}{\vspace{1px}\centerline{\includegraphics[width=5.1cm]{/web/www.cheatography.com/public/uploads/stefpanchana_1714144512_imagen_2024-04-26_101506074.png}}} \tn \hhline{>{\arrayrulecolor{DarkBackground}}-} \end{tabularx} \par\addvspace{1.3em} \begin{tabularx}{5.377cm}{x{2.23965 cm} x{2.73735 cm} } \SetRowColor{DarkBackground} \mymulticolumn{2}{x{5.377cm}}{\bf\textcolor{white}{Link de los Recursos}} \tn % Row 0 \SetRowColor{LightBackground} Kaggle Link: & \seqsplit{https://www.kaggle.com/competitions/playground-series-s3e26/data} \tn % Row Count 3 (+ 3) % Row 1 \SetRowColor{white} Información General del Dataset: & El conjunto de datos se generó a partir de un modelo de aprendizaje profundo entrenado en el conjunto de datos de Predicción de supervivencia del paciente con cirrosis. \tn % Row Count 11 (+ 8) \hhline{>{\arrayrulecolor{DarkBackground}}--} \end{tabularx} \par\addvspace{1.3em} % That's all folks \end{multicols*} \end{document}