Show Menu
Cheatography

Trabajo 1 • Empresa Data Driven • Proceso de Modelamiento Predictivo • Proceso KDD, Crisp-DM & SEMMA • Sobreajuste e Infrajuste de Modelamiento • Modelamiento de Regresión Lineal • Técnicas de Estimación de Parámetros • Técnicas de Selección de Variables

This is a draft cheat sheet. It is a work in progress and is not finished yet.

• Empresa Data Driven

Si nuestros datos están estanc­ados, almace­nados y desorg­ani­zados, estamos perdiendo una fuente potencial de alto valor para nuestra compañía. Por lo tanto, el primer paso para iniciar una transición hacia una empresa Data Driven es entender el valor de los datos y tratarlos como tal, es decir, hacerlos accesi­bles.
Cada vez que se propone un cambio, todos los empleados de la empresa esperan que se respalde con inform­ación contra­stada. Esto garantiza que la propuesta ha sido analizada de forma objetiva.
 

Proceso de Modela­miento Predictivo

Los Modelos Predic­tivos son un grupo de técnicas que mediante los campos del aprend­izaje automá­tico, la recole­cción de datos histór­icos, el Big Data y el recono­cim­iento de patrones, pretende dar una predicción de resultados futuros; con el objetivo de precisar la toma de decisiones
 

Proceso KDD, Crisp-DM & SEMMA

Las tres metodo­logías dominantes para el proceso de la minería de datos son: KDD, CRISP-DM y SEMMA. Es una metodo­logía propuesta por Fayyad [3] en 1996, propone 5 fases: Selección, prepro­ces­ami­ento, transf­orm­ación, minería de datos y evaluación e implan­tación. Es un proceso iterativo e intera­ctivo.