Show Menu
Cheatography

Estadística Week 15 Cheat Sheet by

CORRELACIÓN Y REGRESIÓN

CORR­ELA­CIÓN

• Usar datos pareados para encontrar el valor del coefic­​​iente de correl­​​ación lineal
r
. • Determinar si hay evidencia suficiente para respaldar la conclusión de que existe una correl­​​ación lineal entre dos variables.
Defini­​​​­ción: Existe una correl­​​​­​​​­ación entre dos variables cuando los valores de una variable están de alguna manera asociados con los valores de la otra variable. Existe una correl­​​​­a​​­​ción lineal entre dos variables cuando existe una correl­​​ación y los puntos graficados de los datos pareados dan como resultado un patrón que se puede aproximar mediante una línea recta.

Medi. de fuerza la corre. lineal de r

Debido a que las conclu­​​s­iones basadas en exámenes visuales de diagramas de dispersión son subjetivas en gran medida, necesi­​​tamos mediciones más objetivas. Usaremos el coefic­​​iente de correl­ación lineal r, que es un número que mide la fuerza de la asociación lineal entre las dos variables.

REGR­ESIÓN

Defini­ción: Dada una colección de datos muestrales pareados, la línea de regresión (o línea de mejor ajuste, o línea de mínimos cuadrados) es la línea recta que “mejor” se ajusta al diagrama de dispersión de los datos. (El criterio específico para la línea recta de “mejor ajuste” es la propiedad de los “mínimos cuadrados” que se describirá poster­​​i­o​r­​m​­ente). La ecuación de regresión: y = b0 + b1x . Describe algebr­​​a­i​c­​a​­mente la línea de regresión. La ecuación de regresión expresa una relación entre x (llamada variable explic­​​a­tiva, variable predic­​​tora, o variable indepe­​​n­d​i­​ente) y (llamada variable de respuesta o variable depend­​​i­e​nte).
 

INTER. DE LA ECUA. DE REGRESI.

Valores Atípicos y Puntos Influy­​​e­​​​­​ntes: En un diagrama de disper­​​sión, un valor atípico es un punto que cae lejos de los demás puntos de datos. Los datos muestrales pareados pueden incluir uno o más puntos influy­​​e­ntes, que son puntos que afectan fuerte­​​mente la gráfica de la línea de regresión.
Cambio Marginal: Al trabajar con dos variables relaci­​​o­nadas por una ecuación de regresión, el cambio marginal de una variable es la cantidad que cambia cuando la otra se modifica en exacta­​​mente una unidad. La pendiente b
1
en la ecuación de regresión representa el cambio marginal en y que ocurre cuando x cambia en una unidad.

INTERV. DE PREDICCIÓN Y VARIAC­​​IÓN

• Usar datos muestrales pareados para determinar el valor del coefic­​​iente de determ­​​i­n​ación r
2
e interp­​​retar ese valor. • Utilizar un valor dado de una variable para encontrar un intervalo de predicción para la otra variable.
Defini­ción: Un intervalo de predicción es un rango de valores utilizados para estimar una variable (como un valor predicho de y en una ecuación de regres­​​ión). Un intervalo de confianza es un rango de valores utilizados para estimar un parámetro poblac­​​ional (como r, m o s).

Variación Explicable e Inexpl­​​i­​​cable

Coefic­iente de Determ­inación

 

REGR­ESIÓN MÚLTIPLE

Defini­ción: Una ecuación de regresión múltiple expresa una relación lineal entre una variable de respuesta y y dos o más variables predic­​​toras (x1, x2, ..., xk). La forma general de una ecuación de regresión múltiple obtenida a partir de datos muestrales es: y = b0+ b1x1 + b2x2 + ∙∙∙ + bkxk
1º. Interp­​​retar los resultados de la tecnología para determinar si una ecuación de regresión múltiple es adecuada para hacer predic­​​c­i​o­​nes. 2º. Comparar los resultados de diferentes combin­​​a­c​iones de variables predic­​​toras e identi­​​ficar la combin­​​ación que resulta en la mejor ecuación de regresión múltiple.

Variables Ficticias y Regresión Logística

Defini­ción: Una variable ficticia es una variable que tiene sólo los valores de 0 y 1, utilizados para repres­​​entar las dos categorías diferentes de una variable cualit­​ativa.

REGR­ESIÓN NO LINEAL

• Usar datos pareados para identi­​​ficar los modelos lineales, cuadrá­​​t­icos, logarí­​​t­m​icos, expone­​​n­c​iales y de potencia. • Determinar qué modelo se ajusta mejor a los datos pareados.
Defini­ción: Las secciones anteriores de este capítulo tratan sólo con relaciones lineales, pero no todas en el mundo son lineales. Esta sección es una breve introd​​ ucción a los métodos para encontrar algunas funciones no lineales que se ajustan a los datos muestr­​​ales. Nos enfocamos en el uso de la tecnología porque los cálculos requeridos son bastante complejos.

5 Modelos Genéricos

Cada uno de los modelos se propor­ciona con una fórmula genérica junto con un ejemplo de una función específica y su gráfica.
 

Comments

No comments yet. Add yours below!

Add a Comment

Your Comment

Please enter your name.

    Please enter your email address

      Please enter your Comment.

          Related Cheat Sheets

          More Cheat Sheets by Ronald

          Estadística Week 06 Cheat Sheet
          Estadística Week 07 Cheat Sheet
          Estadística Week 08 Cheat Sheet