Show Menu
Cheatography

Estadística Week 13 Cheat Sheet by

CORRELACIÓN Y REGRECIÓN

CORR­ELA­CIÓN

Defini­ción: Existe una correl­ación entre dos variables cuando los valores de una variable están de alguna manera asociados con los valores de la otra variable. Existe una correl­ación lineal entre dos variables cuando existe una correl­ación y los puntos graficados de los datos pareados dan como resultado un patrón que se puede aproximar mediante una línea recta.
• Usar datos pareados para encontrar el valor del coefic­iente de correl­ación lineal
r
. • Determinar si hay evidencia suficiente para respaldar la conclusión de que existe una correl­ación lineal entre dos variables.

Medi. de fuerza la corre. lineal de r

Debido a que las conclu­siones basadas en exámenes visuales de diagramas de dispersión son subjetivas en gran medida, necesi­tamos mediciones más objetivas. Usaremos el coefic­iente de correl­ación lineal r, que es un número que mide la fuerza de la asociación lineal entre las dos variables.

REGR­ESIÓN

Defini­ción: Dada una colección de datos muestrales pareados, la línea de regresión (o línea de mejor ajuste, o línea de mínimos cuadrados) es la línea recta que “mejor” se ajusta al diagrama de dispersión de los datos. (El criterio específico para la línea recta de “mejor ajuste” es la propiedad de los “mínimos cuadrados” que se describirá poster­ior­mente). La ecuación de regresión: y = b
0
+ b
1
x . Describe algebr­aic­amente la línea de regresión. La ecuación de regresión expresa una relación entre x (llamada variable explic­ativa, variable predic­tora, o variable indepe­ndi­ente) y y (llamada variable de respuesta o variable depend­iente).

INTER. DE LA ECUA. DE REGRESI.

Cambio Marginal: Al trabajar con dos variables relaci­onadas por una ecuación de regresión, el cambio marginal de una variable es la cantidad que cambia cuando la otra se modifica en exacta­mente una unidad. La pendiente b
1
en la ecuación de regresión representa el cambio marginal en y que ocurre cuando x cambia en una unidad
Valores Atípicos y Puntos Influy­entes: En un diagrama de disper­sión, un valor atípico es un punto que cae lejos de los demás puntos de datos. Los datos muestrales pareados pueden incluir uno o más puntos influy­entes, que son puntos que afectan fuerte­mente la gráfica de la línea de regresión.
 

INTERV. DE PREDICCIÓN Y VARIAC­IÓN

Defini­ción: Un intervalo de predicción es un rango de valores utilizados para estimar una variable (como un valor predicho de y en una ecuación de regres­ión). Un intervalo de confianza es un rango de valores utilizados para estimar un parámetro poblac­ional (como r, m o s).
• Usar datos muestrales pareados para determinar el valor del coefic­iente de determ­inación r2 e interp­retar ese valor.• Utilizar un valor dado de una variable para encontrar un intervalo de predicción para la otra variable.

Variación Explicable e Inexpl­icable

Coefic­iente de Determ­inación

 

REGR­ESIÓN MÚLTIPLE

Defini­ción: Una ecuación de regresión múltiple expresa una relación lineal entre una variable de respuesta y y dos o más variables predic­toras (x
1
, x
2
, …, x
k
). La forma general de una ecuación de regresión múltiple obtenida a partir de datos muestrales es: y = b
0
+ b
1
x
1 
+ b
2
x
2
+ ∙∙∙ + b
k
x
k
• Interp­retar los resultados de la tecnología para determinar si una ecuación de regresión múltiple es adecuada para hacer predic­cio­nes.• Comparar los resultados de diferentes combin­aciones de variables predic­toras e identi­ficar la combin­ación que resulta en la mejor ecuación de regresión múltiple.

Variables ficticias y regresión logística

Defini­ción: Una variable ficticia es una variable que tiene sólo los valores de 0 y 1, utilizados para repres­entar las dos categorías diferentes de una variable cualit­ativa.

REGR­ESIÓN NO LINEAL

Concepto Clave: Las secciones anteriores de este capítulo tratan sólo con relaciones lineales, pero no todas en el mundo son lineales. Esta sección es una breve introd­ucción a los métodos para encontrar algunas funciones no lineales que se ajustan a los datos muestr­ales. Nos enfocamos en el uso de la tecnología porque los cálculos requeridos son bastante complejos.
• Usar datos pareados para identi­ficar los modelos lineales, cuadrá­ticos, logarí­tmicos, expone­nciales y de potencia. • Determinar qué modelo se ajusta mejor a los datos pareados.

5 Modelos Genéricos

Cada uno de los modelos se propor­ciona con una fórmula genérica junto con un ejemplo de una función específica y su gráfica.

5 Modelos Genéricos

Cada uno de los modelos se propor­ciona con una fórmula genérica junto con un ejemplo de una función específica y su gráfica.
 

Comments

No comments yet. Add yours below!

Add a Comment

Your Comment

Please enter your name.

    Please enter your email address

      Please enter your Comment.

          Related Cheat Sheets

          More Cheat Sheets by Ronald

          Estadística Week 06 Cheat Sheet
          Estadística Week 07 Cheat Sheet
          Estadística Week 08 Cheat Sheet