CORRELACIÓN
Definición: Existe una correlación entre dos variables cuando los valores de una variable están de alguna manera asociados con los valores de la otra variable. Existe una correlación lineal entre dos variables cuando existe una correlación y los puntos graficados de los datos pareados dan como resultado un patrón que se puede aproximar mediante una línea recta. |
• Usar datos pareados para encontrar el valor del coeficiente de correlación lineal r . • Determinar si hay evidencia suficiente para respaldar la conclusión de que existe una correlación lineal entre dos variables. |
Medi. de fuerza la corre. lineal de r
Debido a que las conclusiones basadas en exámenes visuales de diagramas de dispersión son subjetivas en gran medida, necesitamos mediciones más objetivas. Usaremos el coeficiente de correlación lineal r, que es un número que mide la fuerza de la asociación lineal entre las dos variables.
REGRESIÓN
Definición: Dada una colección de datos muestrales pareados, la línea de regresión (o línea de mejor ajuste, o línea de mínimos cuadrados) es la línea recta que “mejor” se ajusta al diagrama de dispersión de los datos. (El criterio específico para la línea recta de “mejor ajuste” es la propiedad de los “mínimos cuadrados” que se describirá posteriormente). La ecuación de regresión: y = b0 + b1x . Describe algebraicamente la línea de regresión. La ecuación de regresión expresa una relación entre x (llamada variable explicativa, variable predictora, o variable independiente) y (llamada variable de respuesta o variable dependiente). |
|
|
INTER. DE LA ECUA. DE REGRESI.
Cambio Marginal: Al trabajar con dos variables relacionadas por una ecuación de regresión, el cambio marginal de una variable es la cantidad que cambia cuando la otra se modifica en exactamente una unidad. La pendiente b1 en la ecuación de regresión representa el cambio marginal en y que ocurre cuando x cambia en una unidad. |
Valores Atípicos y Puntos Influyentes: En un diagrama de dispersión, un valor atípico es un punto que cae lejos de los demás puntos de datos. Los datos muestrales pareados pueden incluir uno o más puntos influyentes, que son puntos que afectan fuertemente la gráfica de la línea de regresión. |
INTERV. DE PREDICCIÓN Y VARIACIIÓN
Definición: Un intervalo de predicción es un rango de valores utilizados para estimar una variable (como un valor predicho de y en una ecuación de regresión). Un intervalo de confianza es un rango de valores utilizados para estimar un parámetro poblacional (como r, m o s). |
• Usar datos muestrales pareados para determinar el valor del coeficiente de determinación r2 e interpretar ese valor.• Utilizar un valor dado de una variable para encontrar un intervalo de predicción para la otra variable. |
Variación Explicable e Inexpliicable
Coeficiente de Determinación
|
|
REGRESIÓN MÚLTIPLE
Definición: Una ecuación de regresión múltiple expresa una relación lineal entre una variable de respuesta y y dos o más variables predictoras (x1, x2, ..., xk). La forma general de una ecuación de regresión múltiple obtenida a partir de datos muestrales es: y = b0+ b1x1 + b2x2 + ∙∙∙ + bkxk |
• Interpretar los resultados de la tecnología para determinar si una ecuación de regresión múltiple es adecuada para hacer predicciones.• Comparar los resultados de diferentes combinaciones de variables predictoras e identificar la combinación que resulta en la mejor ecuación de regresión múltiple. |
Variables Ficticias y Regresión Logística
Definición: Una variable ficticia es una variable que tiene sólo los valores de 0 y 1, utilizados para representar las dos categorías diferentes de una variable cualitativa. |
REGRESIÓN NO LINEAL
Concepto Clave: Las secciones anteriores de este capítulo tratan sólo con relaciones lineales, pero no todas en el mundo son lineales. Esta sección es una breve introducción a los métodos para encontrar algunas funciones no lineales que se ajustan a los datos muestrales. Nos enfocamos en el uso de la tecnología porque los cálculos requeridos son bastante complejos. |
• Usar datos pareados para identificar los modelos lineales, cuadráticos, logarítmicos, exponenciales y de potencia. • Determinar qué modelo se ajusta mejor a los datos pareados. |
5 Modelos Genéricos
Cada uno de los modelos se proporciona con una fórmula genérica junto con un ejemplo de una función específica y su gráfica.
|
Created By
Metadata
Comments
No comments yet. Add yours below!
Add a Comment
Related Cheat Sheets
More Cheat Sheets by Ronald