TÉCNICAS DE REGRESIÓN
mod = lm(V1 ~ V2, data = dat) # modelo regresion
mod = lm(V1 ~ V2 + V3, data = dat)
summary(mod) # beta0 y beta1
abline(mod) # Recta de Regresion
pred1=data.frame(V1=,V2=...)
predict(mod,pred1) # predicc puntual
predict(mod,pred1, interval='prediction', level=0.9)
# predicc nueva obs
predict(mod,pred1, interval='confidence') # prmedia
confint(mod6) # intervalo de conf - si E0 no sign
mod9 = step(mod8) # Selección de variables singif
res = residuals(mod9) # residuos
var(dat) # varianzas covarianzas
cor(dat) # coefs. correlacion (matriz)
pairs(dat) # dispersion multiple
|
LDA - ANÁLISIS DISCRIMINANTE
library(MASS)
(m1 = lda( SEXO ~ . , data = dat ))
m1$scaling # Coefs de la f.discrimante (no stand)
(a0 = -sum(m1$scaling * colMeans(dat[ , -1])))
plot(m1)
(pred1 = predict(m1))
table(pred = pred1$class, real = dat$SEXO)
prediccion$class # Decisión del modelo
prediccion$posterior # Seguridad decisión
prediccion$x #score o puntuación
dat$SEXO[5] # La quinta obs. es mujer
prediccion$class[5] # modelo dice
library(multiUS)
# .f.discriminante coef. estandarizados
m2 = ldaPlus(x = dat[, -1], grouping = dat$SEXO)
m2$standCoefWithin #Coeficientes estandarizados
# Con estos coef. variables son más impor.
# Si hay multicolinealidad: no se pueden interpretar
m2$class$orgTab # M CONFUSIÓN:absoluta
m2$class$perTab # M CONFUSIÓN:relativa
m2$classCV$orgTab # MC VC absoluta
m2$classCV$perTab # MC VC relativa
m2$centroids # Centroides
pred1 = predict(m1, flor)
points(pred1$x, cex = 3)
plot(m2, dimen = 1)
|
ANÁLISIS COMPONENTES PRINCIPALES
plot(fit, type = 'lines') # grafico codo - num CP
biplot(fit) # añadir rownames A parecido B?
dat$T100 = dat$T100^-1 # si invrs proporcional
fit = princomp(datos, cor = T)
fit$sdev^2 # importancia
cumsum(m$sdev^2/7) # Importancias acumuladas
round(fit$sdev^2/6*100, digits= 2) # imp rel
fit$loadings # pesos (weights)
fit$scores # puntuaciones - valores CP
cor(datos, fit$scores) # cargas
rowSums(cor(datos, fit$scores[, 1:2])^2) # comunalidad
1-rowSums(cor(datos, fit$scores[, 1:2])^2)# especifidad
source('prinfact.R')
sol = prinfact(datos, 6) #num CP
sol$loadings # Cargas
sol$scores # puntuaciones
sol$variances # imporancias
sol$eig$vectors[ ,1] # Pesos [CP1]
CORRPLOT
install.packages('corrplot') # descargar paquete
library(corrplot) # activar paquete
r = cor(dat)
corrplot(r, method = 'ellipse')
|
ANÁLISIS COMPONENTES PRINCIPALES
plot(fit, type = 'lines') # grafico codo - num CP
biplot(fit) # añadir rownames A parecido B?
dat$T100 = dat$T100^-1 # si invrs proporcional
fit = princomp(datos, cor = T)
fit$sdev^2 # importancia
cumsum(m$sdev^2/7) # Importancias acumuladas
round(fit$sdev^2/6*100, digits= 2) # imp rel
fit$loadings # pesos (weights)
fit$scores # puntuaciones - valores CP
cor(datos, fit$scores) # cargas
rowSums(cor(datos, fit$scores[, 1:2])^2) # comunalidad
1-rowSums(cor(datos, fit$scores[, 1:2])^2)# especifidad
source('prinfact.R')
sol = prinfact(datos, 6) #num CP
sol$loadings # Cargas
sol$scores # puntuaciones
sol$variances # imporancias
sol$eig$vectors[ ,1] # Pesos [CP1]
CORRPLOT
install.packages('corrplot') # descargar paquete
library(corrplot) # activar paquete
r = cor(dat)
corrplot(r, method = 'ellipse')
|
|