Please enable JavaScript.
Coggle requires JavaScript to display documents.
ANÁLISIS MULTIVARIANTE CON R, En R STUDIO, boxplot(datos, main="…
ANÁLISIS MULTIVARIANTE CON R
ANALISIS MULTIVARIANTE APLICACION CON R
ESCALA
NOMINAL
Asigna números como etiquetas a
características
No representa magnitudes ni jerarquías solo distingue entre valores
ESCALA
ORDINAL
Distingue entre valores y establece
un orden, como al ordenar modelos
análisis multivariante
aborda la complejidad de los
fenómenos estudiados
Comprension mas profunda entre multiples variables
herramienta crucial
Escala de
Intervalo
-Cuantitativa
-Orden entre categorías
técnicas estadísticas
programas más accesibles.
aplicación práctica en diferentes
campos de estudio
**
VALORES PERDIDOS
Conjunto de Datos
Desconocidos
Incorrectamente introducidos
Sin recopilar
Ocacionan
Disminucion de representatividad de la muestra
Tipos
MCAR
MAR
MNAR
Metodos para manejarlo
Imputacion
Modelado de seleccion
Eliminacion de casos por parejas
OUTLIERS EN R
errores de medición
Diagrama de cajas
Diagrama de dispersion
Medidas Estadisticas
Desviación estándar
Distancia de Cook
DFFITS
IDENTIFICACION
BLOXPOT
boxplot(data$variable)
HISTOGRAMAS
hist(data$variable)
GRAFICOS DE DISPERSION
plox(data$x, data$y)
PUNTAJES DE Z
z_scores<-scale(data$variable) outliers<-data$variable[abs(z_scores)>3]
MANEJO
ELIMINAR OUTLIERS
clean_data<-data[!(data$variable%in%outliers),]
TRANSFORMACION LOGARITMICA
data$log_variable<-long(data$variable)
IMPUTACION DE LA MEDIA
data$variable[data$variable%in%outliers]<-median(data$variable, na.rm=TRUE)
DETECCIÓNDE
OUTLIERS
PAQUETE OUTLIERS
FUNCIÓN
BOXPLOT ()
FUNCIÓN IDENTIFY ()
MÉTODOS ROBUSTOS
VIZUALIZACIÓN
Gráficos de violín
Gráficos de dispersión con puntos coloreados
según la distancia a la media
DISEÑO DE ENCUESTAS
Elementos
Formato de preguntas
datos$tipo_pregunta <- factor(c("Abierta", "Cerrada"))
Redacción de las preguntas
library(stringr)
longitud_preguntas <- str_length(datos$pregunta)
Presentación visual
library(ggplot2) ggplot(datos, aes(x = pregunta, y = respuesta)) + geom_bar(stat = "identity")
Esfuerzo para responder
library(dplyr)
tiempo_promedio <- datos %>% summarise(tiempo = mean(tiempo_respuesta))
Plan analítico
resultados <- svymean(~respuesta, diseno)
summary(resultados)
Medio para recopilar datos
datos <- data.frame(pregunta = c("Pregunta 1", "Pregunta 2"), respuesta = c("Respuesta A", "Respuesta B"))
Precisión de la información
diseno <- svydesign(ids = ~1, data = datos, weights = ~peso)
INTRODUCCIÓN A R
Facilita el análisis de datos y la programación estadística
Instalación y Configuración
Descargar e instalar
Configuración inicial
Interfaz de Usuario
Panel de scripts
Consola
Entorno
Panel de archivos
Funcionalidades Clave
Script
Markdown
Proyectos
Bibliotecas (Packages)
Fuente abierta (Open Source)
NOCIONES BÁSICAS DE ÁLGEBRA DE MATRICES (MATRICES Y VECTORES)
Matrices y determinantes
Número escalar asociado a una matriz cuadrada
Propiedades
Si det(A)=0, la matriz no tiene inversa.
Se calcula a partir de los elementos de la matriz
determinante <- det(matriz)
Valores y vectores propios
Valores Propios
Indican los factores de escala para los vectores propios
Vectores propios
Vectores que no cambian de dirección al ser transformados por la matriz
MATRICES VECTORES OPERACIONES
MATRIZ
líneas
verticales y horizontales
Sistema de ecuacion de lineal o diferencial representa una aplicacion lineal
conjunto bidimensional de
números o símbolos distribuidos
VECTORES
son fundamentales en operaciones matriciales, como multiplicar una matriz por un vector columna para producir otro vector columna.
APLICACION DE MATRICES
Son ideales para representar graficamente
Se utilizan matrices para programar
robots
ANÁLISIS MULTIVARIANTE EN R
Importancia
Mediciones más precisas
Análisis de componentes prinicipales
Librerías:(psych),(corrplot)
Análisis de conglomerados
Algoritmo de Clústeres:
Utilizamos el método de K-medias
Análisis discriminante
Lineal
Cuadrático
OUTLIERS Y APLICACION EN R
Datos que se desvian significativamente
distorsionar los resultados
Concluisones Eroneas
Causados por
errores de medición
errores de codificación
naturaleza de los datos
Identificar por
GRAFICOS
Diagrama de dispersion
Diagrama de cajas
Medidas Estadisticas
Desviación Estandar
Distancia de Cook:
DFFITS (Distancia al valor predicho estandarizado)
Tratamiento en R Studio
Eliminarlos
La más PELIGROSA
datos_limpios <- datos[!(datos < limite_inf | datos > limite_sup)]
Reemplazarlos IMPUTAR
Un valor cercano Mediana o Moda
datos_imputados <- ifelse(datos < limite_inf | datos > limite_sup, media_datos_limpios, datos)
Transformar los datos
Por ejemplo a una escala LOGARíTMICA
datos_transformados <- log(datos)
COMPROBACIÓN DE LOS SUPUESTOS BÁSICOS DEL ANÁLISIS MULTIVARIANTE
Normalidad
Distribución de los datos de forma simétrica
CRAMER-CON MISES: Función:cvm.test.Paquete: goftest
KOLMOGOROV-SMIRNOV:
Función: ks.test().Paquete:stats
TEST DE SHAPIRO-WILK: Función: shapiro.test().Paquete:stats
ANDERSON DARLING: Función: ad.test().Paquete: nortest
Linealidad
Para ver la regresión lineal: abline(reg1,col="blue")
Homoscedasticidad
Residuales<- Modelo Residuals
En R STUDIO
sum(is.na(x)):
Cuenta cuántos valores perdidos hay en el vector
na.omit(x):
Elimina filas que contienen valores perdidos en X
boxplot(datos, main="Boxplot de Datos", ylab="Valores")
det(A)= 0
det(A)=det(A^t)
x.