Please enable JavaScript.
Coggle requires JavaScript to display documents.
ANLISIS DE CONGLOMERADOS, image, image, image, image - Coggle Diagram
ANLISIS DE CONGLOMERADOS
FORMACIÓN DE LOS GRUPOS:ANÁLISIS JERÁRQUICO DE CONGLOMERADOS
Método del centroide
hclust.centroide<-hclust(matriz.dis.euclid2,method="centroid")
hclust.centroide data frame(hclust. centroide [2:1])
Método del vecino más cercano
Distancia entre 2 miembros de los grupos más cercanos
Cálculo de las distancias y de los centroides
hclust
Método de la vinculación promedio
Distancia promedio entre todas las combinaciones posibles de pares de observaciones
Método de Ward
Maximiza la homogeneidad dentro de cada conglomerado
hc_ward<- hclust (dist_matrix, method="ward.02")
SELECCIÓN DEL NÚMERO DE CONGLOMERADOS
Número de clusters
Se realiza el análisis k-means
Se determina el tamaño de los clusters y sus centros
Hace el WCSS para medir la variabillidad dentro de cada cluster
Between SS da la proporción de variabilidad total entre los clusters
FORMACIÓN DE LOS GRUPOS:ANÁLISIS NO JERÁRQUICO DE CONGLOMERADOS
kmeans.caso3.1 <-kmeans(DatosCso3.1b,2) Se fectúa el clustercon método centroide
library(psuch) fit.inversion<-aov (inveersion kmeans.caso3.1.cluster,
sumary (fit.inversion)
Función kmeans (stats)
TIPOS DE ESCALAMIENTO MULTIDIMENSIONAL
El MDS no es una única técnica
Los elementos que permiten diferenciarlas son:
número de matrices de aproximidades
la forma de las mismas
cuadradas
rectangulares
si el algoritmo contempla o no ponderaciones
La combinación de estos elementos da lugar a la tipología
Escalamiento multidimensional clásico
Existen dos tipos de CMDS en función de como sean las medidas de similaridad
CMDS métrico
las medidas de similaridad sin de intervalo o de razón
CMDS no métrico
el nivel de medida de las variables es ordinal
Escalamiento multidimensional ponderado
WMDS (Weighted Multidimensional Scaling
deriva un mapa de estímulos común a los individuos y equiparable al CMDS
Sin embargo, con esta técnica se obtiene un espacio adicional asociado a cada individuo
donde aparece la ponderación que cada uno de ellos atribuye a las dimensiones obtenidas
Escalamiento multidimensional clásico desdoblado
se le conoce como CMDSU (Classical Multidimensional Scaling Unfolding)
se utiliza datos de preferencia, es decir, cuanto más bajo es el número, mayor es la asociación del atributo con la marca
Análisis de Correspondencias
Sirve para analizar tablas de contingencia
Frecuencia de ocurrencia de diferentes categorías de dos variables cualitativas
Objetivos
Visualización de las relaciones entre categorías de las variables CUALITATIVAS
Comparación ce categorías
Da como resultado
Representación gráfica de las relaciones entre las filas y las columnas de la tabla en un plano bidimensional
donde:
U es una matriz I×I cuyos columnas son los vectores singulares izquierdos.
D es una matriz diagonal I×J con los valores singulares en la diagonal.
V es una matriz J×J cuyos columnas son los vectores singulares derechos.
Etapas
Preparación de la tabla de contingencia
Cálculo de frecuencias relativas
Cálculo de perfiles:
Cálculo de distancias::
Descomposición en valores singulares:
Representación gráfica:
Supongamos que tenemos una tabla de contingencia N de tamaño I×J, donde I es el número de filas y J es el número de columnas.
Matrices de proporciones y márgenes
ESCALAMIENTO MULTIDIMENSIONAL
Es una tecnica de reducción de datos
Análisis de componentes principales
Su objetivo
es representar N objetos en un espacio dimensional reducido
q dimensiones, siendo q<N
La distorsión causada por la reducción de la dimensionalidad
sea la menor posible
es conseguir que ambas configuraciones dimensionales
sean lo mas parecidas posibles
para esto se necesita
construir un indacor de esa próximidad
ANALIS DE COMPONENTES PRINCIPALES
Se analiza la interpretación geométrica del análisis de componentes principales para proceder al modelo matemático.
Se analizan las correlaciones entre las componentes y las variables originales.
Transforma un conjunto de variables en un nuevo conjunto de componentes principales no correlacionadas, ordenadas por la cantidad de información que contienen.
En resumen, el PCA es una técnica que nos ayuda a simplificar datos complejos, reduciendo el número de variables mientras intentamos mantener la mayor cantidad de información posible. Por medio de nuevas variables llamadas COMPONENTES PRINCIPALES (DIM 1 O DIM 2)
Análisis de Conglomerados
Segmentar una base de datos de clientes según sus características
Objetivo
Dividir a los clientes en subgrupos
que sean internamente homogéneos
y externamente heterogéneos
Secuencia lógica para efectuarlo
Recopilación de datos
Medición de (di)similaridad
Formación de grupos
Descripción de grupos
Medidas de Similaridad para Variables Métricas
Distancia
euclídea
Distancia euclídea al cuadrado
Medidas de similaridad para datos binarios
Distancia de Minkowski
:
Distancia Manhatthan
Estandarización de datos
se puede comprobar que todas ellas están basadas en la sustracción,
Si se analizan con detenimiento las medidas de distancia presentadas en apartados anteriores,
z
ANALISIS DE CORRESPONDENCIA
OBJETIVO es reducir la dimensionalidad de los datos y representar las relaciones entre categorías de múltiples variables en un espacio de menor dimensión, usualmente en dos dimensiones, para facilitar su interpretación visual.
Explorar la estructura de los datos categóricos en encuestas y estudios de mercado.
Es una técnica estadística para explorar y visualizar relaciones entre variables categóricas, facilitando la interpretación de datos complejos en un espacio de menor dimensión. Es útil en campos como marketing, sociología y medicina para analizar encuestas y segmentar mercados.