Please enable JavaScript.
Coggle requires JavaScript to display documents.
Análisis de datos (Nivel 2 (Lección 5 (Herramientas estádisticas (Medidas…
Análisis de datos
Nivel 2
Lección 1
1.Diagramas y modelos
Pueden ser
Gráficos
Escritos
Matemáticos
Caracteristicas
Explicitos
Verificables
Repetibles
Pasos
Escribir la pregunta
Escribe las variables relacionadas
Agrupar las variables en grupos
Las que tienes
Las que puedes obtener
Las que no puedes obtener
4.Realizar diagrama de pares con las variables relacionan directa e indirectamente
Hacer un diagrama relacionando todas las variables
Construcción de modelos matemáticos
Mediante
Lenguaje Algebraico
Variables tangibles o fisica
Intangibles o abstractas
Delimitación de variables:
Lee el texto
Identifica variables
Verifica delimitación
Palabras clave
Expresiones algebraicas
Método de comparación
Sirve para contrastar una información con otra de la misma naturaleza
Encontrar patrones de comportamiento
Tendencias
Se puede aplicar cuando tengas datos del mismo tipo
Son necesarios datos cuantitativos resumidos
Método de diagnóstico
#
Sirve para datos cualitativos
Pasos:
Enlistar tu información
Poner en las columnas cada una de las hipotesis
Evaluar la posibilidad de que la información valide cada hipotesis
Elimina la información que es igual para todas la hipotesis
Suma los símbolos y toma la teoría más fuerte
Ventajas:
Puedes agregar información conforme la vayas obteniendo
Es relativamente más rápido que hacer calculos
Desventajas:
Es subjetivo
Lección 2
Métodos de optimización lineal
A través de la programación lineal
Permite describir aumentos o disminución de una variable (proporcionalmente)
Pasos:
Especificar objetivo y uso del recurso
Definir datos del problema
Variables
Definir los que puedes cambiar
Restricciones
Los que no puedes cambiar
Plantear función objetivo
Variable1
Restricción1+ Variable2
Restricción2= Resultado (P)
Calculo de optimización con hoja de calculo
Solver
Calculo de optimización con software
Calculo de optimización con lenguaje de programación
Python
Lección 3
Métodos Heurísticos
Método de análisis entre la intuición y la optimización
Basado en la experiencia de las personas y en las variables que conoce
Sirve para responder preguntas donde no tienes acceso a datos
Procedimiento
Pensamiento de Causa Efecto
Encontrar objetivo
Definir las variables que se relacionan con este
Haz un mapa tipo causa efecto
Se crean ramificaciones
5.Las preguntas se resuelven mediante las variables que tienen
Aplicaciones
Análisis de uso de un sitio web
Detección de virus y malwares
Reglas
El modelo debe funcionar no importa la complejidad de este
La redacción debe ser minuciosa
Arboles de decisión
Diagramas
Repiten consecutivamente funcione IF-Then que reflejan la causa efecto que se origina a través de una decisión
Ventajas
Facilita la retro alimentación
Pasos:
Identificar lo eventos que componen el problema
Priorizar cuales son indispensables y cuales son omisibles
Enumerar los eventos por orden de importancia
Definir variables por cada evento
Determinar los agentes que actúan en cada evento
Realizar un árbol por cada evento
¿Que puede pasar si este evento sucede?
Lección 4
Visualización multivariable
Se puede observar:
Si los valores promedios superan a los esperados
Cuantos están por encima del promedio real
Que set de datos tiene mejores resultados
Ventajas
Los datos son más utiles
Muestra distintas variables al tiempo
Despliega todos los datos
Para comparar dos o más variables
Elaboración de datos de dispersión con software
Mediante datos .csv o .txt
Se visualiza como tabla
3.Elaboración de datos de dispersión con lenguaje de programación
Necesitas:
Bibliotecas panda
Archivos .csv
Python
Pasos:
1.Declarar las variables
importar y guardar tus fuentes de datos
3.Selecciona y guarda los datos que usaras en el programa
Saca los promedios de cada una de las variables de los set de datos.
Lección 5
Probabilidades subjetivas
Transición para trabajar con números en vez de con las opiniones de las personas
Mide la probabilidad basada en la experiencia, la intuición y la opinión de las personas
Es recomendable cuando se tiene un equipo con diversas opiniones y se necesita obtener una visión grupal de cada individuo
Pasos:
Enlistar las sentencias que quieran comprobar en forma de afirmación o negación
Enlistar a cada uno de los involucrados en el tema en una hoja de calculo
Colocar las sentencias como encabezado en la hoja de calculo
Realizar encuesta. ¿Cuál es la probabilidad que el evento ocurra?
Expresado en porcentaje
5.Guardar el archivo en formato .csv
Construir un gráfico de ddispersión
Herramientas estádisticas
Es una ciencia que ocurre, evidencia y clasifica datos para encontrar sus correlaciones
Describen la ocurrencia de un evento según varias condiciones
Puede ser:
Descriptiva
Inferencial
Medidas de tendencia central
Media aritmética
Media ponderada
Media geometrica
Media armonica
Mediana
Moda
Medidas de dispersión
Varianza
Desviación estandar
Análisis por regla de Bayes
Se aplica cuando se obtiene una probabilidad de una hipótesis como base que con el tiempo puede ser alimentado con otra información
Permite agregar nuevos datos a un análisis establecido
Está compuesto por 5 elementos:
Probabilidad que la hipótesis suceda
Probabilidad que la hipótesis no suceda
Probabilidad que se presente un suceso dado que la hipótesis sea cierta
Probabilidad que se presente un suceso dado que la hipótesis sea falsa
Su objetivo es obtener la probabilidad de que la hipótesis se cumpla dado la existencia de un cierto suceso
Análisis por histograma
Es un grafico en forma de barra
Contiene datos vs ocurrencia (Numero de datos en cada grupo)
Se aplica cuando quieres observar una tendencia de datos
Distribuciones
Uniforme
Gumbel
Binomial
Poisson
Cálculos estadístico con software
Cálculo estadístico con lenguaje de programación
Lección 6
Análisis por regresión lineal
Sirve para marcar la línea de tendencia que resulte de los datos establecidos
Correlación
Grado de dependencia de una variable sobre la otra en un grafico de dispersión
Puede ser:
Inversa
Cuando una variable aumenta, la otra disminuye
Directa
Si una variable aumenta, la otra también aumenta
Coeficiente de correlación:
r
Covarianza
Grado de variación que existe entre dos variables
Busca obtener un modelo matemático para relacionar dos variables
Basado en la ecuación de la recta
y= mx+b
Nivel 1
Lección 1:
Procesos de trabajo:
Definir una necesidad
Tomar los datos disponibles y adquirir otros
Estudiarlos y transformarlos en conocimiento
Evaluar las conclusiones
5.Tomar o recomendar una decisión que cubra la necesidad
Etapas de un análisis de datos:
Proceso básico de análisis
Define el problema
Divide el problema en partes
3.Evalua la solución antes del analisis
Decide la mejor opción
Reporte
La metodología usada
La interpretación de los datos
Recomendación personal
Confidencialidad de la información
Garantía de la información para no ser
Divulgada
Reproducida
Modificada
Medidas
Clausulas de confidencialidad
Contraseñas
Software de cifrado de datos
Medidas de seguridad y salud laboral
Medidas preventivas
Hábitos laborales
Lección 2:
Obtención de los datos necesarios para el analisis
2.Definir el método de analisis
1.Responder a las preguntas detalladas
3.Definir variables
Cualitativos
Ordinales
Nominales
Cuantitativos
Manejo de datos en hojas de cálculo
3.Manejo de datos en base de datos relacional
Información que se puede exportar
Tabla
2.Resultado de una consulta
La información completa
Creación de encuestas observacionales
Sirven para
Obtener datos
Definir causalidad
Se debe analizar los factores de confusión
Considerando
Pedazos
Dividir en grupos
Aleotoriedad
Tomar al azar
Lección 3
Limpieza de datos
Identificar información incorrecta, corregirla o eliminarla
Problemas comunes
De formato
Espacios en blanco
Datos ausentes
Inconsistencias en los datos
Estrategias
Mantener datos originales guardados
Revisar formatos de los campos
Verificar que la información cumpla con los datos y el formato
Características del software de limpieza de datos
Guarda un historial de movimientos que te hará regresar a un punto anterior
Utiliza un buscador editable por columna que aglomera categorías para posteriormente editarlas
Junta categorías en grupos con el fin de tener información más consistente y ordenada
Trabaja con un lenguaje de programación avanzado para transformar información no estructurada a estructurada
Limpieza de datos estructurados
Limpiador de datos
Open Refine
Limpieza de datos no estructurados
Uso de expresiones regulares
Buscador de expresiones
5.Programación de expresiones regulares
Python
Archivo de texto
Librería "Re"
Python
Nivel 3
Lección 1
Ajustes al modelo de regresión lineal
¿Qué tan preciso es el modelo?
El modelo puede usarse para:
Interpolar
El modelo da la información en el rango de datos originales
Extrapolar
Para inferir modelos que no han sucedido
Limitantes de un modelo de regresión lineal:
Distribución residual
Dispersión de los datos
Mide que tanto se alejan los puntos de la línea recta
Rango de error
Diferencia de 1 o varios puntos con respecto al modelo
Un error grande permite inferir que el modelo no es confiable
Se mide como error cuadrático medio
Desviación estandar
Confiabilidad
Se puede dividir la gráfica para analizar por partes la confiabilidad del modelo
Ajustar al modelo con software
Función segment
Ajustar al modelo con lenguaje de progrmación
Bibliotecas
Numpy
Matplotlib
Statsmodels
Pandas
Math
Leccion 2
Conclusiones de un analisis
Después de un análisis exhaustivo
Evalua
Decide
Etapas:
Mostrar el contexto del problema y como fue definido
Explicar la metodología y modelos
Explicar los modelos a detalle
Apóyate en gráficos
Recomendación
Para comunicar las conclusiones:
Ser conciso, directo y profesional
Usar las palabras adecuadas
Muestra gráficos contundentes que expresan mucha información en una vista
No poner datos del proceso de analisis
Elaboración de un reporte de resultados
Sirve para dar tus recomendaciones sobre las acciones que deben darse
Se compone de:
Planteamiento del problema
Interpretación de los datos
Recomendaciones
Elaboración de presentaciones ejecutivas
Pasos:
Preparación de la presentación
Estructura de la presentación
Introducción
En el desarrollo
En conclusión
Presentación de resultados ante una audiencia
Antes de la exposición
Diseña
Prepara
Ensaya
Utiliza vestuario profesional
Durante la exposición
Elige tus palabras
Utiliza gestos abiertos
Enfatiza palabras clave
Mantén contacto visual con la audiencia
Sigue tu guión
Evita volver atrás en tus diapositivas
Después de la exposición
Dar Gracias
Abrir sesión de preguntas
Lección 3
Funcionamiento web
Existen herramientas para trasladar el análisis de datos a la web
Mediante dos posibilidades:
Hacerla del lado del cliente
Un framework analiza y procesa la información en la maquina del cliente
Del lado del servidor.
Mediante software especializado
Sólo despliega los resultados del análisis en la pagina web
Páginas Html
Permiten dar estructuras al texto o contenido de una página
Se dividen en:
Header
Están:
Referencias
Titulo
Ayudan a la interpretación del código Html
Body
Va el contenido principal de la página web
Es donde se despliega la información que se obtiene del servidor
Footer
Se escribe el pe de la página web y otro tipo de referencias que sirven para implementar librerias
Tienen:
Etiquetas
Delimitan el contenido de cada sección
Pueden tener
Subetiquetas
Como:
2 more items...
Sirven para identificar elementos de un mismo tipo de etiqueta
Funcionamiento de java script
Es un lenguaje de programación ligero
Interpretado por el motor del navegador
Orientado a objetos
Su función es brindar:
Dinamismo
Funcionalidad
Funciona mediante:
Librerias
Despliegue de datos en una pagina web
Framework de Javascript
Utiliza un modelo de anotación para Java
Te permite organizar información en forma de lista y objetos de programación
Pasos para usar un framework:
Asegurar el servicio de internet en pc
Importar la librería del framework al archivo Hmtl
Crear elemento Div con la clase conainer
Para especificar medidas y estilo
4.Crear archivo de JavaScript donde se implementaran las acciones del framework para desplegar graficas
Se configuran los elementos de la gráfica en forma de una estructura Json
Nivel 4
Lección 1
Preparación continua
Anticípate a los errores
Toma cursos que te evaluen
Permite retroalimentación
Cursos importantes
Toma de decisiones
Uso de técnicas estadisticas
Recolección y exploración de datos
Minería de datos
Machine learning
Libros
Análisis de datos con programación
Gráficos con R
Análisis aplicados a negocios
Lección 2
Otros métodos de analisis
Para problemas no lineales y de agrupamiento
Tipos:
Clustering
Para encontrar patrones de datos, dividiendo en subgrupos altamente relacionados
Clusters
Métodos de clustering:
K means
Expectation-maximization
Density-based
Jerarquico
Análisis no lineales
Cuando los datos no describan un patrón lineal
Lección 3
Indicadores clave de rendimiento (KPI)
Para negocio, organización o empresa
Varían por factores:
Economicos
Socioculturales
Para identificar los KPI se necesita:
Un proceso organizacional
Objetivos de negocios claros
Mediciones cuantitativas y cualitativas
Enfoque activo
Permiten verificar si los objetivos de la empresa se están cumpliendo
Pueden estar relacionados con
Productividad
Riesgo
Valor financiero
Confianza
Pasos:
Establece un estándar de lo que se concibe como performance con todos los involucrados
Recaudar los datos demográficos, psicográficos y de comportamiento que refieren la interacción de los clientes
Identifica, fraude, abuso y falta de información
Realiza un análisis de valor de vida del cliente, para calcular la rentabilidad de un cliente durante la vida útil de la relación
Costo- Beneficio
Realiza un banco de conocimiento