Please enable JavaScript.
Coggle requires JavaScript to display documents.
Curso AI & DATA - Coggle Diagram
Curso AI & DATA
ESTADISTICA APLICADA A LOS DATOS
¿QUE ES LA ESTADISTICA?
Disciplina encargada de la recolección, análisis, interpretación, presentación y organización de datos.
Su objetivo principal es comprender y describir fenómenos, variaciones y tendencias en datos cuantitativos o cualitativos.
CONCEPTOS CLAVE
POBLACION
Conjunto total de elementos que comparten una característica de interés
MUESTRA
Subconjunto representativo de la población
VARIABLE
Cualquier característica que puede medirse u observarse
TIPOS DE ESTADISTICA
ESTADISTICA DESCRIPTIVA
Se encarga de resumir y presentar los datos mediante tablas, graficos y medidas estadísticas(media, mediana, etc.)
ESTADISTICA INFERENCIAL
Permite extraer conclusiones o generalizaciones sobre una población a partir de una muestra representativa.
TIPOS DE VARIABLES
CUALITATIVAS
SUBTIPOS
Nominales
Ordinales
EJEMPLO
Color
Genero
Nivel educativo
CUANTITATIVAS
SUBTIPOS
Discretas
Continuas
EJEMPLO
Edad
Temperatura
Ingresos mensuales
MEDIDAS DE TENDENCIA CENTRAL
MEDIA
Promedio aritmético de los datos
Aplicación útil en datos numéricos continuos
MEDIANA
Valor central de un conjunto ordenado
Aplicación útil en datos con valores extremos
MODA
Valor que mas se repite en un conjunto
Aplicación útil en datos categóricos o discretos
APLICACIONES DE LA ESTADISTICA
Economía y negocios
Ingeniería y tecnología
Educacion
Ciencias naturales y sociales
Ciencias de salud
Toma de decisiones en la vida cotidiana
MEDIDAS DE TENDENCIA CENTRAL
Estadísticas que representan el valor medio o típico de un conjunto de datos
Las mas comunes son
Promedio(Media)
Se calcula sumando todos los valores y dividiendo por la cantidad de datos
Formula
Media = Σvalores/n
Ejemplo
Datos: 85, 90, 76, 88,92
Suma: 85 + 90 + 76 + 88 + 92 = 431
Cantidad de datos: 5
Media: 431 / 5 = 86,2
Mediana
Es el valor central de los datos ordenados
Si hay un numero impar de datos es el del medio
Si hay numero par se promedian los dos del centro
Ejemplo
Datos: 85, 90, 76, 88, 92
Ordenados: 76, 85, 88, 90, 92
Mediana: 88
Notas sobre la mediana
Útil para distribuciones asimétricas
Se usa principalmente con variables cuantitativas
Tambien puede usarse con variables cualitativas ordinales
No se ve afectada por valores extremos
Moda
Es el valor que mas se repite en un conjunto de datos
Puede haber
Una sola moda
Varias modas(bimodal o multimodal)
Ninguna moda
Ejemplo
Datos: 85, 90, 85, 88, 92
Moda: 85 aparece 2 veces
TABLAS DE FRECUENCIAS
Permiten organizar los datos de manera sistemática para obtener información rápida y precisa, útil para descripción y análisis
TIPOS DE FRECUENCIA
FRECUENCIA ABSOLUTA(fi)
Es la cantidad de veces que aparece un valor especifico en el conjunto de datos.
Propiedad
Σfi = N (Total de observaciones)
FRECUENCIA RELATIVA(fri)
Es la proporción que representa cada valor respecto del total.
Formula
fri = fi/N
Propiedad
Σfri = 1
Redondeo
Hasta dos cifras decimales(centésimos)
FRECUENCIA RELATIVA PORCENTUAL(%)
Es la frecuencia relativa expresada en porcentaje
Formula
fr% = fri * 100
Propiedad
Σfr% = 100%
FRECUENCIA ABSOLUTA ACUMULADA(Fi)
Suma acumulada de las frecuencias absolutas hasta cierto valor
Se construye sumando progresivamente cada frecuencia
Propiedad
Fi final = N
No se usa con variables cualitativas (no numéricas)
EJEMPLO PRACTICO
Estudiantes y cantidad de veces que fueron al cine el ultimo mes
Datos: 2, 3, 0, 1, 5, 3, 2, 3, 0, 0, 2, 1, 2, 1, 0, 2, 1, 1, 1, 3, 4, 0, 0, 2, 1
Total de datos: 25 alumnos
Se elabora una tabla de frecuencias con columnas
Valor de la variable (xi)
Frecuencia absoluta (fi)
Frecuencia relativa (fri)
Frecuencia porcentual (%)
Frecuencia acumulada (Fi)
Interpretación de la tabla de frecuencias
Preguntas posibles
¿Cuántos alumnos fueron encuestados?
25
¿Cuántos fueron 3 veces al cine?
Se revisa fi correspondiente
¿Cuál es la variable en estudio?
Cantidad de veces que se fue al cine
¿Qué fracción fue 2 veces?
Se usa fri
¿Qué porcentaje fue una sola vez?
Se usa fri%
¿Cuántos alumnos fueron a lo sumo 2 veces?
Se consulta la frecuencia acumulada de 2
EJEMPLO CON VARIABLE CUALITATIVA
Encuesta sobre gaseosas mas vendidas en un comercio
Variable: Marca de gaseosa(Coca-Cola, Fanta, Sprite, Pepsi)
Se elabora tabla con
Valor (xi)
Frecuencia absoluta (fi)
Frecuencia relativa (fri)
Porcentaje (fr%)
No se usa frecuencia acumulada en este caso por tratarse de variable cualitativa
ETAPAS PARA IMPLEMENTAR EL ANALISIS DE DATOS EN UNA ORGANIZACION
Evaluar las necesidades de la organizacion
Definir objetivos
Seleccionar herramientas adecuadas
Capacitar al equipo
Integrar el análisis a los procesos
Medir los resultados obtenidos
INTRODUCCION A MICROSOFT EXCEL Y FORMULAS
QUE ES UNA FORMULA
Expresión matemática o lógica que realiza cálculos o devuelve un valor.
Se compone de
FUNCIONES
Cálculos predefinidos (ej Suma(), promedio())
ARGUMENTOS
Valores o referencias que la función necesita
RANGOS
Conjunto de celdas usadas como argumentos(pueden ser una fila, columna o matriz)
Separadores de argumentos
Excel en español: coma ,
Excel en ingles: punto y coma ;
TIPOS DE DATOS COMUNES
INTEGER
Números enteros
FLOAT
Números con decimales
STRING
Texto(letras, simbolos)
BOOLEAN
Valores lógicos: Verdadero/Falso
PREPARACION DE DATOS PARA ANALISIS
ARCHIVOS .CSV
Compatible con excel, R, Python, SQL, etc
Puede transformarse a .xlsm(formato de excel con macros)
Formato común para bases de datos: valores separados por comas.
HERRAMIENTAS UTILES
Text to Columns(Texto en columnas): Separa contenido de una celda en varias.
Copiar formato: mantiene estilo y formato entre celdas
FUNCIONES DE TEXTO
LEN()
Largo de una cadena de texto
LEFT()
Extrae caracteres desde la izquierda
RIGHT()
Extrae caracteres desde la derecha
MID()
Extrae una parte del texto desde el medio
FIND()
Encuentra la posición de un carácter
CONCAT()
Une varios textos en uno solo
FORMATO DE CELDAS
Tipos comunes de formato
Números
Texto
General
Fechas
BUENAS PRACTICAS
NESTEAR FUNCIONES(ANIDAR)
Escribir funciones dentro de otras
Se recomienda probarlas por separado primero y luego integrarlas
COLUMNAS AUXILIARES
En vez de anidar muchas funciones juntas, crear una columna auxiliar por función
Se pueden ocultar para mantener la hoja ordenada
ORDENAR Y FILTRAR DATOS
MANUALMENTE
Usa la herramienta filtro para seleccionar y ordenar
AUTOMATICAMENTE(con funciones)
FILTER()
Filtra datos según una condición
UNIQUE()
Devuelve valores únicos de un rango
solo esta disponible en excel microsoft 365 y excel 2021
RANGOS Y TABLAS
Podes insertar y nombrar rangos fijos para usarlos fácilmente en formulas
Se pueden crear tablas con nombre, lo que mejora legibilidad y el análisis
PROCESAMIENTO DE DATOS
El análisis comienza entendiendo que se quiere saber
A partir de los datos útiles, se aplican funciones para obtener información y conclusiones claras
FUNCIONES BASICAS EN EXCEL
FUNCIONES DE CALCULO
SUM()
SUMA()
Suma valores
IF()
SI()
Condición lógica
SUMIF()
SUMAR.SI()
Suma valores que cumplen una condición
AVERAGE()
PROMEDIO()
Calcula el promedio
COUNT()
CONTAR()
Cuenta celdas con números
COUNTA()
CONTARA()
Cuenta celdas no vacias
MAX/MIN
Máximo y mínimo
ROUND()
REDONDEAR()
Redondea a un numero especifico
ROUNDUP()
REDONDEAR.MAS()
Redondea hacia arriba
ROUNDDOWN()
REDONDEAR.MENOS()
Redondea hacia abajo
ABS()
Valor absoluto
FUNCIONES DE BUSQUEDA Y REFERENCIA
INDEX()
INDICE()
Devuelve el valor de una celda especifica
MATCH()
COINCIDIR()
Devuelve la posición de un valor en un rango
VLOOKUP()
BUSCARV()
Busca datos virtualmente
OFFSET()
DESREF()
Devuelve una celda desplazada desde una base
FUNCIONES DE FECHA
MONTH()
MES()
Devuelve el numero del mes
YEAR()
AÑO()
Devuelve el año
DAY()
DIA()
Devuelve el día del mes
EOMONTH()
FIN.MES()
Ultimo día del mes
HOUR()
HORA()
Devuelve la hora
WEEKDAY()
DIASEM()
Dia de la semana
DATE()
FECHA()
Crea una fecha a partir de día, mes, año
DATEVALUE()
FECHANUMERO()
Convierte una fecha en numero serial
BUENAS PRACTICAS
INDEPENDENCIA DEL USUARIO
Hacer hojas fáciles de usar y difíciles de romper:
Protección de celdas
Hojas de instrucciones claras
Validación de datos
FORMULAS DINAMICAS
Usan criterios de búsqueda en lugar de posiciones fijas
Hacen las hojas mas flexibles y reutilizables
DATA VALIDATION(Validación de datos)
Listas desplegables con rangos de variables
Definir valores permitidos para evitar errores al ingresar datos
VISUALIZACION DE DATOS
FORMATO CONDICIONAL
Resalta celdas automáticamente según criterios definidos (ej: colores para valores altos/ bajos)
GRAFICOS BASICOS
BAR GRAPH
Compara categorias
LINE GRAPH
Mostrar evolución en el tiempo
PIE CHART
Mostrar proporciones o porcentajes
SCATTER PLOT
Visualizar relaciones entre dos variables
INTRODUCCION A BASES DE DATOS
QUE ES UNA BASE DE DATOS
Sistema organizado para almacenar, gestionar y recuperar información de manera eficiente
Conjunto de datos relacionados, almacenados de forma sistemática
El objetivo es facilitar el acceso y la administración de la información
QUE ES UN SISTEMA DE GESTION DE BASE DE DATOS (SGBD)
Software que permite crear, administrar y manipular bases de datos
Sus funciones principales incluyen:
Crear estructuras(tablas, esquemas, índices )
Ingresar y consultar información
Asegurar integridad y consistencia
Controlar accesos y permisos
Gestionar múltiples usuarios simultáneamente
La base de datos almacena los datos; el SGBD los gestiona
CARACTERISTICAS BASICAS DE UNA BASE DE DATOS
Organización
Datos estructurados y ordenados
Accesibilidad
Fácil acceso y recuperación de la información
Consistencia
Datos correctos y coherentes
Escalabilidad
Capacidad de crecer sin perder rendimiento
Persistencia
Datos almacenados de forma permanente
FUNCIONES PRINCIPALES DE UN SGBD
Almacenar y recuperar información
Consultas rápidas y eficientes
Gestionar transacciones
Garantiza que las operaciones se completen correctamente(atomicidad)
Definir y organizar datos
Estructura de tablas, relaciones, claves, etc
Proporcionar seguridad
Control de accesos y protección ante fallos
Permitir concurrencia
Varios usuarios pueden trabajar a la vez sin conflictos
TIPOS DE BASE DE DATOS
SEGUN SU VARIABILIDAD
ESTATICAS
No se actualizan frecuentemente
DINAMICAS
Se actualizan constantemente
SEGUN SU ALMACENAMIENTO
LOCALES
Almacenadas en servidores propios o equipos locales
EN LA NUBE
Alojadas en servidores externos accesibles por internet
SEGUN SU MODELO DE DATOS
RELACIONALES (SQL)
Usan tablas con relaciones ej: MySQL, PostgreSQL
NO RELACIONALES (NoSQL)
Usan documentos, grafos, pares clave-valor, etc. ejemplo: MongoDB, Redis
QUE SON LOS DATOS
Mediciones u observaciones que se recopilan como fuente de información
Fragmentos individuales que describen algo especifico
No brindan contexto, son valores aislados
Pueden ser números, símbolos, caracteres o palabras
DIFERENCIA ENTRE DATOS E INFORMACION
DATOS
Elementos aislados sin contexto
INFORMACION
Conjunto de datos organizados que permiten comprender una situación
Se utiliza para
Tomar decisiones
Prever escenarios futuros
Optimizar recursos
QUE ES EL ANALISIS DE DATOS
Disciplina que aplica procesos de
Transformación
Visualización
Extracción
Útil para generar información útil, construir conclusiones y apoyar la toma de decisiones
TIPOS DE DATOS
SEGUN SU NATURALEZA
CUANTITATIVOS
Se pueden medir numéricamente
Discretos
Números enteros
Continuos
Valores dentro de un rango
CUALITATIVOS
Describen cualidades, no se expresan numéricamente
Nominales
No tienen orden
Ordinales
Tienen orden, pero sin diferencia medible
SEGUN SU ESTRUCTURA
Estructurados
Organizados(tablas, bases de datos, excel)
No estructurados
Sin formato fijo(texto, audio, imágenes, videos)
IMPORTANCIA DE LOS DATOS EN LAS ORGANIZACIONES
Los datos son un activo estratégico clave, Bien utilizados, permiten
Tomar decisiones basadas en hechos
Anticiparse a problemas
Conocer procesos en profundidad
Optimizar recursos
Incrementar la productividad