Please enable JavaScript.
Coggle requires JavaScript to display documents.
Teoria primer parcial PyE - Coggle Diagram
Teoria primer parcial PyE
unidad 3 (ajustamiento lineal y correlación)
análisis de regresión
técnica estadística utilizada para el modelado y análisis de la relación existente entre dos o mas variables.
concepto de ajustamiento
método de los mínimos cuadrados
método abreviado
caso inverso o variable espejo (Yi como variable independiente)
Teoría de la correlación lineal
tipos de correlación lineal
cálculo del coeficiente de correlación lineal
Cálculo de r a partir de las variaciones
Variaciones, variancias y errores estándar
variacion no explicada
variacion total
variacion explicada
relaciones entre la variaciones
Correlación y dependencia estadística
coeficiente de edeterminación
unidad 1 (conceptos preliminares)
definiciones básicas
muestra
muestreo
método estadístico que permite realizar investigaciones referidas a una población, finita o infinita, seleccionando una muestra representativa de ésta.
tipos de muestreo
Selección probabilística
se basa en asignar a cada elemento de la población una determinada probabilidad de ser incluido en la muestra. puede ser manual o automático.
Muestreo simple al azar (MSA)
para poblaciones de BAJA VARIABILIDAD. Es la forma mas simple. Consiste en seleccionar la muestra considerando que todos los elementos de la población tienen la misma probabilidad de ser seleccionados. procedimiento rápido y eficiente.
Muestreo estratificado
Para poblaciones con ALTA VARIABILIDAD. Consiste en dividirla en h estratos. Los cuales conforman grupos internamente homogéneos pero heterogéneos entre ellos y se selecciona una muestra de cada estrato. Permite asignar diferentes probabilidades da los distintos estratos.
Muestreo sistemático
Es conveniente cuando la población se encuentra ordenada en una secuencia. De no ser así es tan conveniente como el MSA
tamaño de la muestra
Margen de error o tolerancia (d)
a medida que crece el margen de error admitido, disminuye el tamaño de la muestra. Existe una relación inversa entre ellas
Tamaño de la población
el tamaño de la muestra debe crecer en el mismo sentido que el tamaño de la población, pero en una proporción que puede llegar a ser diferente
variabilidad de la población
el tamaño de la muestra deberá aumentar si los elementos de la población comienzan a diferenciarse entre ellos cada vez mas.
variable
cuantitativas
discretas
continuas
cualitativas
población
Estadística
comprende la recolección, ordenamiento, presentación y resumen de datos, para posteriormente efectuar el análisis, extraer conclusiones y tomar, sobre esta base, decisiones.
método científico
unidad 2 (estadística descriptiva)
Cuadro de distribución de frecuencias
Amplitud o tamaño del intervalo de clase (c)
Punto medio del intervalo de clase (xi)
Verdadero límite o límite real del intervalo de clase (VL)
Si la variable es continua, los verdaderos límites coinciden con los límites inferiores.
Frecuencia acumulada creciente o "menor que"
Límite superior del intervalo de clase (LS)
Frecuencia relativa (hi)
Límite inferior del intervalo de clase (LI)
Frecuencia relativa acumulada (Hi)
frecuencia absoluta (fi)
intervalo de clase
a partir de su construcción, los datos pierden individualidad
Representación gráfica de la distribución de frecuencias
Polígono de frecuencias
ojivas
frecuencia ac
Histograma
frecuencia abs
Medidas de posición
promedios
intervienen todos los valores disponibles de la variable. (media aritmética, media geométrica, media armónica, media cuadrática)
Otras medidas de posición
no intervienen todos los valores de la variable. (mediana, modo, cuartiles)
mediana
valor de la variable que divide al conjunto en dos partes iguales
moda o modo
Media aritmética
propiedades de la media aritmética
La sumatoria de los desvíos al cuadrado, entre los valores de la variable y un valor constante y arbitrario A, es un mínimo si A es igual a la media
media aritmética de variables transformadas algebraicamente
La sumatoria de los desvíos es igual a cero
La media aritmética de la suma o diferencia de dos variables es la suma o diferencia de sus correspondientes media aritméticas
La media aritmética de un conjunto definido de datos es un valor constante
desventaja de la media aritmética
resulta afectada por los valores extremos. valores muy bajos o muy altos de la variable aleatoria pueden conducir a que el valor de la media no sea representativo
cuantiles
cuartiles, deciles, percentiles
medidas de posición NO CENTRALES. son los valores de la variable que dividen al conjunto en k partes iguales
relaciones entre las medidas de posición - Asimetría
conveniencia de las medidas de posición
si es notoriamente asimétrica. conviene utilizar la mediana o el modo, ya que no se encuentran afectadas por los valores extremos
Si todos sus intervalos son cerrados. mirar los dos primeros puntos para decidir cual utilizar
Si es simétrica o aprox. conviene utilizar la media aritmetica
Si tiene algún intervalo abierto. Solo se podrá utilizar la mediana o el modo
Si existe simetría perfecta : media = Me = Mo
si existe asimetría hacia la der: media > Me > Mo
si existe asimetría hacia la izq: media < Me < Mo
(la media me indica el lado de la asimetría)
grafico de caja
medidas de dispersión
desvío o desviación estándar (Sx)
dispersion relativa: coeficiente de variación CV(%)
variancia (Sx)^2
propidades de la variancia
la variancia siempre es positiva
la variancia de una constante siempre es igual a cero.
es una medida mínima si se la compara con cualquier otra similar que se calcule tomando como referencia alguna medida de posición diferente de la media aritmética.
variancia de variables transformadas algebraicamente
variancia de la suma o diferencia de dos variables.
variable estandarizada
Asimetría
por coeficiente de pearson
cuartílica
es el grado de desviación hacia la derecha o izquierda que posee una distribución con respecto a una MEDIDA DE POSICIÓN determinada.
observaciones
si As1 y As2 son negativos, la simetría es hacia la izquierda
si As1 y As2 son positivos, la simetría es hacia la derecha
Si las medidas de posición coinciden, As1 = As2 = 0 (grado de asimetría nulo)
si |As| > 0,20 no conviene utilizr la media aritmética
rango
dos desventajas
no se toma como referencia ningun valor
no es factible su calculo (exacto) en una distribución de frecuencias.
Desvío medio (DM)