Please enable JavaScript.
Coggle requires JavaScript to display documents.
PRINCIPALES DISTRIBUCIONES DE PROBABILIDAD - Coggle Diagram
PRINCIPALES DISTRIBUCIONES DE PROBABILIDAD
¿qué es la probabilidad?
La probabilidad es un valor entre 0 y 1 que describe la posibilidad de ocurrencia de un acontecimiento Donde 1 representa que el acontecimiento sucederá muy seguramente y 0 que el acontecimiento con seguridad no sucederá.
Distribución de probabilidad
Una
distribución de probabilidad
como una lista que nos proporciona todos los resultados de los valores que pueden presentarse en un acontecimiento, junto con la probabilidad de ocurrencia asociada a cada uno de estos valores.
TIPOS DE DISTRIBUCIÓN
Distribuciones discretas
Las distribuciones discretas incluidas en el módulo de “Cálculo de probabilidades” son:
Distribución de probabilidad binomial
Es una probabilidad discreta y se presenta con mucha frecuencia en nuestra vida cotidiana.
Fue propuesta por
Jakob Bernoulli
(1654-1705), y es utilizada con acontecimientos que tengan respuesta binaria, generalmente clasificada como “éxito” o “fracaso”. Algunos ejemplos donde se aplica esta distribución son:
Que un vuelo se retrase o no.
Si el lanzamiento de una moneda sale cara en vez de sello.
Que un producto sea exitoso o no.
Distribución de probabilidad de Poisson:
Recibe su nombre gracias al matemático francés
Simeón Denis Poisson
(1781-1840).
Describe el número de veces que se presenta un acontecimiento durante un intervalo específico, este intervalo puede ser de tiempo, distancia, área o volumen. La probabilidad de ocurrencia es proporcional a la longitud del intervalo. Algunos ejemplos donde se aplica esta distribución son:
Cuando se requiere conocer el número de defectos en un lote de tela.
Cantidad de llamadas por hora que recibe una compañía.
El número de vehículos que vende por día un concesionario.
Distribución hipergeométrica
Suele aparecer en procesos muestrales sin reemplazo, en los
que se investiga la presencia o ausencia de cierta característica.
La distribución hipergeométrica es una distribución discreta que modela el número de eventos en una muestra de tamaño fijo cuando usted conoce el número total de elementos en la población de la cual proviene la muestra. Cada elemento de la muestra tiene dos resultados posibles (es un evento o un no evento).
Por ejemplo,
usted recibe un envío de pedido especial de 500 etiquetas. Supongamos que el 2% de las etiquetas es defectuoso. El conteo de eventos en la población es de 10 (0.02 * 500). Usted toma una muestra de 40 etiquetas y desea determinar la probabilidad de que haya 3 o más etiquetas defectuosas en esa muestra. La probabilidad de que haya 3 o más etiquetas defectuosas en la muestra es de 0.0384.
Distribución geométrica*
Esta distribución presenta la propiedad denominada “falta de memoria”, que implica que la probabilidad de tener que esperar un tiempo t no depende del tiempo que ya haya transcurrido.
Por ejemplo
, una distribución geométrica puede modelar el número de veces que se debe lanzar al aire una moneda para obtener el primer resultado de "cara". De manera similar, si se trata de productos construidos en una línea de ensamble, la distribución geométrica puede modelar el número de unidades producidas antes de que se produzca la primera unidad defectuosa
Se utiliza en la distribución de tiempos de espera, de manera que si los ensayos se realizan a intervalos regulares de tiempo, esta variable aleatoria proporciona el tiempo transcurrido hasta el primer éxito
Distribución Pascal
La distribución de Pascal debe su nombre al matemático francés
Blaise Pascal (1623-1662),
uno de los matemáticos que creó las bases de la teoría de la probabilidad
La distribución geométrica es un modelo adecuado para aquellos procesos en los que se repiten pruebas hasta la consecución del éxito a resultado deseado y tiene interesantes aplicaciones en los muestreos realizados de esta manera . También implica la existencia de una dicotomía de posibles resultados y la independencia de las pruebas entre sí
Binomial negativa
Es una distribución discreta que modela el número de ensayos necesarios para producir un número específico de eventos. Cada ensayo tiene dos resultados posibles. El evento es el resultado de interés en un ensayo. La distribución binomial negativa también puede modelar el número de no eventos que deben ocurrir para que se observe el número especificado de resultados.
Por ejemplo, una distribución binomial negativa puede modelar el número de veces que se lanza al aire una moneda para obtener cinco cruces. De manera similar, para el caso de productos que se construyen en una línea de ensamble, la distribución binomial negativa puede modelar el número de unidades ensambladas para que se produzcan 100 unidades defectuosas. La siguiente gráfica ilustra una distribución binomial negativa con probabilidad de eventos de 0.5 y 5 eventos necesarios.
Uniforme discreta
a describe el comportamiento de una variable discreta que
puede tomar n valores distintos con la misma probabilidad cada uno de ellos
Esta distribución asigna igual probabilidad a todos los valores enteros entre el límite inferior y el límite superior que definen el recorrido de la variable
Por ejemplo, cuando se observa el número obtenido tras el lanzamiento de un dado perfecto, los valores posibles siguen una distribución uniforme discreta en {1, 2, 3, 4, 5, 6}, y la probabilidad de cada cara es 1/6
Distribuciones continuas
Las distribuciones continuas incluidas en el módulo de “Cálculo de probabilidades” son:
Distribución Chi-cuadrado
La distribución de chi-cuadrada es una distribución continua que se especifica por los grados de libertad y el parámetro de no centralidad. La distribución es positivamente asimétrica, pero la asimetría disminuye al aumentar los grados de libertad.
La distribución de chi-cuadrada (χ2) en pruebas de significancia estadística para:
Comprobar qué tan bien se ajusta una muestra a una distribución teórica.
1 more item...
Comprobar la independencia de las variables categóricas.
1 more item...
Distribución t de Student
Esta distribución fue propuesta por
William Sealy Gosset (1876-1937)
, más conocido por el seudónimo de
Student
, como resultado de un estudio sobre la estimación de la media cuando el tamaño de muestra es pequeño.
Utilice la distribución t para analizar la media de una población aproximadamente normal cuando se desconoce la desviación estándar de la población.
Por ejemplo,
uno de los usos de la distribución t es para probar si una media de población y una medida hipotética son diferentes. Las pruebas de significancia para los coeficientes de regresión también utilizan la distribución t.
1 more item...
Distribución exponencial
Utilice la distribución exponencial para modelar el tiempo entre eventos en un proceso continuo de Poisson. Se presupone que eventos independientes ocurren a una tasa constante.
Esta distribución tiene una amplia gama de aplicaciones, que incluyen el análisis de fiabilidad de productos y sistemas, teorías de colas y cadenas de Markov.
Por ejemplo,
la distribución exponencial se puede utilizar para modelar:
3 more items...
Distribución F de Snedecor
La distribución F es una distribución continua de muestreo de la relación de dos variables aleatorias independientes con distribuciones de chi-cuadrada, cada una dividida entre sus grados de libertad. La distribución F es asimétrica hacia la derecha y es descrita por los grados de libertad de su numerador (ν1) y denominador (ν2).
Por ejemplo
, utilice la distribución F en el análisis de varianza y en pruebas de hipótesis para determinar si dos varianzas de población son iguales.
Distribución Weibull
Esta distribución debe su nombre al físico sueco
Waloddi Weibull
(1887-1979)
quien la usó en un artículo publicado en 1939 sobre resistencia de los materiales (A Statistical Theory of the Strength of Materials), aunque ya era conocida de años antes.
La distribución de Weibull es una distribución versátil que se puede utilizar para modelar una amplia gama de aplicaciones en ingeniería, investigación médica, control de calidad, finanzas y climatología.
Por ejemplo,
la distribución se utiliza frecuentemente con análisis de fiabilidad para modelar datos de tiempo antes de falla. La distribución de Weibull también se utiliza para modelar datos asimétricos del proceso en el análisis de capacidad.
Distribución beta
Es adecuada para variables aleatorias continuas que toman valores en el
intervalo (0,1), lo que la hace muy apropiada para modelar proporciones.
La distribución beta suele utilizarse para modelar la distribución de estadísticos de orden (
por ejemplo
, el estadístico de orden késimo de una muestra de variables n uniformes (0, 1) tiene una distribución beta (k, n + 1 – k)) y para modelar eventos que se definen por valos mínimos y máximos. La escala de la distribución beta suele modificarse para modelar el tiempo hasta la culminación de una tarea.
La distribución beta también se usa en estadísticas bayesianas, por ejemplo, como la distribución de valores previos de una probabilidad binomial.
La distribución beta es una distribución continua definida por dos parámetros de forma. La distribución puede adoptar diferentes formas dependiendo de los valores de los dos parámetros.
Distribución Laplace
Fue descubierta en 1774 por
Pierre-Simon Laplace (1749-1827)
, a quien debe su nombre,
aunque también es conocida por el nombre de distribución doble exponencial.
Utilice la distribución de Laplace cuando la distribución de los datos tenga un pico más alto que una distribución normal.
Por ejemplo,
la distribución de Laplace se utiliza para modelar datos en aplicaciones en biología, finanzas y economía.
La distribución de Laplace es una distribución continua que se define por sus parámetros de ubicación y escala. En la siguiente gráfica, la distribución de Laplace se representa con la línea discontinua y la distribución normal se representa con la línea continua.
Distribución logística
Pierre François Verhulst (1804-1849)
describió por primera vez la curva logística en un trabajo, publicado en 1845, que versaba sobre las investigaciones matemáticas en las leyes que gobiernan el crecimiento de la población.
La distribución logística se utiliza en el estudio del crecimiento temporal de variables, en
particular, demográficas.
En biología se ha aplicado, por ejemplo, para modelar el crecimiento de células de levadura, y para representar curvas de dosis-respuesta en bioensayos
Distribución Cauchy
Esta distribución fue introducida por
Simeón Denis Poisson (1781-1840)
en 1824, aunque debe su nombre al matemático francés
Augustin Louis Cauchy (1789-1857)
quien la reintrodujo en 1853. En el ámbito de la física también es conocida con el nombre de distribución de
Lorentz o distribución de Breit-Wigner.
La distribución de Cauchy es una distribución continua que se define por sus parámetros de ubicación y escala.
La distribución de Cauchy se representa con una curva en forma de campana, similar a una distribución normal, como lo ilustran las siguientes gráficas. Sin embargo, en la distribución de Cauchy, las colas se aproximan a cero con mayor lentitud que las colas de la distribución normal.
Distribución lognormal
Esta variable aleatoria fue propuesta por
Francis Galton (1822-1911)
en 1879, como consecuencia del estudio de la media geométrica de n variables aleatorias independientes.
Utilice la distribución lognormal si el logaritmo de la variable aleatoria está distribuida normalmente. Utilícese cuando las variables aleatorias sean mayores que 0. Por ejemplo, la distribución lognormal se usa para el análisis de fiabilidad y en aplicaciones financieras, como modelar el comportamiento de las acciones.
La distribución lognormal es útil para modelar datos de numerosos estudios médicos tales como el período de incubación de una enfermedad, los títulos de anticuerpo a un virus, el tiempo de supervivencia en pacientes con cáncer o SIDA, el tiempo hasta la seroconversión de VIH+, etc.
Distribución Pareto
La distribución de Pareto fue introducida por el economista italiano
Vilfredo Pareto (1848- 1923)
como un modelo para explicar la distribución de las rentas de los individuos de una población
siempre y cuando se partiera de dos supuestos, la existencia de un umbral inferior
(x0) de forma que no haya rentas inferiores a dicho umbral y el decrecimiento de manera potencial del porcentaje de individuos con una renta superior o igual a un cierto valor de
renta a medida que dicho valor de renta crece
Los siguientes ejemplos se consideran a veces como una distribución de Pareto aproximada:
3 more items...
Distribución de probabilidad normal:
Fue utilizada por
Carl Friedich Gauss (1777-1855)
al escribir un libro sobre el movimiento de los cuerpos celestes, por este motivo también es conocida como distribución Gaussiana.
Es importante debido a que el teorema central del límite implica que esta distribución es casi universal y la podemos encontrar en todos los campos de las ciencias empíricas tales como: biología, física, psicología, economía, etc. Tiene una forma de campana, es simétrica y su área bajo la curva es 1.
Como se mencionaba anteriormente la aplicación de esta distribución de probabilidad es muy amplia. Algunos ejemplos son:
3 more items...
Distribución triangular
El nombre de esta distribución viene dado por la forma de su función de densidad. Estemodelo proporciona una primera aproximación cuando hay poca información disponible, de forma que sólo se necesita conocer el mínimo (valor pesimista), el máximo (valor optimista) y la moda (valor más probable).
Utilice la distribución triangular para describir una población sobre la cual existen datos de muestra limitados
Por ejemplo
, en la industria petrolera es costoso recolectar datos y es casi imposible modelar la población.
La distribución triangular se utiliza generalmente para modelar procesos estocásticos o de riesgo comercial.
Por ejemplo,
la recolección de datos para determinar el costo de construcción de un edificio nuevo resulta difícil. Sin embargo, usted puede estimar los costos de construcción mínimos, máximos y más probables (moda). Es fácil definir y explicar estos valores, que son una representación razonable de los datos.
Uniforme o rectangular
Utilice la distribución uniforme para describir variables continuas que tienen una probabilidad constante.
La distribución uniforme es una distribución continua que modela un rango de valores con igual probabilidad. La distribución uniforme se especifica mediante cotas inferior y superior.
Por ejemplo,
una población de partes varía de 0.5 a 0.6 cm de largo. Si cada valor entre 0.5 y 0.6 cm tiene la misma probabilidad de ocurrir, estos datos siguen una distribución uniforme.
Distribución gamma
Se utiliza comúnmente en estudios de supervivencia de fiabilidad.
Por ejemplo,
la distribución gamma puede describir el tiempo que transcurre para que falle un componente eléctrico. La mayoría de los componentes eléctricos de un tipo particular fallará aproximadamente en el mismo momento, pero unos pocos tardarán más en fallar.