Please enable JavaScript.
Coggle requires JavaScript to display documents.
Redes Bayesianas, Integrantes de equipo:, Estefanía Anaya Diego Iván…
Redes Bayesianas
Razonamiento con Redes Bayesianas
Algoritmo de propagación
Fases
Fase de inicialización
: Se obtienen las probabilidades a priori de todos los nodos de la red, obteniendo un estado inicial de la red que denotaremos por S0.
Fase de actualización
: Cuando una variable se instancia, se actualiza el estado de la red, obteniéndose las probabilidades a posteriori de las variables de la red basadas en la evidencia considerada, adoptando la red un estado que denotaremos por S1.
Se repite cada que una variable se instancia
Proporciona un primer método de actualización de probabilidades
Cuando se actualiza una probabilidad se envía un mensaje al nodo padre y ese nodo la manda a sus otros hijos de forma ascendente a descendente
Al multiplicar los mensajes propagados se obtienen las probabilidades
Ejemplo de funcionamiento
Proceso de inicialización
La probabilidades se actualizan para contabilizar la información
Cambian probabilidades
Presentación Intuitiva
Red Bayesiana
Cada nodo corresponde a una variable
Se denotan con letras mayúsculas
Los arcos se refiere a las relaciones
Consta de nodos, enlaces y parámetros
Red más simple
Consta de dos variables con su arco
Ejemplo:
X es paludismo y Y1 gota gruesa (prueba de paludismo)
Información cuantitativa
Probabilidad a priori de los nodos sin padres
Probabilidad condicionada de nodos con padres
P(x) y P(y1/x)
Tests
Sensibilidad:
probabilidad de resultado positivo (si enfermos) (P(+y1/+x))
Especifidad:
probabilidad de resultado negativo (si no enfermos) (P(+y1/-x))
Falsos positivos:
probabilidad de resultados positivos en personas no enfermas
Falsos Negativos:
probabilidad de resultados negativos en personas enfermas
Prevalencia:
porcentaje de la población de padecer algo (P(+x))
Teorema de Bayes
Definición formal de red bayesiana
Conceptos
Arco:
par ordenado (X, Y) dado por una flecha desde X hasta Y.
Grafo dirigido:
par G = (N, A) donde N es un conjunto de nodos y A un conjunto de arcos sobre los nodos.
Grafo no dirigido:
par G = (N, A) donde N es un conjunto de nodos y A un conjunto de arcos no orientados.
Camino:
secuencia ordenada de nodos.
Camino dirigido:
secuencia ordenada de nodos.
Ciclo:
camino no dirigido que empieza y termina en el mismo nodo X.
Grado acíclico:
grafo que no tiene grifos.
Padre:
X es un padre de Y si y sólo si existe un arco. El conjunto de padres de se representa como pa(X) y al de hijos S(X).
Antepasado o ascendiente:
X es un antepasado de Z si y sólo si existen un camino dirigido de X a Z.
Conjunto ancestral:
de un nodo X es un conjunto que contiene a X y a todos sus antepasados.
Descendiente:
Z es un descendiente de X si y sólo si X es un antepasado de Z. Se denota como de(X).
Variable proposicional:
variable aleatoria que toma un conjunto exhaustivo y excluyente de valores. Se denota con mayúsculas y un valor de la variable con la misma letra en minúscula.
Independencia en variables
Si se tiene que P(X/Y) = P(X). X e Y son independientes si P(X,Y) = P(X)·P(Y).
Si una tercera variable Z si se tiene que P(X/Y,Z) = P(X/Y). Z separa condicionalmente a X e Y. X e Y son independientes dado Z sí y sólo sí P(X,Y/Z) = P(X/Z)·P(Y/Z)
Red Bayesiana
Conjunto de variables proposicionales, V.
Conjunto de relaciones binarias definida sobre las variables de V, E.
Una distribución de probabilidad conjunta sobre las variables de V.
(V, E) forman un grafo acíclico, conexo y dirigido G.
(G, P) cumplen las hipótesis de independencia condicional, separación direccional, que se enuncian a continuación.
Hipótesis de independencia condicional
Cada nodo debe ser independiente de los otros nodos de la red.
Teorema (Factorización de la probabilidad)
Una red bayesiana, su distribución de probabilidad puede expresarse como:
Nos permite describir una red a partir de la probabilidad condicionada de cada nodo en lugar de dar la probabilidad conjunta
Modelado con redes bayesianas
Identificación de las variables
Variables objetivo
: Utilizada para modelar los objetos de interés, los que se van a razonar. Para modelos latentes (que no se observan directamente)
Variables de observación
: Modelan las formas indirectas que miden las variables objetivo. Son llamadas variables de evidencia
Factores
: Modelan fenómenos que afectan las variables objetivo. Se llaman también variables de contexto.
Promotores
: La variable afectada es la más probable
Inhibidores
: La variable afectada es menos probable
Requeridos
: Son indispensables para que ocurran las variables afectadas
Preventivos
: Si ocurre, la variable afectada no ocurre
Auxiliares
: Se usan por conveniencia
Estados y valores
Variables cualitativas
Variables que expresan distintas cualidades, características o modalidad
La modalidad se denomina atributo o categoría
La medición es la clasificación de los atributos
Pueden ser dicotómicas cuando se puede tomar dos valores posibles
Variables cuantitativas
Variables que expresan cantidades numéricas
Pueden ser discretas al presentar interrumpiones
Pueden ser continuas al adquirir cualquier valor de un rango
Los valores dentro de un mismo rango son del mismo estado
Un nodo es una variable proposicional
Estructura
Construcción de un modelo
Se conectan variables con arcos o enlaces, indicando una influencia causal
Al faltar un arco entre variables no existe relación dependiente entre ellas
Las relaciones causales conducen a modelos más sencillos
Parámetros
Último paso del proceso de modelado
proporcionar probabilidades de priori de los nodos raíz y las probabilidades condicionales del resto de los nodos.
Varias alternativas para obtener los parámetros:
Especificación directa de los parámetros:
contando con la ayuda de expertos, es ciertamente costoso.
Aprendizaje a partir de bases de datos:
depende de la existencia de dicha base, de ser así hay dos opciones:
Aprendizaje de parámetros: si se dispone de la estructura
Aprendizaje estructural: en el que es posible aprender tanto la estructura como los parámetros.
Combinar especificación y aprendizaje: contar con expertos que nos ayuden a especificar la estructura, aprender los parámetros y disponer de expertos de nuevo para supervisar el modelo obtenido.
Estructuras equivalentes
Trucos para el modelado
Verificar independencias que supone el modelo
Definir el modelo -> Comprobar si las relaciones entre las variables reflejan las dependencias e independencias existentes.
Introducir nodos intermedios para reducir complejidad
El número de probabilidades necesarias para cada nodo es exponencial en el número de padres.
Cuando un nodo tiene muchos padres, se puede reducir la complejidad al introducir nodos intermedios que agrupen a varios padres.
Uso de modelos canónicos
Lo anterior plantea problemas de obtención y almacenamiento de datos como de tiempos de computación de algoritmos.
Es conveniente buscar modelos simplificados de interacción entre variables
Uso de compuertas NOISY-OR y NOISY-ADD
Integrantes de equipo:
Estefanía Anaya Diego Iván Galván Rubén Adiel Luna