Please enable JavaScript.
Coggle requires JavaScript to display documents.
Automated discovery of business process simulation models from event logs,…
Automated discovery of business process simulation models from event logs
1. Introduction
BPS herramienta usada en el análisis cuantitativo de procesos dentro de un negocio. Usado cuando se quiere mejorar el proceso con respecto a una o más medidas que tienen que ver con costos o tiempo. Se necesita un modelo de simulación de modele de manera precisa las dinámicas del proceso.
La hiper parametrización es un método de optimización usado para maximizar las similitudes entre los comportamientos del modelo BPS y el modelo observado.
2. Background and related work
2.1 Business process simulation
Consisten de Nodos de actividades y enlaces, conectados por flujos de secuencia
Enlace de decisión exclusiva: Codifica una sola decisión Enlace de decisión inclusiva: Codifica múltiples decisiones si las condiciones son las apropiadas.
Ramas condicionales: Ramas salientes de un enlace de decisión
Tiempo de ciclo: Tiempo que tarda el proceso en completarse de principio a fin
Tiempo de procesamiento: Tiempo que tarda una actividad en ser completada de principio a fin
Tiempo de espera: Tiempo entre la activación de una actividad y el momento de inicio
Un modelo BPS esta formado por una simulación más los sig. elementos:
Tiempo medio de llegada y su función de distribución de probabilidad asociada
Distribución de probabilidad del tiempo de proceso de cada actividad
Una rama de probabilidad por cada rama condicional
El fondo de recursos responsable por ejecutar cada actividad
Calendarios por cada fondo de recursos, indicando la disponibilidad del mismo
Una función que una cada tarea a un fondo de recursos
2.2 Related work
Los enfoques basados en datos se clasifican de dos modos:
Orientación conceptual para la simulación basada en datos: Discuten como las técnicas de minería de datos pueden ser usadas para extraer, validar y ajustar los parámetros del modelo BPS sin proveer de un soporte totalmente automatizado. Sus componentes son: Entidades, actividades, recursos y enlaces
Descubrimiento automatizado de modelos BPS mediante minería de procesos
3. Approach
El método toma como entrada un registro de eventos en formato XES o CVS, cada evento tiene lo siguiente: Identificador de caso, etiqueta de actividad, recurso que ejecuta la actividad, tiempo de inicio y tiempo de termino
3.1 Etapa de pre-proceso
Extracción de modelo BPMN del registro de eventos y garantizar su conformidad. No se pueden reflejar todos los caminos posibles en un proceso empresarial
3.1.1 Control de descubrimiento de flujo
Split Miner para generar BPMN v2.0 modelos de los registros de eventos. alcanza altos niveles de precisión (precisión y aptitud) mientras está produciendo modelos de procesos simples.
3.1.2 Evaluación de alineación
Grado en el que cada traza en el registro puede ser alineado con una traza correspondiente producida por el modelo de proceso usando la medida de aptitud
3.1.3 Reparación de registros
Reparación de registro para aquellos rastros en el registro que no encajan completamente en un rastro el modelo
Eliminación: Omite los rastros que no están en conformidad
con el modelo extraído
Reemplazo: Reemplaza cada rastro no conforme
con una copia de la traza conforme más similar
Alineación: Alinea cada traza de proceso del registro con
el modelo de proceso extraído
3.2 Etapa de procesos
Extrae los parámetros de simulación y los ensambla con la estructura del proceso para crear un modelo BPS
3.2.1. Reproducir el registro de eventos
Calcular el tiempo de procesamiento y el tiempo de habilitación de cada evento así como la frecuencia transversal
Tiempo de habilitación: Momento en que la actividad tiene permiso de suceder
Frecuencia transversal: Número de veces que se atraviesa la rama condicional mientras se reproduce la traza en el registro
Algoritmo calcula las frecuencias transversales para cada traza en
el registro, y luego los suma para calcular el recorrido total
3.2.2 Distribución entre llegadas
Determina la función de distribución de probabilidad (PDF) de los tiempos entre llegadas para los casos. Serie de datos resultantes de tiempos entre llegadas se analizan luego para determinar qué PDF produce el error estándar mínimo
3.2.3. Probabilidades de ramificación condicionales
Definir las probabilidades de las rutas habilitadas por las decisiones tomadas en los enlaces.
3.2.4. Tiempos de procesamiento de actividades
Crear una serie de datos que consiste en el tiempo de procesamiento observado para cada ejecución de la actividad en el registro
Ajustar una colección de posibles funciones de distribución a la serie de datos para seleccionar la función de distribución que produce el error estándar más pequeño
3.2.5 Fondo de recursos
Definir perfiles de ejecución de actividades para cada recurso mediante la creación de un gráfico utilizando la correlación de perfiles considerando solo las relaciones que superan un umbral de similitud definido por el usuario
3.2.6. Montaje del modelo de simulación
Juntar con el modelo BPMN en una única estructura de datos
3.2.7. Simular proceso
Modelo BPS se proporciona como entrada a un simulador. El simulador genera un registro de eventos simulados
3.3. Evaluación y optimización
Evaluar la precisión del registro de eventos generado por el simulador en relación con el registro de eventos y combinar los parámetros de descubrimiento para obtener el modelo BPS más preciso
3.3.1. Evaluar la precisión del modelo BPS
medir la precisión de un modelo BPS simulándolo y luego midiendo la similitud entre el registro de eventos generado por la simulación y las trazas en el registro a partir del cual se descubrió el modelo BPS
Distancia Damerau-Levenshtein (DL): el número mínimo de operaciones
La distancia DL penaliza las ocurrencias transpuestas de actividades, incluso si estas actividades son actividades paralelas
Modificar la función de costo utilizada en la distancia DL para que, si dos actividades son actividades paralelas, no penalicemos las ocurrencias transpuestas de estas actividades
La distancia DL no tiene en cuenta los tiempos de espera y los tiempos de procesamiento de las ocurrencias de actividad
Asignar una penalización al hacer coincidir este par de eventos proporcional a la diferencia entre sus marcas de tiempo.
3.3.2 Optimización de hiper parámetros
Estimador de Parzen estructurado en árbol (TPE) como un optimizador de hiper parámetros para encontrar la mejor configuración basada en la precisión histórica de los modelos ejecutados. TPE es un algoritmo secuencial que define en cada ensayo la siguiente configuración de parámetros
4. Evaluation
Preguntas relevantes:
¿Cuál es la precisión
de los modelos BPS generados por el método propuesto?
¿En qué medida el paso de optimización de hiperparámetros mejora la
precisión de los modelos BPS?
Las diferencias en precisión entre las ejecuciones de simulación del BPS optimizado modelo y las corridas del modelo BPS de línea de base son estadísticamente significativas
5, Threats to validity
Generalización de los resultados es limitada
El procesamiento por lotes y los retrasos deliberados dentro de un proceso debido a prioridades relativas no se tienen en cuenta en el enfoque propuesto
6. Conclusion and future work
Las evaluaciones reportadas fueron limitadas debido a la dificultad en obtener información real registrada
Conducir pruebas más sistemáticas con más información para encontrar encontrar relaciones entre los registros y los hiper parámetros usados
Estudio se basa en un
enfoque simple para la simulación de procesos de negocio
Samara García // Salma Ramírez