Please enable JavaScript.
Coggle requires JavaScript to display documents.
Plataforma Analítica Santander - Coggle Diagram
Plataforma Analítica Santander
Elementos
Modelo de datos
Activity Squema
Toda la historía
Distintas fuentes del Banco (Actividades)
Todas las variables (Contexto)
Sistema
Flexible y Parametrizable (Adaptable)
Motor de variables
SageMaker Data Wrangler
Modelos ML
SageMaker Studio
Contar con el acceso a todos los recursos necesarios para el procesamiento de datos, así como para el entrenamiento de modelos de IA/ML
Exploración y reconocimiento de patrones en los datos
Tener una mejor comprensión de la información disponible
Automatización de tareas complejas y/o repetitivas en cada una de las etapas del ciclo de vida de los modelos de ML
El auto-entrenamiento de los modelos de ML
Desarrollar el mayor número de modelos con el menor número de recursos posibles
Potencializar el desarrollo de más y mejores modelos, su puesta en producción, así como su mantenimiento continuo.
Objetivo
Contar con un mayor número de modelos de machine learning para satisfacer las necesidades de un mayor número de áreas de negocio
Mejorar el poder predictivo de los modelos
Incrementar los usuarios de los modelos en las distintas áreas de negocio, y por lo tanto los casos de uso de los modelos
Unificar y disponibilizar la plataforma analítica a un mayor número de desarrolladores y validadores de los modelos
Democratizar los datos y la analítica
Nueva plataforma
Objetivo
Creación de nuevos algoritmos
Cómputo en paralelo, en memoria y vectorial
Nueva información e información más oportuna y desagregada
La conformación de una nueva plataforma analítica de desarrollo, producción y seguimiento de modelos de ML
Con tecnologías más innovadoras, que permitan hacer una industrialización eficaz del proceso de
ciclo de vida
de los modelos analíticos
Generar modelos con mayor poder predictivo
Centralizar el gobierno de datos en Data Lake con toda la
historia, periodicidad y grado de desagregación
requeridos
Diseñar y construir un modelo dimensional en Data Lake que alimente a los modelos analíticos de manera más eficiente
Diseñar y construir un nuevo Motor de Variables Sintéticas con base en el modelo dimensional en Data Lake, que sea lo suficientemente flexible y parametrizable
Centralizar la plataforma analítica para poder contar genuinamente con un ambiente de desarrollo, pre-producción y de producción en Data Lake
Disponibilizar los resultados de los modelos de manera directa a los diversos canales de uso
Sentar las bases en Data Lake a partir de las cuales sea posible hacer posteriormente una
transición más o menos directa o transparente de estos procesos hacia la Nube
Plataforma actual
Actualmente se puede
Acceder a diferentes Fuentes de Datos
Construir de manera semi-automática las variables predictivas
Hacer mantenimientos ad-hoc y de manera manual al Motor de Variables Sintéticas
Agregar nuevas fuentes, variables y transformaciones
Desarrollar y probar los modelos analíticos en ambientes artificiales de desarrollo
producción y seguimiento de los modelos analíticos en ambientes artificiales de producción en SAS
Conectarse a los distintos servidores en Oracle / SAS de manera manual
No se puede
No se cuenta con la historia, periodicidad y grado de desagregación requeridos
No se tiene la flexibilidad requerida para hacer parametrizaciones dinámicas de sus componentes