Please enable JavaScript.
Coggle requires JavaScript to display documents.
PERCEPCIÓN COMPUTACIONAL - Coggle Diagram
PERCEPCIÓN COMPUTACIONAL
INTRODUCCIÓN A LOS SISTEMAS DE PERCEPCIÓN
1.3 Funcionamiento del sistemas auditivo
Sonido: perturbación mecánica del medio por el que se propaga en forma de onda
oído medio
yunque
estribo
ventana oval: fina membrana que recubre el extremo de la cóclea expuesto hacia los huesos del oído medio
ventana redonda
martillo
trompa de Eustaquio: vía de comunicación entre el oído y la parte posterior del paladar
oído interno: 20Hz y 20Khz
máxima sensibilidad a los 4Hz
120db - umbral de sensación
Voz humana: 300Hz y 3.4KHz
Cóclea
nervio auditivo
Membrana basiclar
oído externo - recoger las ondas sonoras dek medio
conducto auditivo
tímpano
pabellón auditivo
1.4 Percepción visual
La visión es el fenómeno resultante de la percepción del color, forma y distancia de los objetos en un espacio.
Córnea
pupila
cristalino
Iris
Fóvea
Retina: membrana interior en donde se encuentran las células fotosensibles
conos: poco sensibles a la luz. visión diurna
M -530nM - verde
L - 560nm - rojo
S - 420nM azul
bastones: visión nocturna
Nervio óptico
Respuesta logarítmica JND: cantidad mínima de variación en la magnitud I para que sea apreciada.
Ley de Weber: El incremento necesario en la intensidad del estímulo para resultar en una respuesta perceptiva similar aumenta para mayores valores de intensidad.
Inhibición Lateral: realce del contraste entre zonas de diferente intensidad - detección de bordez. filtro laplaciano o Paso Alto
Muestreo o filtrado temporal - 30Hz
ELEMENTOS DE UN SISTEMA DE PERCEPCIÓN
2.3 Elementos esenciales de un sistema de percepción
Procesamiento
Toma de decisiones y aprendizaje
Captura de Información
2.4 Captura de Información
Especificidad: capacidad de un sistema de captura de información para recoger fielmente los eventos sucedidos es clave
Precisión: error de medida de un determinado evento. ejemplo: frío calor, precisión baja
Sensibilidad: refleja la capacidad que tiene un determinado sensor de recoger las fluctuaciones o cambios del evento que se mide
Consumo y tamaño
Tipos de sensores: temperatura, esfuerzos, movimineto, humedad, presencia, vision artificial, caudal, nivel, fuerza, intensidad lumínica, táctiles
Conversión analógico-digital
Conversión - de intensidades físicas a dígitos binarios
Ventajas: reduce la lógica de procesamiento
permite integrar multitud de sensores
Información almacenada infinitamente menor
Facilidad e transmisión sin gran ancho de banda ni perdidas
Desventajas: perdida de información. Teorema de Nyquist- Shannon de frecuencia minima de muestreo
Preprocesamineto- tratamiento de la señal inmediatamente después de la captura.
Conjunto de tareas que acomodan la captura de información al procesamiento de la misma
Eliminación de ruido: perdidas en la calidad de la información o alteraciones de la misma
Detección de anomalías: cuando una medida carece de sentido o sale de un rango determinado
Corrección de errores
Sirva para: Saber si un sensor funciona bien. Corregir desviaciones de los sensores. Evitar errores de medida se propaguen hasta la toma de decisión
2.5 Procesamiento de la Información
Extracción de características: resumen analítico de cada región obtenida. Capacidad para distinguir regiones donde hay diferentes texturas, intensidades o patrones de comportamiento
Coeficiente de transformaciones no lineales: transformada de Fourier o Laplace
Componentes de frecuencia de una imagen
Suavidad del contorno de un objeto detectado
Área del segmento encontrado después de la segmentación
Descriptores de texturas de una región
Segmentación y detección de regiones: división de la información en conjuntos de datos con propiedades similares entre ellos
Características extraídas: Color
Textura
coherencia de las regiones
Filtros y suavizado de la información
2.6 Toma de decisión. Aplicar la lógica final para tomar una decisión o soportar la toma de las mismas
CAPTURA Y DIGITALIZACIÓN DE SEÑALES
3.3 . Sistemas de conversión analógico-discreto
Analógico - toda señal que es continua y que procede de fenómenos físicos
Discreto - señal o imagen que solo puede alcanzar determinados valores
Esquema de un conversor A/D
cuantificador - transformar la señal en un conjunto limitado de valores
codificador - convierte el valor cuantificado en binario
muestreador: convertir la señal tomando lecturas a una frecuencia
3.4 Muestreo y Cuantificación
Muestreo
Señal de muestreo - tren de impulsos
Interruptor para tomar lecturas de la señal original en función de la señal de muestreo
Señal muestreada
Cuantificación: convertir las muestras tomadas de la señal en valores numéricos
FUENTE Y TIPOS DE RUIDO
4.2 Entropía: concepto y estimación
Ruido - toda señal no deseada de naturaleza aleatoria que modifica la intensidad de la señal original a percibir
Entropía: Hace referencia a la complejidad de la señal
Mayor ruido = mayor entropía
cantidad de información de una fuente aleatoria.
Tasa de entropía o entropía diferencial. Incremento de entropía por la inclusión de una nueva muestra
grado de incertidumbre de una señal
4.3 Fuentes perturbadoras de la señal
Tipos de Ruido
Ruido externo al sistema
Producido por el hombre - autovolies, motores - ruido insdutrial. - 1MHz - 600MHz
Ruido impulsivo o shot - outliers. duración corta. yayos o chispas de motor
Ruido atmosférico - Bajo la ionosfera (descargas eléctricas) impacto en bajas y media frecuencia 30MHz max
Galactico
Solar
Cósmico
Ruido interno al sistema
Ruido de parpadeo (flicker) o 1/f 1KHz - transistores y resistencias intermodulación
Ruido térmico - inevitable
Relación Señal a ruido (SNR) - indica la calidad de la señal de interés
4.4 Caracterización matemática del ruido: procesos estocásticos
Variable aleatoria esta caracterizada por:
conjunto de sucesos: subconjunto del espacio muestral
Ley de probabilidad: asignación de probabilidad a cada suceso observable
Espacio muestral - conjunto de todos los resultados que pueden observarse en la realización de un experimento
Proceso es estacionario
En sentido estricto - si la función de densidad de probabilidad que caracteriza al proceso no varia en el tiempo
En sentido amplio - si los momentos estadísticos que lo caracterizan (media, varianza, etc) no varían respecto al tiempo
DETECCIÓN Y CANCELACIÓN DE ANOMALÍAS
5.2. Definición: valores atípicos en la fuente de información
Patrones inusuales que no se ajustan al comportamiento esperado.
Anomalías contextuales: si una muestra de datos es anómala en un contexto especifico. Atributos de cada muestra de datos:
Atributos contextuales: vienen dados por la naturaleza de la fuente d datos
Atributos de comportamiento: representa el valor de la muestra
Anomalías colectivas: si una colección de instancias de datos relacionadas es anómala con respecto a todo el conjunto de datos
Anomalías puntuales: valores pico que se alejan excesivamente del conjunto de valores que encontramos
Aplicaciones de la detección de anomalías:
Predicción de fuga de clientes en grandes compañías
Detección de transacciones fraudulentas
Diagnostico médico
Detección de intrusos en una red
5.3 Métodos de identificación de anomalías
Métodos semisupervisados - contienen únicamente muestras no anómalas
Métodos no supervisados - usa distancias o densidades
Métodos supervisados - contienen muestras anómalas
5.4 Eliminación de anomalías
Técnicas estadísticas. Función de densidad de probabilidad de los datos
de forma global - anomalías de tupo puntual
Local -a para anomalías contextuales
Estimación de la función:
Histograma - Regla de Freedman - Diaconis para estimar el numero de intervalos a considerar
Estimación paramétrica - asume tipo normal
a obtener: media y varianza
Funciones núcleo (método de Parzen) - Hibrido.
Se emplea una normal Gaussiana como función núcleo
Filtro de Mediana - paso bajo para ruido impulsivo: sal y pimienta
PROCESAMIENTO DE IMAGEN. OPERADORES ELEMENTALES
6.2 Ajuste de intensidad
Transformadas logarítmicas - se emplea cuando se pretende expandir el rango de intensidad de los pixeles oscuros
Ley de potencia
Negativo de una imagen - imagen invertida respecto a la original
Funciones definidas a trozos. Realce del contraste de una imagen
6.3 Procesado sistemático del histograma
El histograma proporciona una estimación de la función de densidad de probabilidad de la variable, la cual representa el valor de intensidad de los pixeles
6.4 Suavizado y realce mediante operadores aritméticos
Realce mediante resta
Suavizado mediante el operador Suma
PROCESAMIENTO DE IMAGEN. OPERADORES ESPACIALES
Mascara: sub imagen de tamaño similar a la vecindad de un pixel compuesta por elementos denominados coeficientes
7.2 Filtros Paso Bajo y paso alto
Filtros especiales paso alto (afilado)
Tratan de magnificar las variaciones o contrastes entre las estructuras de la imagen . DERIVADA DE UNA FUNCIÓN
primer orden - Operador gradiente
Segundo orden - laplaciano
es isotrópico, identifica discontinuidades en cualquier dirección de la imagen
Filtros espaciales paso bajo (suavizado)
Cálculo del promedio. la suma de los coeficientes normalizados es la unidad
Filtro promediado en el que todos los coeficientes son iguales de denomina Box filter
7.3 Detección de bordes
Operadores de Prewitt
Máscara 3x3
Operadores de Sobel.
menor peso a pixeles
Operadores de Roberts.
Máscara 2x2
Algoritmo de Canny
-aplicar paso bajo gaussiano
-calcular el gradiente
-transformación sobre pixeles no máximos
se aplica un sobre sobre la intensidad para binarizar
-se eliminan estructuras mas débiles
PROCESAMIENTO DE IMAGEN.
MORFOLOGÍA MATEMÁTICA
8.2 Sirve para simplificar el aspecto visual de una imagen
8.3 Definición de elemento estructural
Es un elemento matricial que recorre la imagen de forma iterativa y sobre el cual los operadores morfológicos actúan
8.4 Erosión y dilatación
Dilatación: consiste en potenciar y aumentar los contornos de una imagen binaria
Magnifica detalles
permiten que objetos se fusionesn
Erosión: su función es eliminar detalles, reducir contornos y desunir objetos
8.5. Apertura y Clausura
Apertura: erosión seguida de dilatación
Sirve para separar objetos elimina posibles detalles
Clausura: Dilatación y erosión
Reafirma y consolida formas dentro de una imagen
8.6 Gradiente morfológico
Diferencia entre la dilatación y la erosión
detecta bordes de la imagen
8.7 Top Hat
Diferencia entre la imagen original y la apertura
Se centra en los detalles, pero no aparta para conteo
PROCESAMIENTO DE SEÑALES. FILTRADO Y ANÁLISIS EN FRECUENCIA
9.4 La transformada de Fourier.
Series de Fourier de funciones periódicas
Cualquier función del tiempo, real, periódica y de frecuencia continua, puede ser expresada en una serie infinita de funciones sinusoidales
Espectro de frecuencias de la función periódica
Series de Fourier de funciones periódicas en el espacio complejo
Para modelas fenómenos físicos
Definición de la Transformada de Fourier:
Sirve para extender las series de Fourier a funciones no periódicas (periódicas con período infinito)
Ejemplos de transformada de Fourier.
Funciones de valor constante
Funciones sinusoidales.
Se transforman en Delta de Dirac
Transformada de Fourier de voz - 4KHz
Transformada de Fourier de imagen
9.5 Trasnformada discreta de Fourier (DFT) y su implementación mediante Fast Fourier TRansform (FFT)
DFT -
Habla de secuencias
se representa mediante variables x, y o z
Las variables n o m entre corchetes
sumatoria acotada entre 0 y N-1
La secuencia puede no ser periódica pero de longitud N
No existe el concepto de frecuencia sino variable k
FFT: reduce la complejidad de O (n2) a O (n log n)
no hay una implementación única
la original fue creada por Cooley y Tukey de IBM en 1960
9.3 - El análisis en frecuencia es la herramienta encargada de analizar si una señal proviene de la suma de 2 o mas señales y sus potencias
PROCESAMIENTO DE IMAGEN. SEGMENTACIÓN Y CRECIMIENTO DE REGIONES
10.2 Segmentación consiste en dividir una determinada imagen en regiones de propiedades similares.
Pueden venir definidas por el color, la textura o acotados por contornos bien definidos
Basadas en fronteras: detección de bordes local, global, modelos deformables, (snake)
Basadas en regiones: split ang merge, crecimiento de regiones, watersheed
Basadas en pixeles: Umbralización, histogramas, clustering, redes neuronales
10.3 Técnicas empleadas en el crecimiento de regiones
Partiendo de píxeles singulares - bottom-up
Agregación local
Agregación global
Dividir la imagen en secciones más pequeñas - Split and merge - top - down
10.4 Crecimiento de regiones basado en semillas
Posición de los pixeles y propiedades, generalmente I - Intensidad
Función de similaridad
Conjunto de pixeles que servirán como semillas
Función de pertenencia - umbral
Proceso iterativo. Características:
Cada pixel tiene que tener una región
Problemas si la región no es homogénea
Sólo considera regiones adyacentes -conduce a sobresegmentación
Permite encontrar una primera aproximación en imágenes con alto contraste
Gran coste computacional
Suele servir como origen para algoritmos de crecimiento de regiones mas específicos y complejos
10.5 Crecimiento de regiones basado en Split and Merge
El algoritmo realiza divisiones de forma automática y posteriormente evalúa si dos segmentos deberían de seguir juntos o no
Su coste computacional va disminuyendo conforme va avanzando. Está acotado
Es paralelizable
La desventaja es que si dos segmentos que han sido separados en ramas diferentes no se pueden fusionar aunque sean similares
10.6 Crecimiento de regiones basado en Gradient Vector Flow (GVT)
Se conoce como algoritmo de la serpiente
Son dependientes de la inicialización y de las funciones de coste o de optimización
10.7 Crecimiento de regiones basado en Watershed
se conoce como algoritmos de inundación
el objetivo de esta técnica es dividir en regiones la imagen de nivel de grises
su objetivo ultimo es determinar los contornos que definen los objetos de la imagen
10.8 Crecimiento de regiones basado en grafos
Graph-cuts y normalized-cuts: eliminan los nodos mas débiles
Agregación multiescala: similar a split and merge pero en grafos
Las conexiones son conocidas como edges y los píxeles como nodes.
EXTRACCIÓN DE CARACTERÍSTICAS. PROPIEDADES ESTADISTICAS Y FRECUENCIALES DE LA SEÑAL
11.1 Se asume que las señales son estacionarias en sentido amplio: las propiedades estadísticas no varían en función de las coordenadas del proceso
Análisis en el dominio natural: Las funciones de distribución y de densidad de probabilidad definen por completo el comportamiento estadístico de una variable
Análisis en el dominio frecuencial : densidad espectral de potencia de la señal de partida. Transformada de Fourier
2 Caracterización de señales en el domino natural
Caracterización estadística parcial
Máximo y mínimo: la diferencia define el rango dinámico de la señal
Media
Mediana
Moda
Varianza
Asimetría
Curtosis
Percentiles
Rango intercuartil
Otros parámetros
Complejidad de Lempel-Ziv
Entropía
Medida de la tendencia central
11.3 Características derivadas del análisis en frecuencia: Densidad espectral de potencia: potencia contenida por unidad de frecuencia
Ancho de banda: se define como el rango de frecuencias en el que su densidad espectral de potencia es mayor que cero
Formantes: máximos locales en la función de densidad espectral de potencia
Caracterización estadística: media mediana, varianza
Entropía espectral
EXTRACCIÓN DE CARACTERÍSTICAS. CARACTERIZACIÓN DE TEXTURAS EN IMÁGENES
2 Matriz de concurrencia de Haralick
Energía
Contraste
Momento angular de segundo orden
Entropía
Media
Varianza
Correlación
Suelen emplearse ocho niveles de cuantificación para los píxeles y de la imagen y se tiende a calcular las cuatro matrices diferentes, una por cada dirección posible en la comparación de píxeles adyacentes.
Probabilidad de que un píxel con valor i se encuentre adyacente a un píxel de valor j, según la dirección y distancias empleadas en el cálculo de la matriz.
1 La textura es una propiedad relaciona con la aspereza de una superficie y se caracteriza por la variación de intensidad de pixeles en el dominio espacial
12.3 Patrones binarios locales LBP
Patrones especiales locales
Contraste de escala de grises
LBP invariante de rotación original: se obtiene rotan circularmente cada patrón de bits al valor mínimo
12.4 Caracterización basada en transformadas unitarias
Transformada de fouirer
Transformada del coseno
Transformada de Chebishov. Fueron definidos en 2001 por Mukundan para suprimir las limitaciones encontradas en los momentos de Zernike y Legendre.
Se lleva a cabo mediante la proyección de la imagen original sobre el polinomio de Chebishov
Puede observarse que el efecto de este operador es similar al de un banco de filtros paso banda centrados en diferentes frecuencias.
DESICIÓN. PRINCIPIOS E IMPLEMENTACIÓN DE ALGORITMOS DE AYUDA EN LA TOMA DE DESICIONES
14.3 Aplicación de técnicas de machine learning al procesado de señales
Clasificación de señales
Segmentación
Predicción
definición de problema a modelar
construcción de un conjunto de ejemplos
entrenamiento y test
caracterización de objeto
preprocesado de la fuente de información
identificación de objeto a clasificar
14.2 Clasificación y reconocimiento de patrones
Ejemplo de objeto x y categoría t
aprendizaje supervisado
Conjunto de entrenamiento
Clasificación
Regla de decisión de Bayes
Regla del máximo a posteriori MAP
Entrenamiento. minimización de una función de error
Capacidad de generalización
depende de 3 factores:
tamaño del conjunto de entrenamiento y su representatividad del problema
Capacidad de adaptación (flexibilidad del modelo)
Complejidad del problema de clasificación
problemas típicos:
Modelo rígido o poco flexible: underfitting
Modelo flexible y maleable: sobreajuste u overfitting.
se usan técnicas de bagging y gradient boosting
Sesgo y varianza
sesgo: componente sistemática del error. Infraajuste
varianza: componente del error derivada de la dependencia del modelo resultante con el conjunto de entrenamiento. Sobreajuste
El principio de máxima verosimilitud ajusta los pesos w de tal forma que, dado estos, se maximice la probabilidad de observar los datos en D.
EXTRACCIÓN DE CARACTERÍSTICAS. PROCESAMIENTOS MULTIESCALA Y MÉTODOS AVANZADOS
13.2 Definir un objeto independientemente de su rotación o traslación, cambio de escala o ruido. Aplicaciones:
Fotos panorámicas
Identificación de monedas en máquinas expendedoras
Algoritmos de biometria
13.3 Transformada de Wavelet: ondiculas u onditas
Evolucionar la transformada de Fourier: STFT (Short Time Fourier Transform)
Wavelets como evolución de STFT. Ventanas con regiones de tamaño variable
Intervalos mas grandes de tiempo en segmentos en los que se requiere mayor precisión en baja frecuencia
Regiones mas pequeñas donde se requiere información en alta frecuencia
Utilidades de la transformada de Wavelet
Detección de discontinuidades o de puntos de quiebre en señales
Estudio de fractales
Identificación de frecuencias puras
Eliminación de ruido
Compresión de imágenes
Aplicaciones en medicina: diagnósticos de enfermedades, como análisis de electroencefalogramas
13.4 Filtros de Gabor: ventana con distribución gaussiana
Son filtros bidimensionales, ideales para descomposición multiescala de imágenes
Aplicaciones principales en biometría
13.5 Transformada SIFT (Scale Invariant Feature Transform) Encontrar objetos ocultos en imágenes.
Obtención de los puntos característicos
Descripción de la región alrededor de cada punto de interés. Histograma de direcciones del gradiente local
APLICACIONES ACTUALES DEL TRATAMIENTO DE LA SEÑAL
15.2 Biométricos
Identificación
Verificación
enrollment
extracción de características
almacenamiento en base de datos
captura de información
técnicas usadas:
reconocimiento de iris
basada en forma
basada en textura
segmentación basada en color
Huella digital
reconocimiento facial
Palmprint
Geometría de mano
venas de la mano y retina
firma
15.3 Self-driving car
Procesamiento
Algoritmos de segmentación
Detección de bordes
Extracción de características
Corrección de ruido
Toma de decisiones
Captura de información
información unidimensional: sensores
información bidimensional: imágenes o videos
información tridimensional: radares para profundidad
15.4 Retos y limitantes de la percepción computacional
ética
falta de generalidad
sesgos
arte