PERCEPCIÓN COMPUTACIONAL

  1. INTRODUCCIÓN A LOS SISTEMAS DE PERCEPCIÓN

1.3 Funcionamiento del sistemas auditivo

Sonido: perturbación mecánica del medio por el que se propaga en forma de onda

oído medio

oído interno: 20Hz y 20Khz
máxima sensibilidad a los 4Hz
120db - umbral de sensación
Voz humana: 300Hz y 3.4KHz

oído externo - recoger las ondas sonoras dek medio

conducto auditivo

tímpano

pabellón auditivo

yunque

estribo

ventana oval: fina membrana que recubre el extremo de la cóclea expuesto hacia los huesos del oído medio

ventana redonda

martillo

trompa de Eustaquio: vía de comunicación entre el oído y la parte posterior del paladar

Cóclea

nervio auditivo

Membrana basiclar

1.4 Percepción visual

La visión es el fenómeno resultante de la percepción del color, forma y distancia de los objetos en un espacio.

Córnea

pupila

cristalino

Iris

Fóvea

Retina: membrana interior en donde se encuentran las células fotosensibles

Nervio óptico

conos: poco sensibles a la luz. visión diurna

bastones: visión nocturna

M -530nM - verde

L - 560nm - rojo

S - 420nM azul

Respuesta logarítmica JND: cantidad mínima de variación en la magnitud I para que sea apreciada.
Ley de Weber: El incremento necesario en la intensidad del estímulo para resultar en una respuesta perceptiva similar aumenta para mayores valores de intensidad.

Inhibición Lateral: realce del contraste entre zonas de diferente intensidad - detección de bordez. filtro laplaciano o Paso Alto

Muestreo o filtrado temporal - 30Hz

  1. ELEMENTOS DE UN SISTEMA DE PERCEPCIÓN
  1. CAPTURA Y DIGITALIZACIÓN DE SEÑALES
  1. FUENTE Y TIPOS DE RUIDO
  1. DETECCIÓN Y CANCELACIÓN DE ANOMALÍAS
  1. PROCESAMIENTO DE IMAGEN. OPERADORES ELEMENTALES
  1. PROCESAMIENTO DE IMAGEN. OPERADORES ESPACIALES
  1. PROCESAMIENTO DE IMAGEN.
    MORFOLOGÍA MATEMÁTICA
  1. PROCESAMIENTO DE SEÑALES. FILTRADO Y ANÁLISIS EN FRECUENCIA
  1. PROCESAMIENTO DE IMAGEN. SEGMENTACIÓN Y CRECIMIENTO DE REGIONES
  1. EXTRACCIÓN DE CARACTERÍSTICAS. PROPIEDADES ESTADISTICAS Y FRECUENCIALES DE LA SEÑAL
  1. EXTRACCIÓN DE CARACTERÍSTICAS. CARACTERIZACIÓN DE TEXTURAS EN IMÁGENES
  1. DESICIÓN. PRINCIPIOS E IMPLEMENTACIÓN DE ALGORITMOS DE AYUDA EN LA TOMA DE DESICIONES
  1. EXTRACCIÓN DE CARACTERÍSTICAS. PROCESAMIENTOS MULTIESCALA Y MÉTODOS AVANZADOS
  1. APLICACIONES ACTUALES DEL TRATAMIENTO DE LA SEÑAL

2.3 Elementos esenciales de un sistema de percepción

Procesamiento

Toma de decisiones y aprendizaje

Captura de Información

2.4 Captura de Información

Especificidad: capacidad de un sistema de captura de información para recoger fielmente los eventos sucedidos es clave

Precisión: error de medida de un determinado evento. ejemplo: frío calor, precisión baja

Sensibilidad: refleja la capacidad que tiene un determinado sensor de recoger las fluctuaciones o cambios del evento que se mide

Consumo y tamaño

Tipos de sensores: temperatura, esfuerzos, movimineto, humedad, presencia, vision artificial, caudal, nivel, fuerza, intensidad lumínica, táctiles

Conversión analógico-digital

Conversión - de intensidades físicas a dígitos binarios

Ventajas: reduce la lógica de procesamiento
permite integrar multitud de sensores
Información almacenada infinitamente menor
Facilidad e transmisión sin gran ancho de banda ni perdidas


Desventajas: perdida de información. Teorema de Nyquist- Shannon de frecuencia minima de muestreo

Preprocesamineto- tratamiento de la señal inmediatamente después de la captura.
Conjunto de tareas que acomodan la captura de información al procesamiento de la misma

Eliminación de ruido: perdidas en la calidad de la información o alteraciones de la misma

Detección de anomalías: cuando una medida carece de sentido o sale de un rango determinado

Corrección de errores

Sirva para: Saber si un sensor funciona bien. Corregir desviaciones de los sensores. Evitar errores de medida se propaguen hasta la toma de decisión

2.5 Procesamiento de la Información

Extracción de características: resumen analítico de cada región obtenida. Capacidad para distinguir regiones donde hay diferentes texturas, intensidades o patrones de comportamiento

Segmentación y detección de regiones: división de la información en conjuntos de datos con propiedades similares entre ellos

Filtros y suavizado de la información

Características extraídas: Color

Textura

coherencia de las regiones

Coeficiente de transformaciones no lineales: transformada de Fourier o Laplace

Componentes de frecuencia de una imagen

Suavidad del contorno de un objeto detectado

Área del segmento encontrado después de la segmentación

Descriptores de texturas de una región

2.6 Toma de decisión. Aplicar la lógica final para tomar una decisión o soportar la toma de las mismas

3.3 . Sistemas de conversión analógico-discreto

Analógico - toda señal que es continua y que procede de fenómenos físicos

Discreto - señal o imagen que solo puede alcanzar determinados valores

Esquema de un conversor A/D

cuantificador - transformar la señal en un conjunto limitado de valores

codificador - convierte el valor cuantificado en binario

muestreador: convertir la señal tomando lecturas a una frecuencia

3.4 Muestreo y Cuantificación

Muestreo

Cuantificación: convertir las muestras tomadas de la señal en valores numéricos

Señal de muestreo - tren de impulsos

Interruptor para tomar lecturas de la señal original en función de la señal de muestreo

Señal muestreada

4.2 Entropía: concepto y estimación

Ruido - toda señal no deseada de naturaleza aleatoria que modifica la intensidad de la señal original a percibir

Entropía: Hace referencia a la complejidad de la señal
Mayor ruido = mayor entropía
cantidad de información de una fuente aleatoria.

Tasa de entropía o entropía diferencial. Incremento de entropía por la inclusión de una nueva muestra


grado de incertidumbre de una señal

4.3 Fuentes perturbadoras de la señal

Tipos de Ruido

Ruido externo al sistema

Producido por el hombre - autovolies, motores - ruido insdutrial. - 1MHz - 600MHz

Ruido impulsivo o shot - outliers. duración corta. yayos o chispas de motor

Ruido atmosférico - Bajo la ionosfera (descargas eléctricas) impacto en bajas y media frecuencia 30MHz max

Galactico

Solar

Cósmico

Ruido interno al sistema

Ruido de parpadeo (flicker) o 1/f 1KHz - transistores y resistencias intermodulación

Ruido térmico - inevitable

Relación Señal a ruido (SNR) - indica la calidad de la señal de interés

4.4 Caracterización matemática del ruido: procesos estocásticos

Variable aleatoria esta caracterizada por:

conjunto de sucesos: subconjunto del espacio muestral

Ley de probabilidad: asignación de probabilidad a cada suceso observable

Espacio muestral - conjunto de todos los resultados que pueden observarse en la realización de un experimento

Proceso es estacionario

En sentido estricto - si la función de densidad de probabilidad que caracteriza al proceso no varia en el tiempo

En sentido amplio - si los momentos estadísticos que lo caracterizan (media, varianza, etc) no varían respecto al tiempo

5.2. Definición: valores atípicos en la fuente de información
Patrones inusuales que no se ajustan al comportamiento esperado.

Anomalías contextuales: si una muestra de datos es anómala en un contexto especifico. Atributos de cada muestra de datos:

Anomalías colectivas: si una colección de instancias de datos relacionadas es anómala con respecto a todo el conjunto de datos

Anomalías puntuales: valores pico que se alejan excesivamente del conjunto de valores que encontramos

Aplicaciones de la detección de anomalías:

Predicción de fuga de clientes en grandes compañías

Detección de transacciones fraudulentas

Diagnostico médico

Detección de intrusos en una red

Atributos contextuales: vienen dados por la naturaleza de la fuente d datos

Atributos de comportamiento: representa el valor de la muestra

5.3 Métodos de identificación de anomalías

Métodos semisupervisados - contienen únicamente muestras no anómalas

Métodos no supervisados - usa distancias o densidades

Métodos supervisados - contienen muestras anómalas

5.4 Eliminación de anomalías

Técnicas estadísticas. Función de densidad de probabilidad de los datos

Filtro de Mediana - paso bajo para ruido impulsivo: sal y pimienta

de forma global - anomalías de tupo puntual

Local -a para anomalías contextuales

Estimación de la función:

Histograma - Regla de Freedman - Diaconis para estimar el numero de intervalos a considerar

Estimación paramétrica - asume tipo normal
a obtener: media y varianza

Funciones núcleo (método de Parzen) - Hibrido.
Se emplea una normal Gaussiana como función núcleo

6.2 Ajuste de intensidad

Transformadas logarítmicas - se emplea cuando se pretende expandir el rango de intensidad de los pixeles oscuros

Ley de potencia

Negativo de una imagen - imagen invertida respecto a la original

Funciones definidas a trozos. Realce del contraste de una imagen

6.3 Procesado sistemático del histograma

El histograma proporciona una estimación de la función de densidad de probabilidad de la variable, la cual representa el valor de intensidad de los pixeles

6.4 Suavizado y realce mediante operadores aritméticos

Realce mediante resta

Suavizado mediante el operador Suma

Mascara: sub imagen de tamaño similar a la vecindad de un pixel compuesta por elementos denominados coeficientes

7.2 Filtros Paso Bajo y paso alto

7.3 Detección de bordes

Filtros especiales paso alto (afilado)

Filtros espaciales paso bajo (suavizado)

Cálculo del promedio. la suma de los coeficientes normalizados es la unidad

Filtro promediado en el que todos los coeficientes son iguales de denomina Box filter

Tratan de magnificar las variaciones o contrastes entre las estructuras de la imagen . DERIVADA DE UNA FUNCIÓN

primer orden - Operador gradiente

Segundo orden - laplaciano
es isotrópico, identifica discontinuidades en cualquier dirección de la imagen

Operadores de Prewitt
Máscara 3x3

Operadores de Sobel.
menor peso a pixeles

Operadores de Roberts.
Máscara 2x2

Algoritmo de Canny
-aplicar paso bajo gaussiano
-calcular el gradiente
-transformación sobre pixeles no máximos

  • se aplica un sobre sobre la intensidad para binarizar
    -se eliminan estructuras mas débiles

8.2 Sirve para simplificar el aspecto visual de una imagen

8.3 Definición de elemento estructural

Es un elemento matricial que recorre la imagen de forma iterativa y sobre el cual los operadores morfológicos actúan

8.4 Erosión y dilatación

Dilatación: consiste en potenciar y aumentar los contornos de una imagen binaria
Magnifica detalles
permiten que objetos se fusionesn

Erosión: su función es eliminar detalles, reducir contornos y desunir objetos

8.5. Apertura y Clausura

Apertura: erosión seguida de dilatación
Sirve para separar objetos elimina posibles detalles

Clausura: Dilatación y erosión
Reafirma y consolida formas dentro de una imagen

8.6 Gradiente morfológico

Diferencia entre la dilatación y la erosión
detecta bordes de la imagen

8.7 Top Hat

Diferencia entre la imagen original y la apertura
Se centra en los detalles, pero no aparta para conteo

9.4 La transformada de Fourier.

Series de Fourier de funciones periódicas
Cualquier función del tiempo, real, periódica y de frecuencia continua, puede ser expresada en una serie infinita de funciones sinusoidales

Espectro de frecuencias de la función periódica

Series de Fourier de funciones periódicas en el espacio complejo
Para modelas fenómenos físicos

Definición de la Transformada de Fourier:
Sirve para extender las series de Fourier a funciones no periódicas (periódicas con período infinito)

Ejemplos de transformada de Fourier.

Funciones de valor constante

Funciones sinusoidales.
Se transforman en Delta de Dirac

Transformada de Fourier de voz - 4KHz

Transformada de Fourier de imagen

9.5 Trasnformada discreta de Fourier (DFT) y su implementación mediante Fast Fourier TRansform (FFT)

DFT -
Habla de secuencias
se representa mediante variables x, y o z
Las variables n o m entre corchetes
sumatoria acotada entre 0 y N-1
La secuencia puede no ser periódica pero de longitud N
No existe el concepto de frecuencia sino variable k

FFT: reduce la complejidad de O (n2) a O (n log n)
no hay una implementación única
la original fue creada por Cooley y Tukey de IBM en 1960

10.2 Segmentación consiste en dividir una determinada imagen en regiones de propiedades similares.
Pueden venir definidas por el color, la textura o acotados por contornos bien definidos

10.3 Técnicas empleadas en el crecimiento de regiones

Partiendo de píxeles singulares - bottom-up

Agregación local

Agregación global

Dividir la imagen en secciones más pequeñas - Split and merge - top - down

10.4 Crecimiento de regiones basado en semillas

10.5 Crecimiento de regiones basado en Split and Merge

10.6 Crecimiento de regiones basado en Gradient Vector Flow (GVT)

10.7 Crecimiento de regiones basado en Watershed

10.8 Crecimiento de regiones basado en grafos

Posición de los pixeles y propiedades, generalmente I - Intensidad

Función de similaridad

Conjunto de pixeles que servirán como semillas

Función de pertenencia - umbral

9.3 - El análisis en frecuencia es la herramienta encargada de analizar si una señal proviene de la suma de 2 o mas señales y sus potencias

click to edit

Proceso iterativo. Características:

Cada pixel tiene que tener una región

Problemas si la región no es homogénea

Sólo considera regiones adyacentes -conduce a sobresegmentación

Permite encontrar una primera aproximación en imágenes con alto contraste

Gran coste computacional

Suele servir como origen para algoritmos de crecimiento de regiones mas específicos y complejos

El algoritmo realiza divisiones de forma automática y posteriormente evalúa si dos segmentos deberían de seguir juntos o no

Su coste computacional va disminuyendo conforme va avanzando. Está acotado

Es paralelizable

La desventaja es que si dos segmentos que han sido separados en ramas diferentes no se pueden fusionar aunque sean similares

Se conoce como algoritmo de la serpiente

Son dependientes de la inicialización y de las funciones de coste o de optimización

se conoce como algoritmos de inundación

el objetivo de esta técnica es dividir en regiones la imagen de nivel de grises

su objetivo ultimo es determinar los contornos que definen los objetos de la imagen

Graph-cuts y normalized-cuts: eliminan los nodos mas débiles

Agregación multiescala: similar a split and merge pero en grafos

Las conexiones son conocidas como edges y los píxeles como nodes.

Basadas en fronteras: detección de bordes local, global, modelos deformables, (snake)

Basadas en regiones: split ang merge, crecimiento de regiones, watersheed

Basadas en pixeles: Umbralización, histogramas, clustering, redes neuronales

11.1 Se asume que las señales son estacionarias en sentido amplio: las propiedades estadísticas no varían en función de las coordenadas del proceso

Análisis en el dominio natural: Las funciones de distribución y de densidad de probabilidad definen por completo el comportamiento estadístico de una variable

Análisis en el dominio frecuencial : densidad espectral de potencia de la señal de partida. Transformada de Fourier

  1. 2 Caracterización de señales en el domino natural

Caracterización estadística parcial

Máximo y mínimo: la diferencia define el rango dinámico de la señal

Media

Mediana

Moda

Varianza

Asimetría

Curtosis

Percentiles

Rango intercuartil

Otros parámetros

Complejidad de Lempel-Ziv

Entropía

Medida de la tendencia central

11.3 Características derivadas del análisis en frecuencia: Densidad espectral de potencia: potencia contenida por unidad de frecuencia

Ancho de banda: se define como el rango de frecuencias en el que su densidad espectral de potencia es mayor que cero

Formantes: máximos locales en la función de densidad espectral de potencia

Caracterización estadística: media mediana, varianza

Entropía espectral

  1. 2 Matriz de concurrencia de Haralick

12.3 Patrones binarios locales LBP

Energía

Contraste

Momento angular de segundo orden

Entropía

Media

Varianza

Correlación

Patrones especiales locales

Contraste de escala de grises

LBP invariante de rotación original: se obtiene rotan circularmente cada patrón de bits al valor mínimo

12.4 Caracterización basada en transformadas unitarias

Transformada de fouirer

Transformada del coseno

Transformada de Chebishov. Fueron definidos en 2001 por Mukundan para suprimir las limitaciones encontradas en los momentos de Zernike y Legendre.

Se lleva a cabo mediante la proyección de la imagen original sobre el polinomio de Chebishov

Puede observarse que el efecto de este operador es similar al de un banco de filtros paso banda centrados en diferentes frecuencias.

Suelen emplearse ocho niveles de cuantificación para los píxeles y de la imagen y se tiende a calcular las cuatro matrices diferentes, una por cada dirección posible en la comparación de píxeles adyacentes.

Probabilidad de que un píxel con valor i se encuentre adyacente a un píxel de valor j, según la dirección y distancias empleadas en el cálculo de la matriz.

  1. 1 La textura es una propiedad relaciona con la aspereza de una superficie y se caracteriza por la variación de intensidad de pixeles en el dominio espacial

13.2 Definir un objeto independientemente de su rotación o traslación, cambio de escala o ruido. Aplicaciones:

Fotos panorámicas

Identificación de monedas en máquinas expendedoras

Algoritmos de biometria

13.3 Transformada de Wavelet: ondiculas u onditas

Evolucionar la transformada de Fourier: STFT (Short Time Fourier Transform)

Wavelets como evolución de STFT. Ventanas con regiones de tamaño variable

Intervalos mas grandes de tiempo en segmentos en los que se requiere mayor precisión en baja frecuencia

Regiones mas pequeñas donde se requiere información en alta frecuencia

Utilidades de la transformada de Wavelet

Detección de discontinuidades o de puntos de quiebre en señales

Estudio de fractales

Identificación de frecuencias puras

Eliminación de ruido

Compresión de imágenes

Aplicaciones en medicina: diagnósticos de enfermedades, como análisis de electroencefalogramas

13.4 Filtros de Gabor: ventana con distribución gaussiana

Son filtros bidimensionales, ideales para descomposición multiescala de imágenes

Aplicaciones principales en biometría

13.5 Transformada SIFT (Scale Invariant Feature Transform) Encontrar objetos ocultos en imágenes.

Obtención de los puntos característicos

Descripción de la región alrededor de cada punto de interés. Histograma de direcciones del gradiente local

14.3 Aplicación de técnicas de machine learning al procesado de señales

Predicción

14.2 Clasificación y reconocimiento de patrones

Ejemplo de objeto x y categoría t

aprendizaje supervisado

Conjunto de entrenamiento

Clasificación

Regla de decisión de Bayes

Regla del máximo a posteriori MAP

Entrenamiento. minimización de una función de error

Capacidad de generalización

depende de 3 factores:

tamaño del conjunto de entrenamiento y su representatividad del problema

Capacidad de adaptación (flexibilidad del modelo)

Complejidad del problema de clasificación

problemas típicos:

Modelo rígido o poco flexible: underfitting

Modelo flexible y maleable: sobreajuste u overfitting.
se usan técnicas de bagging y gradient boosting

Sesgo y varianza

sesgo: componente sistemática del error. Infraajuste

varianza: componente del error derivada de la dependencia del modelo resultante con el conjunto de entrenamiento. Sobreajuste

El principio de máxima verosimilitud ajusta los pesos w de tal forma que, dado estos, se maximice la probabilidad de observar los datos en D.

Clasificación de señales

Segmentación

15.2 Biométricos

15.3 Self-driving car

Identificación

Verificación

enrollment

extracción de características

almacenamiento en base de datos

captura de información

técnicas usadas:

reconocimiento de iris

Huella digital

reconocimiento facial

Palmprint

Geometría de mano

venas de la mano y retina

firma

Procesamiento

Toma de decisiones

Captura de información

información unidimensional: sensores

información bidimensional: imágenes o videos

información tridimensional: radares para profundidad

Algoritmos de segmentación

Detección de bordes

Extracción de características

Corrección de ruido

15.4 Retos y limitantes de la percepción computacional

ética

falta de generalidad

sesgos

arte

definición de problema a modelar

construcción de un conjunto de ejemplos

entrenamiento y test

caracterización de objeto

preprocesado de la fuente de información

identificación de objeto a clasificar

basada en forma

basada en textura

segmentación basada en color

click to edit