Please enable JavaScript.
Coggle requires JavaScript to display documents.
VISIÓN POR COMPUTADOR - Coggle Diagram
VISIÓN POR COMPUTADOR
PARCIAL 1
-
TEMA 2
Adquisición, formación e interpretación de la imagen
Concepto de imagen
Una imagen es una representación de la realidad 3D proyectada en un plano 2D, que utiliza un proceso de selección y omisión
-
-
Píxeles y resolución
La resolución de una imagen está determinada por el número de píxeles y la profundidad de color (bits por píxel)
Color a nivel de gris
Promedio
Calcular el promedio de los valores de los tres canales de color (Rojo, Verde, Azul)
-
Al reducir o escalar una imagen, puede presentarse el efecto de aliasing, distorsionando la imagen
-
Aliasing Espacial
Se refiere a la distorsión en imágenes o señales espaciales cuando la resolución no es suficiente para capturar detalles finos
Aliasing Temporal
Se refiere a la distorsión en señales de movimiento cuando la frecuencia de muestreo (frames por segundo) es baja y no puede capturar adecuadamente el movimiento rápido
Histograma de la Imagen
Un histograma muestra la distribución de intensidades de píxeles en una imagen, útil para procesos como la normalización y el umbralizado
Sensores de Imagen
Componentes de las cámaras digitales que capturan la luz y la convierten en señales eléctricas para luego transformarlas en imagen digital
-
-
-
-
-
Rejilla de Bayer
Filtro de color que se coloca sobre los píxeles, permitiendo la captura de información de color. El sensor no captura el color de cada píxel, interpola a partir de los colores adyacentes
Balance de blancos
Corrección que se aplica a la imagen para garantizar que los colores se vean naturales bajo diferentes condiciones e iluminación
-
-
-
Formación de la imagen
-
La proyección de una imagen 3D a 2D elimina información, lo que puede dar lugar a distorsiones de perspectiva
-
Lentes
-
Ejemplos de lentes
Lente delgada
Lente idealizada, con grosor despreciable que enfoca la luz en un punto
-
-
Lente ojo de pez
Lente ultra gran angular que captura un campo de visión muy amplio, generalmente 180 grados
Lente 360 grados
Lentes que capturan imágenes panorámicas completas en todas las direcciones combinando imágenes de múltiples lentes
-
-
-
PARCIAL 3
TEMA 7
MOVIMIENTO
Contenidos
-
Traslacional
-
Imagen f0(x) con conjunto discreto de plíxeles pi=(xi,yi)
-
u desplazamiento (dos componentes), ei error residual
-
-
-
-
Refinamiento
-
-
Buscar valores discretos (u,v) alrededor del mejor
Fotogramas consecutivos, saltos pequeños espacio-tiempo
-
-
-
-
-
-
Flujo óptico
Cálculo de movimiento por píxel, más general
-
-
-
Estimación
Dados fotogramas en t y t-1
Campo de movimiento aparente u(x,y) y v(x,y) entre ellos
-
-
Lucas-Kanade
Una ecuación por píxel, con dos incógnitas
Coherencia espacial: idéntico desplazamiento (u,v)
-
-
Para n vecinos, resolución de mínimos cuadrados
-
-
Refinamiento iterativo, multiresolución
-
-
-
-
-
-
Seguimiento
-
-
-
-
-
-
Dificultades
-
-
Deformaciones: escala, rotaciones
-
-
-
-
-
-
-
Filtro de Kalman
-
-
Sistema estático
Resultado
Asume distribución normal, gaussiana
-
-
medida residual, conocida como innovación
Ecuación de actualización de estado, generaliza Factor
-
-
-
-
-
Sistema el avión, estado su posición
Escenario radar y avión
Predecir estado parece trivial, pero:
Ruido del proceso: viento, turbulencias, etc.
-
-
En seguimiento, medición proporcionada por la detección
Dadas estimación y medición, estima estado futuro del objetivo
-
-
Durante el seguimiento, estimar posición en futuros fotogramas
Resumen
-
-
-
Asume
-
Ruido blanco, aditivo y gaussiano de las medidas
Existen variantes, alternativas como el filtro de partículas
Aplicaciones
-
Seguimiento de cabezas/manos, etc.
-
-
-
-
TEMA 8
GEOMETRÍA, ESTRUCTURA Y FORMA
Calibración geométrica
-
-
Intrínsecos
Punto principal
-
-
Coordenadas de la imagen, origen esq. sup. izquieda
-
-
-
-
-
Extrínsecos
Homografía
-
Matriz 3x3, nueve valores, pero 8 incógnitas
-
-
Estimar la cámara, también conocido como estimación de pose
-
-
-
- Método lineal, Direct Liear Transform (DLT)
- Homografía entre dos sistemas de coordenadas
- Al menos seis pares de puntos (no coplanares)
- Ecuaciones por cada correspondencia 3D-2D
- Resolución con Descomposición en Valores Singulares
- Solución lineal proporciona la matriz de transformación
- Posteriormente parámetros intrínsecos
-
Geometría epipolar
Dos cámaras, una escena, dos imágenes
-
Dos cámaras y la recta que une sus centros C y C'
Dado un punto X, y sus proyecciones en cada cámara
Conforman el plano epipolar, intersecta con planos imagen
Uno de los posibles planos pasan por C y C'
-
El aspecto de las líneas epipolares, difieren según los epipolos
Epipolos finitos, cuando aparecen en la imagen
Movimiento paralelo al plano imagen
Epipolos muy alejados, líneas paralelas
-
Restricción epipolar
Dado un punto proyectado, x, en una cámara
-
-
-
-
-
Correspondencia
Estéreo
Para cada píxel en la imagen, buscar encaje en línea epipolar
Par estéreo
-
Encaje de píxeles, triangulación
-
-
-
-
-
-
Reconstrucción 3D
-
-
Neural Radiance fields (NeRFs, 2020)
-
-
-
-
-
-
-
-