TEMA 23 : TRATAMIENTO DE INFORMACIÓN MULTIMEDIA

INTRODUCCIÓN

DIGITALIZACIÓN DE SEÑALES

TRATAMIENTO DE IMÁGENES

TRATAMIENTO DE AUDIO

TRATAMIENTO DE VIDEO

REALIDAD VIRTUAL

Conceptos

Características

Tipologías

Ámbitos de aplicación

Multimedia :cualquier objeto o sistema que utiliza múltiples medios de expresión físicos o digitales para presentar o comunicar información

Interactiva :cuando el usuario tiene libre control sobre la presentación de los contenidos

Directa :el usuario es forzado a visualizar el contenido en un orden predeterminado

Hipermedia :forma especial de multimedia interactiva que emplea estructuras de navegación más complejas que aumentan el control del usuario sobre el flujo de información

Cuando un programa, documento o presentación combina adecuadamente los medios, se mejora notablemente la atención, comprensión y el aprendizaje ya que se acercará a la manera natural en que los seres humanos nos comunicamos, usando varios sentidos para comprender

Tipos de información multimedia

Texto : sin formatear, formateado, lineal e hipertexto

Gráficos :para representar esquemas, planos, dibujos lineales...

Imágenes :documentos formados por píxeles, generados por copia del entorno (escaneado, fotografía digital)

Animación :presentación de un número de gráficos por segundo que genera en el observador la sensación de movimiento

Video :presentación de un número de imágenes por segundo que genera en el observador la sensación de movimiento. Sintetizadas o captadas

Sonido :puede ser habla, música, o de otros orígenes

Controlados por ordenador :la presentación de la información multimedia debe estar controlada por un ordenador que también participa en la producción, almacenamiento, edición, transmisión, etc.

Integrados :

Almacenamiento digital de la información :

Interactividad :

Selección del momento de comienzo

Especificación de la secuencia

Control sobre velocidad

Modificación de la forma de presentación

Entradas por parte del usuario para anotar, modificar o enriquecer la información

Entradas del usuario que son procesadas y generan respuestas específicas

Pasos para elaborar un producto multimedia

Definir el mensaje clave :

Conocer al público :

Desarrollo o guión :

Creación de un prototipo :

Creación del producto

Multimedia educativa :a través del e-learning y las redes sociales.

Multimedia publicitaria :en todo tipo de dispositivo para su divulgación siendo las redes sociales la herramienta de más difusión viral.

Multimedia comercial :bbdd, promociones, catálogos, simuladores, páginas web.

Multimedia informativa :noticias, prensa, revistas, televisión, con presentación de forma masiva y actualizada al momento de los hechos.

Mundo empresarial :presentación de proyectos, resultados, productos, previsiones., publicidad, formación...

Industria :sistemas de control industrial, herramientas de simulación, sistemas de gestión de piezas y stocks o producción.

Educación :modificación radical del proceso educativo a todos los niveles. Mayor innovación y beneficio

Ámbito doméstico :juegos, comunicaciones, control domótico, televisión interactiva, acceso doméstico a Internet

Lugares públicos :bibliotecas, museos, centros comerciales, aeropuertos, o vías públicas, donde se implementan puntos de acceso a la información. Sistemas de compr ade entradas, reserva de alojamientos, planos interactivos, pago electrónico, etc.

Tipos de señales

Analógicas :representadas mediante funciones que toman un infinito número de valores en cualquier intervalo de tiempo considerado. La información va contenida en la propia forma de onda.

Digitales :se representan mediante funciones que toman un número finito de valores en cualquier intervalo de tiempo.La información está contenida en los pulsos codificados y no en la forma de onda.

Una señal analógica , en general estará compuesta por la suma de muchas señales senoidales de distintas frecuencias

Las señales digitales se basan en la forma de onda cuadrada

Muestreo: cantidad de veces que medimos el valor de la señal en un periodo de tiempo

Según el teorema de Nyquist-Shannon la cantidad de veces que debemos medir una señal para no perder información debe ser al menos el doble de la frecuencia máxima que alcanza dicha señal.

Cuantificación :número de símbolos que utilizamos para guardar una medida de una señal. Para guardar la medida la codificamos con un conjunto de bits.

A mayor número de bits empleados para guardar la medida mayor exactitud. Lo usual son valores de 8 y 16 bits por calan de información

Digitalización :consiste en la transcripción de señales analógicas en señales digitales con el propósito de facilitar su procesamiento y hacer la señal resultante más inmune al ruido

Fases

1. Muestreo :se toman muestras periódicas de la amplitud de onda. El número de muestras por segundo es lo que se conoce por frecuencia de muestreo

2. Retención :las muestras tomadas son retenidas por un circuito de retención, el tiempo suficiente para permitir evaluar su nivel. Es un recurso técnico, no matemático

3. Cuantificación :se mide el nivel de voltaje de cada una de las muestras. Se asigna un margen de valor a cada señal analizada a un único valor de salida

4. Codificación :consiste en traducir los valores obtenidos durante la cuantificación al código binario

Ventajas

Inconvenientes

Cuando una señal es atenuada o experimenta perturbaciones leves, puede ser reconstruida y amplificada mediante sistemas de regeneración de señales

Cuenta con sistemas de detección y corrección de errores

Facilidad para el procesamiento de la señal

Permite la multigeneración infinita sin pérdidas de calidad

Es posible aplicar técnicas de compresión de datos, más eficientes que con señales analógicas

Se necesita una conversión analógica-digital previa y una decodificación posterior

Si no se emplea un número suficiente de niveles de cuantificación en el proceso de digitalización, la relación señal a ruido se reducirá con relación a la de la señal analógica original que se cuantificó

Concepto de imágen; función bidimensional de intensidad de luz f(x,y) donde x e y representan las coordenadas espaciales y el valor de f en un punto cualquiera (x,y) es proporcional al brillo o nivel de gris (escala de grises) de la imagen en ese punto

Técnicas de compresión

Sin pérdida de información

Con pérdidas de información

Formatos de archivos de imágenes

Mapa de bits :despliega la imagen como un conjunto de píxeles de colores individuales. Cada pixel es una celda del mapa de bits

Vectoriales :conjunto de vectores basados en ecuaciones matemáticas, las cuales describen geométricamente una imagen, pudiendo corresponder a puntos, lineas, curvas, polígonos.. Generalmente son de mayor calidad

Los elementos de una distribución digital se denominan elementos de la imagen o pixels.

Run-length encode (RLE) :Es el método más simple. Consiste en almacenar el número de caracteres que se repiten, seguido del carácter

Codificación de Huffman :consiste en asignarle código de bits más cortos a los datos que mayor frecuencia de aparición tienen y códigos más largos a los que aparecen con menos regularidad

Codificación artimética :codifica una secuencia de símbolos mediante una representación binaria, las secuencias de bits son obtenidas a partir de intervalos que tienen valores entre cero y uno

Lempel-Ziv: es un algoritmo que realiza un análisis desde cadenas o palabras de un determinado alfabeto, cuyas longitudes no exceden un prescrito entero L. Posteriormente se asignan estas cadenas o palabras secuencialmente hacia un único código de palabras de longitud LZ.

Codificación por transformación :utiliza una transformada para hacer corresponder la imagen con un conjunto de coeficientes de transformada, a los que se les aplica un proceso de cuantificación en donde un número significativo de los coeficientes tienen valores pequeños poco significativos, los cuales se pueden eliminar mediante la cuantización, produciéndose la pérdida de información, aunque ello no suponga una distorsión de la imagen

Vector de cuantización :la idea central es seleccionar un conjunto representativo de una imagen, Se divide la imagen en bloques de tamaño fijo llamados vectores. Se construye una tabla que contiene vectores diferentes encontrados en la imagen original

Compresión fractal :un fractal es un objeto semigeométrico cuya estructura básica, fragmentada o irregular, se repite a diferentes escalas.

JPEG :formato estándar ISO , utiliza una técnica de compresión con pérdida

GIF: se limita a 256 colores y permite almacenar imágenes estáticas como diagramas simples o logos con áreas de color sólido. También almacena imágenes como animaciones simples. Método de compresión sin pérdida

PNG :soporta hasta 16 millones de colores, con algoritmo de compresión sin pérdida. Adecuado para gráficos pero no soporta animación

TIFF :formato de archivo de imagen etiquetado, donde además de los datos de la imagen contienen etiquetas donde se archiva información sobre las características de la imagen que sirven para su tratamiento posterior. Diversas formas de compresión

BMP :maneja colores de hasta 24 bits de profundidad, usados en los programas de Microsoft. Compresión sin pérdidas

Privativos

Libres

PostScript, DWG, CDR (Corel)

PDF, ODG, VML

Tipos de sonido

Habla

Otros sonidos: el sonido audible consiste en ondas sonoras que se producen cuando las oscilaciones de la presión del aire se convierten en vibraciones detectadas por el oído humano. Estas vibraciones se convierten en impulsos nerviosos que son percibidos por el cerebro.

Codificación del habla :para la comunicación entre personas, relacionado con la conversión A/D y la compresión de la señal digital

Síntesis del habla :para la comunicación entre máquina y persona

Reconocimiento y comprensión del habla :para la comunicación entre persona y máquina

MIDI

Estándar de comunicaciones para instrumentos musicales electrónicos y computadoras.

Protocolo para pasar descripciones detalladas de una partitura musical como notas, secuencias de notas e instrumentos

Lista de órdenes de grabaciones de acciones musicales que cuando se envían a un dispositivo de reproducción MIDI produce sonido. No es sonido digitalizado

Digitalización

Los sonidos digitalizados son muestras de sonido. Cada enésima fracción de segundo se toma una muestra y se guarda como información en bits o bytes

Velocidad de muestreo : frecuencia con que se toman las muestras

Tamaño de la muestra : cantidad de información almacenada de cada muestra. 8 y 16 bits

El valor de cada muestra se redondea al entero más próximo (cuantización) y si la amplitud es más grande que el intervalo disponible se hace un recorte (clipping) de la parte alta o baja de la onda.

El ruido en la cuantización se puede suavizar mediante el dithering agregando ruido al azar para suavizar transiciones

Compresión de audio

El sonido es más difícil de comprimir que las imágenes, especialmente usando métodos de compresión sin pérdidas

Las más comunes son las que se basan en la codificación diferencial

DPCM: se toma como valor siguiente la diferencia con el valor de la señal en el instante anterior

Modulación delta :forma particular de DPCM en la cual la diferencia entre el valor actual y el siguiente se codifica con un solo bit, indicando si el valor de la señal se incrementa o decrementa en un "quantum"

ADPCM :

Códec :programa o dispositivo hardware capaz de codificar o decodificar una señal o flujo de datos digitales.

MP3 : elimina las frecuencias inaudibles conservando la esencia del sonido.

Dolby Digital :

AAC: formato usado por Apple, de más calidad que MP3

Formatos

WAV : el más usado en plataformas Windows

Otros : AU, VOX, AIFF, WMA

Herramientas: Stereo Studio, Sound Edit Pro, WinAmp

Operaciones de edición

Recortes, uniones, conversión de formatos, ecualización, procesamiento digital de señales, sonido a la inversa

Video analógico: es una señal eléctrica que varía con el tiempo y que se obtiene a partir de muestrear, de forma periódica la información que llega de una cámara: un patrón de distribución espacial de intensidad luminosa cambiante con el tiempo (barrido o scanning)

Video digital

Métodos de barrido

Progresivo :recorre u obtiene una imagen que se denomina cuadro o frame cada T segundos.

Entrelazado :se dibujan primero las líneas pares y luego las impares

Parámetros de la señal de vídeo analógico

Intervalo en blanco horizontal:

Relación de aspecto: relación entre la distancia horizontal y vertical de recorrido

Sincronización :

Resolución horizontal

Resolución vertical

Velocidad de cuadro y entrelazado

Estándares :NTSC, PAL, SECAM, HDTV

Conversión de la señal eléctrica a bits

Resolución marcada por el número de pixels por línea y el número de líneas por cuadro.

La pérdida de resolución se pone de manifiesto con el aliasing, donde se ve el pixelado de los bordes de los objetos.

Métodos de compresión

Basados en formas de ondas :

Basadas en objetos :

Basadas en modelos :

Basadas en fractales :

Estándares de compresión de video

MJPEG :trata cada cuadro de una secuencia de video de forma diferente y le aplica un proceso de compresión independiente del resto.

Beneficios :se pueden realizar modificaciones más precisas en un editor de video. Es posible empezar a reproducir en cualquier cuadro. Formato útil como medio de almacenamiento por la cantidad de información que contiene.

Inconvenientes :genera ficheros excesivamente largos

H 261 :estándar internacional de video utilizado en videoconferencia.

MPEG :familia de estándares de la ISO/IEC para la codificación de señales de video. MPEG-1 sigue una estructura de datos jerárquica de forma que posibilita el proceso decodificador

Codecs

Cinepak: optimiza el espacio

Sorensen: para transmisión de video en web

Indeo: desarrollado por Intel para procesadores Pentium

Quicktime : desarrollado por Apple

Animation: para comprimir películas generadas por ordenador.

Contenedores de video: No es ni un compresor de video ni un codec. Permite incluir en un mismo archivo varios flujos de audio, video y subtítulos, puediéndose reproduric en cualquier reproductor de medios

AVI : lanzado por Microsoft

OGM :

Matroska MKV : código abierto multiplataforma

Concepto :entorno de escenas u objetos de apariencia real, generado mediante tecnología informática, que crea en el usuario la sensación de estar inmerso en él.

Tipos

VRML(Virtual Reality Modeling Language) :lenguaje para crear ambientes tridimensionales y poder interactuar con ellos. Los ambientes son creados por vectores y son usados generalmente en la web.

Gafas de realidad virtual

Desarrolladores de la tecnología

Inmersiva :ambiente tridimensional generado por ordenador y que se accede mediante , cascos, guantes u otros dispositivos que capturan la posición y rotación del sujeto.

No inmersiva :se vale de medios como Internet para interactuar en tiempo real con personas en espacios y ambientes virtuales, sin necesidad de dispositivos adicionales

Consiste en un fichero de texto donde se detallan los vértices y aristas de polígonos en 3D, junto con colores, texturas, transparencias, efectos..etc. Puede comprimirse para transmitirse más rápidamente por Internet

Su desarrollo es llevado a cabo por el Consorcio Web3D que posteriormente comenzó a trabajar en su sucesor llamado X3D

X3D :lenguaje para gráficos vectoriales definido por norma ISO que puede emplear una sintaxis similar a XML así como una del tipo VRML.

Características

Hardware necesario :conexión a ordenador, o a smartphone o a videoconsola

Resolución :

Tasa de refresco :grado de fluidez de las imágenes en la pantalla

Ángulo de visión :cuanto más ángulo más sensación de inmersión

Sensores :integrados o no en las gafas

Área de rastreo :superficie dentro de la cual nuestros movimientos son registrados por los sensores de posición

Gráficos 3D :

Técnicas estereoscopia :nos permiten dar profundidad y realismo a las imágenes tridimensionales

Simulación comportamiento :

Facilidad para navegar :

Técnicas para una inmersión total :

Samsung :con su modelo de gafas Gear VR

Facebook :Oculus Rift

Sony :PlayStation VR

Microsoft :Hololens para realidad aumentada

Google :Google Daydream