lunes, 6 de mayo de 2013

5.2 VISION POR COMPUTADORA


VISIÓN POR COMPUTADORA


¿Qué es Visión?

Visión es la ventana al mundo de muchos organismos. Su función principal es reconocer y localizar objetos en el ambiente mediante el procesamiento de las imágenes. La visión computacional es el estudio de estos procesos, para entenderlos y construir máquinas con capacidades similares.

Existen varias definiciones de visión, entre éstas podemos mencionar las siguientes:

  • Visión es saber que hay y dónde mediante la vista“, (Aristóteles).

  • Visión es recuperar de la información de los sentidos (vista) propiedades válidas del mundo exterior", Gibson.

  • Visión es un proceso que produce a partir de las imágenes del mundo exterior una descripción que es útil  para el observador y que no tiene información irrelevante", Marr.


Un área muy ligada a la de visión computacional es la de procesamiento de imágenes. Aunque ambos campos tienen mucho en común,  el objetivo final es diferente. El objetivo de procesamiento de imágenes es mejorar la calidad de las imágenes para su posterior utilización o interpretación, por ejemplo:

ü  Remover defectos.
ü  Remover problemas por movimiento o desenfoque.
ü  Mejorar ciertas propiedades como color, contraste, estructura, etc.
ü  Agregar “colores falsos” a imágenes monocromáticas.

Esquema general del procesamiento de imágenes.




Esquema general de visión por computadora.


En la siguiente figura se muestra un ejemplo de procesamiento de imágenes. La tarea a realizar es mejorar la imagen de entrada, la cual es obscura. La imagen de salida es esencialmente la misma pero de mejor calidad o “más útil".


La figura mostrada a continuación ilustra la diferencia entre procesamiento de imágenes y visión; nótese que la imagen muestra ciertas descripciones importantes, como los números, que previamente fueron detectados. La salida de este sistema de visión se complementa con un módulo de reconocimiento de patrones, es decir, “saber" que letras y números contiene la placa.



Actualmente existen múltiples aplicaciones practicas de la visión computacional, entre estas podemos mencionar las siguientes:

v   Robótica móvil y vehículos autónomos.
v  Manufactura.
v  Interpretación de imágenes aéreas y de satélite.
v  Análisis e interpretación de imágenes medicas.
v   Análisis de imágenes para astrónoma.



Formación y representación de la imagen.

La formación de la imagen ocurre cuando un sensor (ojo, cámara) registra la radiación (luz) que ha interactuado con ciertos objetos físicos, como se muestra en la figura 5. La imagen obtenida por el sensor se puede ver como una función bidimensional, donde el valor de la función corresponde a la intensidad o brillantez en cada punto de la imagen (imágenes monocromáticas, conocidas como imágenes en “blanco y negro"). Generalmente, se asocia un sistema coordenado (x; y) a la imagen, con el origen en el extremo superior izquierdo, ver figura 6.

Una función de la imagen es una representación matemática de la imagen. Esta es generalmente una función de dos variables espaciales (x; y):





 I = f(x; y) (1.1)

Donde f representa el nivel de brillantez o intensidad de la imagen en las coordenadas (x; y). Si representamos estas funciones gráficamente, se tienen 3 dimensiones: dos que corresponden a las coordenadas de la imagen y la tercera a la función de intensidad, (figura 7).


Una imagen multiespectral f es una función vectorial con componentes (f1; f2; …, fn), donde cada una representa la intensidad de la imagen a diferentes longitudes de onda. Por ejemplo, una imagen a color generalmente se representa por la brillantez en tres diferentes longitudes de onda:


Una imagen digital es una imagen que ha sido discretizada tanto en valor de intensidad (f) como especialmente, es decir que se ha realizado un muestreo de la función continua. Este muestreo se representa matemáticamente mediante la multiplicación de la función con un arreglo bidimensional de funciones delta:


Donde cada valor de intensidad, fs(x; y), es mapeado o discretizado a un numero, por ejemplo un numero entre 0 y 255. Entonces una imagen digital monocromática puede ser representada por una matriz de NxM, donde cada valor es un numero que representa el nivel de intensidad del punto correspondiente de la imagen. Cada punto se conoce como pixel (del ingles, picture element).


Dispositivos para Visión

Existe diferentes dispositivos para la captura de imágenes. Dichas imágenes son digitalizadas y almacenadas en la memoria de la computadora. Una vez en la computadora, o en ocasiones desde el mismo dispositivo de captura, la imagen puede ser ya procesada.

Para la adquisición de la imagen se requiere de un dispositivo físico que sea sensible a una determinada banda del espectro electromagnético. El dispositivo produce una señal eléctrica proporcional al nivel de energía detectado, la cual es posteriormente digitalizada. Entre los dispositivos de captura o sensores se encuentran:

  • Cámaras fotográficas.
  • Cámaras de televisión (vidicón o de estado solido - CCD).
  • Digitalizadores (scanners).
  • Sensores de rango (franjas de luz, laser).
  • Sensores de ultrasonido (sonares).
  • Rayos X.
  • Imágenes de tomografía.
  • Imágenes de resonancia magnética.

Presentaron:
  • Hernandez Gabriel Juan Carlos.
  • Rodriguez Jalife Yael.
  • Santiago de la Cruz Martín Fco.




No hay comentarios:

Publicar un comentario