VISIÓN POR COMPUTADORA
¿Qué es Visión?
Visión es la ventana al mundo de muchos organismos. Su
función principal es reconocer y localizar objetos en el ambiente mediante el
procesamiento de las imágenes. La visión computacional es el estudio de estos procesos,
para entenderlos y construir máquinas con capacidades similares.
Existen varias definiciones de visión, entre éstas podemos
mencionar las siguientes:
- Visión es saber que hay y dónde mediante la vista“, (Aristóteles).
- Visión es recuperar de la información de los sentidos (vista) propiedades válidas del mundo exterior", Gibson.
- Visión es un proceso que produce a partir de las imágenes del mundo exterior una descripción que es útil para el observador y que no tiene información irrelevante", Marr.
Un área muy ligada a la de visión computacional es la de
procesamiento de imágenes. Aunque ambos campos tienen mucho en común, el objetivo final es diferente. El objetivo
de procesamiento de imágenes es mejorar la calidad de las imágenes para su
posterior utilización o interpretación, por ejemplo:
ü Remover defectos.
ü Remover problemas por movimiento o desenfoque.
ü Mejorar ciertas propiedades como color, contraste, estructura, etc.
ü Agregar “colores falsos” a imágenes monocromáticas.
Esquema general del procesamiento de imágenes.
Esquema general de visión por computadora.
En
la siguiente figura se muestra un ejemplo de procesamiento de imágenes. La
tarea a realizar es mejorar la imagen de entrada, la cual es obscura. La imagen
de salida es esencialmente la misma pero de mejor calidad o “más útil".
La figura mostrada a continuación ilustra la diferencia
entre procesamiento de imágenes y visión; nótese que la imagen
muestra ciertas descripciones importantes, como los números, que previamente
fueron detectados. La salida de este sistema de visión se complementa con un
módulo de reconocimiento de patrones, es decir, “saber" que letras y
números contiene la placa.
Actualmente existen múltiples aplicaciones practicas de la
visión computacional, entre estas podemos mencionar las siguientes:
v Robótica móvil y vehículos autónomos.
v Manufactura.
v Interpretación
de imágenes aéreas y de satélite.
v Análisis
e interpretación de imágenes medicas.
v Análisis de imágenes para astrónoma.
Formación y representación de la imagen.
La formación de la imagen ocurre cuando un sensor (ojo,
cámara) registra la radiación (luz) que ha interactuado con ciertos objetos
físicos, como se muestra en la figura 5. La imagen obtenida por el sensor se
puede ver como una función bidimensional, donde el valor de la función
corresponde a la intensidad o brillantez en cada punto de la imagen (imágenes
monocromáticas, conocidas como imágenes en “blanco y negro").
Generalmente, se asocia un sistema coordenado (x; y) a la imagen, con el origen
en el extremo superior izquierdo, ver figura 6.
Una función de la imagen es una representación matemática de
la imagen. Esta es generalmente una función de dos variables espaciales (x; y):
I = f(x; y) (1.1)
Donde f representa el nivel de brillantez o intensidad de la
imagen en las coordenadas (x; y). Si representamos estas funciones
gráficamente, se tienen 3 dimensiones: dos que corresponden a las coordenadas
de la imagen y la tercera a la función de intensidad, (figura 7).
Una
imagen multiespectral f es una función vectorial con componentes (f1; f2; …,
fn), donde cada una representa la intensidad de la imagen a diferentes
longitudes de onda. Por ejemplo, una imagen a color generalmente se representa
por la brillantez en tres diferentes longitudes de onda:
Una
imagen digital es una imagen que ha sido discretizada tanto en valor de
intensidad (f) como especialmente, es decir que se ha realizado un muestreo de
la función continua. Este muestreo se representa matemáticamente mediante la
multiplicación de la función con un arreglo bidimensional de funciones delta:
Donde cada valor de intensidad, fs(x; y), es mapeado o
discretizado a un numero, por ejemplo un numero entre 0 y 255. Entonces una
imagen digital monocromática puede ser representada por una matriz de NxM,
donde cada valor es un numero que representa el nivel de intensidad del punto
correspondiente de la imagen. Cada punto se conoce como pixel (del ingles,
picture element).
Dispositivos para Visión
Existe diferentes dispositivos para la captura de imágenes.
Dichas imágenes son digitalizadas y almacenadas en la memoria de la
computadora. Una vez en la computadora, o en ocasiones desde el mismo
dispositivo de captura, la imagen puede ser ya procesada.
Para la adquisición de la imagen se requiere de un
dispositivo físico que sea sensible a una determinada banda del espectro
electromagnético. El dispositivo produce una señal eléctrica proporcional al
nivel de energía detectado, la cual es posteriormente digitalizada. Entre los
dispositivos de captura o sensores se encuentran:
- Cámaras
fotográficas.
- Cámaras
de televisión (vidicón o de estado solido - CCD).
- Digitalizadores
(scanners).
- Sensores
de rango (franjas de luz, laser).
- Sensores
de ultrasonido (sonares).
- Rayos
X.
- Imágenes
de tomografía.
- Imágenes
de resonancia magnética.
Presentaron:
- Hernandez Gabriel Juan Carlos.
- Rodriguez Jalife Yael.
- Santiago de la Cruz Martín Fco.
No hay comentarios:
Publicar un comentario