Saltar al contenido principal

¿Qué es una imagen digital?

Definición de imagen

Una imagen es una representación visual de un objeto, una escena, una persona o incluso un concepto. Puede presentarse en forma de fotografías, pinturas, dibujos, esquemas, escaneos, entre otros. En el ámbito del procesamiento digital, una imagen también puede interpretarse como una función matemática.

Más precisamente, una imagen bidimensional puede representarse como una función:

F(x,y)F(x, y)

donde xx e yy son las coordenadas espaciales y el valor de la función en ese punto corresponde a la intensidad o nivel de gris.

Imagen de ejemplo sin región de interés

Figura 1: Imagen de ejemplo en el dominio espacial.

Las coordenadas espaciales se suelen expresar en un sistema cartesiano 2D, donde el eje xx indica el ancho y el eje yy la altura de la imagen.

Imagen con coordenadas x e y

Figura 2: Imagen con el sistema de coordenadas espaciales (x, y).

En este contexto, un par de coordenadas (x,y)(x, y) corresponde a un píxel, la unidad mínima de una imagen digital.

La función F(x,y)F(x, y) depende principalmente de dos factores:

  1. La cantidad de luz que incide en la escena.
  2. La cantidad de luz reflejada por los objetos.
Imagen con región de interés y niveles de intensidad

Figura 3: Ejemplo de selección de una región de interés y su representación en intensidades.

Es importante destacar que los valores de intensidad son discretos y finitos, y nunca negativos.

Imágenes volumétricas (3D)

Además de las imágenes 2D, existen las imágenes tridimensionales, representadas como:

F(x,y,z)F(x, y, z)

donde cada punto en el espacio recibe el nombre de vóxel (volumetric pixel).

Estas imágenes pueden obtenerse directamente mediante sensores 3D o reconstruirse a partir de imágenes 2D, como en el caso de la tomografía computarizada.

Imagen de reconstrucción 3D a partir de imágenes 2D

Figura 4: Reconstrucción 3D a partir de imágenes 2D (tomografía) DOI: 10.48550/arXiv.2105.11692.

¿Cómo se representan las imágenes en las computadoras?

Generalmente, mediante matrices. Es fácil visualizar una imagen como una matriz numérica 2D. Esto supone una ventaja, ya que las computadoras manejan las matrices con gran fluidez. Ver las matrices como imágenes ayuda a comprender algunos de los procesos en las redes neuronales convolucionales y en el preprocesamiento de imágenes.

Comprensión de la resolución en imágenes digitales

La resolución espacial se refiere al detalle más pequeño perceptible en una imagen y suele medirse en pares de líneas por unidad de distancia o píxeles por unidad de distancia. Su relevancia depdende del contexto y varía según las unidades espaciales utilizadas. Por ejemplo, una cámara de 20 megapíxeles suele ofrecer una mayor resolución de detalle que una de 8 megapíxeles. La resolución de intensidad se refiere al cambio más pequeño detectable en el nivel de intensidad y suele estar limitada por las capacidades del hardware. Se cuantifica en incrementos binarios, como 8 bits o 256 niveles. La percepción de estos cambios de intensidad se ve influenciada por diversos factores, como el ruido, la saturación y la capacidad de la visión humana.

Imagen con distintas resoluciones

Figura 5: Imagen con distintas resoluciones del sitio Hugging Face. https://huggingface.co.