Cómo funciona la búsqueda

Los motores de búsqueda de imágenes necesitan establecer información de índice para las imágenes exploradas en la Web, ser capaces de analizar y distinguir imágenes, anotar imágenes, almacenar la información de índice extraída y crear una base de datos de índice. Un motor de búsqueda de imágenes ideal también debería poder admitir la recuperación de imágenes basada en contenido.

Método de reconocimiento de imágenes

1. Buscar texto gráfico automáticamente: puede detectar si hay un archivo de imagen que se puede mostrar a través de dos etiquetas HTML, a saber, IMG SRC y HREF. IMG SRC significa "mostrar el archivo de imagen a continuación" y HREF significa "hay un enlace a continuación". Estas dos etiquetas suelen apuntar a un archivo de imagen. Los motores de búsqueda pueden saber si un archivo vinculado es un archivo de imagen comprobando la extensión del archivo. Si la extensión del archivo es . GIF o. JPG, esta es una imagen visualizable.

2. Intervención manual para buscar y clasificar imágenes: es decir, selección manual de imágenes online y sitios web. Este enfoque puede producir un sistema de consulta preciso, pero requiere demasiada mano de obra y limita la cantidad de imágenes procesadas. Dado que las imágenes son diferentes del texto y las personas necesitan interpretar su significado según su propio entendimiento, la recuperación de imágenes es mucho más difícil que la consulta y comparación de texto. Actualmente, la mayoría de los motores de búsqueda de imágenes admiten la recuperación de palabras clave y la navegación por categorías, y algunos también brindan recuperación de atributos visuales, pero también tienen limitaciones. Sus principales métodos de recuperación son los siguientes:

A. Información externa basada en imágenes: es decir, según el nombre del archivo o el nombre del directorio de la imagen, el nombre de la ruta, el enlace, la etiqueta ALT y otra información externa, así como también. La información de texto alrededor de la imagen es actualmente el método más utilizado en los motores de búsqueda de imágenes. Una vez que se encuentra un archivo de imagen, los motores de búsqueda de imágenes determinan el contenido del archivo mirando el nombre del archivo o la ruta, pero esto depende de qué tan descriptivo sea el nombre del archivo o la ruta.

B. Descripción de la función basada en el contenido de la imagen: esta es una coincidencia de nivel semántico. Es necesario describir y clasificar el contenido de la imagen (como objetos, fondo, composición, características de color, etc.). ) manualmente y proporcione texto descriptivo. Al realizar una búsqueda, buscará principalmente los términos de búsqueda dentro de estos descriptores. Este método de consulta es relativamente preciso y, en general, puede lograr una mayor precisión. Sin embargo, requiere participación manual y requiere mucha mano de obra, lo que limita la cantidad de imágenes que se pueden procesar y requiere ciertas especificaciones y estándares. El efecto depende de la precisión de la descripción manual.

C. Extracción de características basada en la morfología de la imagen: extrae automáticamente el color, la forma, la textura y otras características de la imagen a través del software de análisis de imágenes y establece una biblioteca de índice de características. Los usuarios solo necesitan describir las características generales. de la imagen que se va a buscar. Encuentra imágenes con características similares. Se trata de una coincidencia mecánica basada en la jerarquía de características de la imagen, que es especialmente adecuada para necesidades de consulta con objetivos de recuperación claros (como la recuperación de marcas). Los resultados también se acercan más a las necesidades del usuario. Sin embargo, en la actualidad, esta tecnología de recuperación madura se utiliza principalmente en la recuperación de bases de datos de imágenes. Todavía existen ciertas dificultades para aplicar esta tecnología de recuperación en los motores de búsqueda de imágenes en línea.