Documentos técnicos sobre segmentación de imágenes
La segmentación de imágenes es una de las cuestiones básicas en el procesamiento de imágenes y la visión por computadora, y es un paso clave en el procesamiento y análisis de imágenes. He compilado un artículo sobre tecnología de segmentación de imágenes, ¡bienvenido a leer! Documento sobre tecnología de segmentación de imágenes, Parte 1
Investigación sobre tecnología de segmentación de imágenes
Resumen: La segmentación de imágenes es uno de los temas básicos en El procesamiento de imágenes y la visión por computadora, es un paso clave en el procesamiento y análisis de imágenes. Este artículo presenta la evaluación y el estado de la aplicación del rendimiento de la segmentación de imágenes de los métodos de segmentación basados en umbrales y la segmentación de imágenes y, finalmente, resume las tendencias de desarrollo de la segmentación de imágenes;
Palabras clave: segmentación de imágenes, umbral, detección de bordes, segmentación de regiones
Número CLC: TN957.52 Código de identificación del documento: A
1 Introducción
Con la profundización de la investigación sobre la tecnología de segmentación de imágenes, sus aplicaciones están cada vez más extendidas. Cualquier trabajo que requiera la extracción y medición de objetivos de imágenes es inseparable de la segmentación de imágenes. La segmentación de imágenes es un problema muy importante y difícil en muchos campos, como el procesamiento de imágenes, el reconocimiento de patrones y la inteligencia artificial. Es el primer y más importante paso clave en la tecnología de visión por computadora. La calidad de los resultados de la segmentación de imágenes afecta directamente la comprensión de la imagen en la visión por computadora. La mayoría de los métodos existentes están diseñados para aplicaciones específicas y tienen gran pertinencia y limitaciones. Hasta el momento, no existe un método universal ni un estándar objetivo para juzgar si la segmentación es exitosa. Por lo tanto, la investigación sobre la segmentación de imágenes carece actualmente de un sistema teórico unificado, lo que hace que la investigación sobre la segmentación de imágenes siga siendo un tema muy desafiante.
2 Método de segmentación de imágenes
La segmentación de imágenes, en pocas palabras, consiste en dividir una imagen digital en diferentes áreas, con ciertas características dentro de una misma área que pueden considerarse las mismas propiedades. , como escala de grises, color, textura, etc. Existen diferencias obvias en las propiedades entre áreas adyacentes.
2.1 Método de segmentación por umbral basado en características de escala de grises
La tecnología de segmentación por umbral es uno de los métodos de segmentación de imágenes clásicos y populares que utiliza uno o varios umbrales para segmentar la imagen. se divide en varias partes y los píxeles que pertenecen a la misma parte se consideran el mismo objeto.
Este tipo de método incluye principalmente los siguientes tipos:
(1) Método de umbral único, que utiliza un umbral global para distinguir el fondo y el objetivo. Cuando el histograma de una imagen tiene picos dobles obvios, el valle entre los dos picos se selecciona como umbral.
(2) Método de doble umbral, que utiliza dos umbrales para distinguir el fondo y el objetivo. Al establecer dos umbrales, es posible evitar que la configuración del umbral único sea demasiado alta o demasiado baja, lo que provocaría que los píxeles de destino se clasifiquen erróneamente como píxeles de fondo o que los píxeles de fondo se clasifiquen erróneamente como píxeles de destino.
(3) Método de umbral múltiple: cuando hay factores como iluminación desigual, ruido repentino o grandes cambios en la escala de grises del fondo, no existe un umbral único adecuado para toda la imagen y un umbral único no puede Tenga en cuenta las diferentes imágenes Según la situación específica del área, la imagen se puede dividir en bloques y se puede establecer un valor umbral para cada bloque.
2.2 Método de segmentación de detección de bordes
La tecnología de detección de bordes se puede dividir en dos categorías: detección de bordes en paralelo y detección de bordes en serie según el orden de procesamiento. Los métodos comunes de detección de bordes incluyen: método diferencial, método de coincidencia de plantillas y método estadístico, etc. Porque el patrón de cambio de escala de grises del borde generalmente se refleja en forma de escalón o pulso. La relación entre el borde y el valor de diferencia se puede resumir en dos situaciones. Una es que el borde ocurre en el valor máximo o mínimo de la diferencia y la otra es que el borde ocurre en el cruce por cero.
2.3 Método de segmentación basado en regiones
El método de segmentación basado en regiones utiliza las propiedades espaciales de la imagen. Este método considera que una región segmentada tiene propiedades similares. Los métodos comúnmente utilizados incluyen el método de crecimiento de regiones y el método de división y fusión de regiones. Este tipo de método funciona bien para segmentar imágenes que contienen escenas complejas o paisajes naturales sin conocimientos previos suficientes.
El método de crecimiento de regiones comienza dividiendo una imagen en muchas áreas pequeñas. Estas pequeñas áreas iniciales pueden ser pequeños vecindarios o incluso píxeles individuales. En cada área, un objeto se puede reflejar mediante el cálculo. La consistencia dentro del cuerpo se utiliza como criterio para la fusión de regiones. El primer paso en la fusión de regiones es asignar a cada región un conjunto de parámetros, es decir, características. A continuación, se examinan todos los límites de áreas adyacentes. Si los valores propios en ambos lados de un límite dado son significativamente diferentes, entonces el límite es fuerte y viceversa. Se permite que sigan existiendo límites fuertes, mientras que se eliminan los límites débiles y se fusionan las regiones adyacentes. Cuando no hay límites débiles que puedan eliminarse, el proceso de fusión de regiones finaliza y se completa la segmentación de la imagen.
2.4 Tecnología de segmentación de imágenes combinada con herramientas específicas
Desde finales de la década de 1980, con el surgimiento y madurez de algunas teorías especiales, como la morfología matemática, la teoría fractal y las matemáticas difusas, wavelet. Análisis, reconocimiento de patrones, algoritmos genéticos, etc., un gran número de académicos se comprometen a aplicar nuevos conceptos y nuevos métodos a la segmentación de imágenes, mejorando efectivamente el efecto de segmentación. Se han producido muchos algoritmos de segmentación nuevos. A continuación se muestran algunos breves resúmenes de estos algoritmos.
2.4.1 Algoritmo de segmentación basado en la morfología matemática
El algoritmo de cuenca es un método de segmentación clásico basado en la teoría de la morfología matemática. En este método, una imagen se compara con un terreno con diferentes valores de altura. El valor de gris alto se considera una cresta y el valor de gris inferior se considera un valle. se moverá hacia el terreno y fluirá hacia el fondo y finalmente se reunirá en un determinado punto local del fondo. Finalmente, todas las gotas de agua se reunirán en diferentes cuencas de atracción, por lo que la imagen correspondiente se dividirá en varias partes. El algoritmo de cuenca tiene las ventajas de una operación simple, un rendimiento excelente y puede extraer mejor los contornos de los objetos en movimiento y obtener con precisión los bordes de los objetos en movimiento. Sin embargo, la información de gradiente es necesaria durante la segmentación y es sensible al ruido.
2.4.2 Algoritmo de segmentación basado en matemáticas difusas
En la actualidad, una característica importante de la aplicación de la tecnología difusa en la segmentación de imágenes es que se puede combinar con muchos métodos de segmentación de imágenes existentes. Formar una serie de tecnologías integradas de segmentación difusa, como agrupación difusa, umbral difuso, tecnología de detección de bordes difusos, etc.
Este tipo de método incluye principalmente dos algoritmos de segmentación: operador difuso generalizado y método de umbral difuso.
(1) El operador difuso generalizado procesa la imagen dentro del alcance del conjunto difuso generalizado, de modo que los bordes reales están en un nivel de gris más bajo, pero también hay algunos píxeles en escala de grises que no son bordes. En niveles de gris inferiores, aunque el cálculo del algoritmo es simple y los bordes delicados, el mapa de bordes resultante sufrirá problemas de desconexión.
(2) El método de umbral difuso introduce la descripción matemática difusa de la imagen en escala de grises, selecciona el umbral de segmentación de la imagen calculando la entropía difusa de la imagen y luego utiliza el método de umbral para procesar la imagen. para obtener el límite.
2.4.3 Método de segmentación basado en algoritmo genético
Este algoritmo es una solución a los problemas de optimización propuestos por la teoría de la evolución biológica. Utiliza conjuntos de codificación de parámetros en lugar de parámetros en sí. Al simular la evolución, se busca el espacio de solución de la función con una estrategia de supervivencia del más apto, que optimiza en grupos de puntos en lugar de en un solo punto. El algoritmo genético utiliza reglas de transformación aleatorias en lugar de reglas deterministas en el proceso de solución. La única información que requiere es el valor de aptitud, y el proceso de búsqueda se completa mediante replicación, hibridación y mutación simples de la población. Dado que este método puede realizar una búsqueda de optimización mínima global de la función de energía y puede reducir la dimensionalidad del espacio de búsqueda y reducir la sensibilidad del algoritmo a la posición inicial de la plantilla, el tiempo de cálculo también se reduce considerablemente. Su desventaja es que es fácil converger al óptimo local.
2.4.4 Algoritmo de segmentación basado en red neuronal
La red neuronal artificial tiene un rendimiento adaptativo, de autoorganización, de autoaprendizaje y capacidades de mapeo no lineal muy sólidas, y es adecuada para resolver problemas con conocimientos previos insuficientes, reglas de inferencia claras y poco claras y problemas de clasificación más complejos, también es adecuado para resolver problemas de segmentación de imágenes más complejos. En principio, la mayoría de los métodos de segmentación se pueden implementar con ANN (red neuronal artificial).
La investigación sobre ANN para la segmentación comenzó tarde. Solo se han aplicado NN de avance multicapa, NN de retropropagación de errores (BP) multicapa, NN autoorganizado, NN de Hopfield y NN que satisface restricciones (CSNN-Const raint Satisfaction Neurat Network). Se utiliza una red neuronal de avance multicapa para la segmentación de imágenes. La cantidad de neuronas de la capa de entrada depende de la cantidad de características de entrada, mientras que la cantidad de neuronas de la capa de salida es igual a la cantidad de categorías.
2.5 Otros métodos de segmentación de imágenes
Las cuatro categorías principales de métodos comúnmente utilizados para la segmentación de imágenes se introdujeron anteriormente. Existen muchos métodos y literatura de segmentación de imágenes relacionados, y constantemente aparecen nuevos métodos. Estos métodos incluyen: Algunos sólo son efectivos en situaciones específicas, y otros combinan varios métodos y se denominan colectivamente Categoría 5.
(1) El etiquetado es un método basado en estadísticas. Este método utiliza una etiqueta diferente para representar las distintas áreas en las que se va a dividir la imagen y utiliza un método determinado para cada píxel de la imagen. Se le asigna una etiqueta y los píxeles con la misma etiqueta se combinan en el área representada por la etiqueta.
(2) Método de segmentación basado en el modelo Snak La segmentación basada en el modelo Snake aproxima el contorno real del objetivo de la imagen mediante la optimización dinámica de la función de energía.
(3) Segmentación de textura. Debido a la introducción de nuevas herramientas matemáticas, la tecnología de segmentación de texturas ha logrado algunos avances. Zhang Peng et al. aplicaron el análisis de ondas a la extracción primitiva de texturas.
(4) El método de segmentación de imágenes basado en el conocimiento se basa directamente en conocimientos previos, lo que hace que la segmentación sea más consistente con las características de las imágenes reales. La dificultad de este método radica en la representación y utilización correcta y razonable del conocimiento.
3 Evaluación del rendimiento de la segmentación de imágenes
La evaluación de la segmentación de imágenes incluye principalmente dos aspectos: primero, estudiar el rendimiento de cada algoritmo de segmentación en diferentes circunstancias y dominar cómo seleccionarlo y controlarlo. Configuración de parámetros para adaptarse a diferentes necesidades. El segundo es analizar el rendimiento de múltiples algoritmos de segmentación al segmentar la misma imagen y comparar los pros y los contras para seleccionar el algoritmo apropiado en aplicaciones prácticas. Los métodos de evaluación de segmentación se dividen en dos categorías: métodos analíticos y métodos experimentales. El método analítico analiza directamente los principios y el rendimiento del algoritmo de segmentación en sí, mientras que el método experimental evalúa el algoritmo a través de los resultados de la segmentación de las imágenes de prueba. Ambos métodos tienen sus propias ventajas y desventajas. Debido a la falta de una base teórica confiable, no todos los algoritmos de segmentación pueden analizar su desempeño mediante métodos analíticos. Cada método de evaluación se propone por ciertas consideraciones, y diferentes métodos de evaluación solo pueden reflejar un cierto rendimiento del algoritmo de segmentación. Por otro lado, el rendimiento de cada algoritmo de segmentación está determinado por múltiples factores, por lo que es posible que se necesiten múltiples criterios para una evaluación integral.
4 Tendencias de desarrollo de la tecnología de segmentación de imágenes
Con la aplicación generalizada de redes neuronales, algoritmos genéticos, teoría estadística, teoría wavelet y teoría fractal en la segmentación de imágenes, la tecnología de segmentación de imágenes muestra el siguientes tendencias de desarrollo: (1) Integración de múltiples funciones. (2) Combinación de múltiples métodos de segmentación. (3) Nuevas teorías y nuevos métodos.
Referencias
[1] [Estados Unidos] RC González. Procesamiento de imágenes digitales (segunda edición) [M]. Traducido por Ruan Qiuqi, et al Beijing: Electronic Industry Publishing House Society. , 2003
[2] Zhang Yujin. Segmentación de imágenes [M]. Beijing: Science Press, 2001.
[3] Li Bicheng, Peng Tianqiang, Peng Bo, etc. Tecnología de procesamiento de imágenes [M]. Beijing: Electronic Industry Press, 2004.
[4] Yang Hui, Qu Xiujie. Descripción general de los métodos de segmentación de imágenes [J]. 2005, 18 (3): 21-23.
Haga clic en la página siguiente para obtener más artículos sobre tecnología de segmentación de imágenes gt;