Red de conocimiento de abogados - Derecho de sociedades - ¿Qué es la tecnología OCR?

¿Qué es la tecnología OCR?

OCR es la abreviatura de Reconocimiento Óptico de Caracteres. La tecnología OCR simplemente convierte información de texto en información de imagen y luego utiliza tecnología de reconocimiento de texto para convertir la información de la imagen en tecnología de entrada utilizable.

Funciones de OCR:

1. La tecnología de reconocimiento OCR no solo puede juzgar, dividir, identificar y restaurar automáticamente varios formularios impresos generales, sino que también logra grandes logros en la comprensión práctica satisfactoria. resultados.

2. OCR puede analizar automáticamente el diseño del documento, dividirlo automáticamente en columnas y determinar los atributos correspondientes como títulos, columnas horizontales, imágenes, tablas, etc., y determinar el orden de reconocimiento. y puede restaurar los resultados del reconocimiento al nuevo texto escaneado de acuerdo con el diseño del documento.

3. OCR también puede admitir tecnología de entrada automática de formularios, que puede reconocer automáticamente caracteres, letras y números chinos impresos o impresos en formas específicas, y puede reconocer caracteres chinos escritos a mano, letras escritas a mano, números y varios. símbolos escritos a mano y presione Salida en formato de tabla. Mejora la eficiencia de la entrada de formularios y ahorra mucha mano de obra.

Información ampliada:

El tema a procesar por OCR debe transferir la imagen al ordenador a través de un instrumento óptico, como un escáner de imágenes, un fax o cualquier equipo fotográfico. Con el avance de la tecnología, los dispositivos de entrada como los escáneres se han vuelto cada vez más sofisticados, delgados, cortos y de alta calidad, lo que resulta de gran ayuda para el OCR. La resolución del escáner hace que la imagen sea más clara y la velocidad de escaneo mejora aún más. la eficiencia del procesamiento OCR.

Preprocesamiento de imágenes: El preprocesamiento de imágenes es el módulo que más problemas necesita para resolver en el sistema OCR. La imagen primero debe separar las imágenes, tablas y áreas de texto. Incluso puede distinguir la dirección del diseño del artículo, el esquema del artículo y el contenido principal del artículo. También puede distinguir el tamaño del texto y la fuente del texto. ser juzgado igual que el documento original.

Enciclopedia Baidu-Tecnología OCR