Red de conocimiento del abogados - Preguntas y respuestas jurídicas - Resumen comparativo de proyectos de código abierto de OCR

Resumen comparativo de proyectos de código abierto de OCR

El reconocimiento óptico de caracteres (OCR) se refiere al proceso de análisis y reconocimiento de archivos de imágenes de materiales de texto para obtener información de texto y diseño. Es decir, el texto de la imagen se reconoce y se devuelve en forma de texto.

Ha habido mucha acumulación en el desarrollo de OCR. La mayoría de las personas o empresas utilizan servicios de terceros directamente. Actualmente, hay muchas empresas grandes que brindan servicios de terceros, como Baidu y Alibaba. Cloud y Tencent, etc., proporcionan una interfaz API muy conveniente a la que se puede llamar, y la velocidad, precisión y efecto del reconocimiento también son muy buenos. La única desventaja es que hay una tarifa por llamar a la API. Para las personas y empresas que no llaman con frecuencia, la tarifa sigue siendo muy baja.

Debido a la situación actual de la empresa, existen varios propósitos para el uso de código abierto.

Todavía hay muchos proyectos de código abierto relacionados con OCR. El autor resulta ser una empresa que. También necesita funciones similares, así que investigué un poco y lo registré aquí.

Espero que todos señalen la investigación inexacta.

Tesseract es un motor de reconocimiento de imágenes y texto desarrollado por Google y de código abierto, desarrollado con Python.

Por lo tanto, en vista de la situación actual de la empresa, abandonamos el estudio y la investigación de este proyecto.

PaddleOCR es el software de código abierto OCR de código abierto de Baidu para el reconocimiento chino.

EasyOCR es una biblioteca de OCR escrita en Python, que se utiliza para reconocer texto en imágenes y generarlo como texto, y admite más de 80 idiomas.

chinocr

chinocr_lite

TrWebOCR

cnocr

Basado en la discusión comparativa anterior y en base a empresa actual En base a la situación y algunos objetivos previamente establecidos, elegí temporalmente el cnocr más simple para el aprendizaje y el aprendizaje y uso interno. Al mismo tiempo, se creó un proyecto complementario hn_ocr para abordar la situación actual en la que cnocr es solo un paquete de Python y no se puede llamar a través de la interfaz.

Actualmente está en github y todos pueden aprenderlo y mejorarlo juntos.