El complemento OCR de Aspose.OCR para .NET extrae texto de PDFs escaneados o los convierte en documentos buscables, preservando las imágenes originales. Los algoritmos avanzados identifican con precisión las estructuras de texto y tablas, convirtiéndolo en tu solución principal para la extracción de texto de PDFs.
Obtenga los archivos de ensamblaje respectivos desde los descargas o adquiera el paquete desde NuGet para agregar Aspose.OCR directamente a su espacio de trabajo.
De forma predeterminada, Aspose.OCR puede reconocer automáticamente una amplia gama de idiomas basados en el alfabeto latino extendido. Sin embargo, especificar un idioma específico puede mejorar significativamente la precisión del reconocimiento. Especifique explícitamente el idioma al reconocer textos en cirílico, chino e hindi.
Aspose.OCR admite formatos populares de escáneres o cámaras, incluidos PDF, JPEG, PNG y TIFF. Los resultados de reconocimiento se devuelven en texto plano, HTML, Microsoft Word, PDF, JSON y XML.
La buena calidad de la imagen es crucial para la OCR exacta.Utilizar un escáner o cámara de alta resolución.El plugin incluye filtros avanzados para mejorar automáticamente la calidad del imagen antes del reconocimiento.
Explora nuestra documentación en línea o visita el repositorio de Aspose.OCR para .NET para ver ejemplos de código y proyectos de muestra.