1. Sản Phẩm
  2.   Aspose.OCR
  3.   Scanned PDF to Text

Scan PDF sang văn bản OCR

Tiết xuất văn bản từ các PDF được quét hoặc chuyển đổi chúng thành tài liệu có thể tìm kiếm. Đọc bất kỳ bố trí và phong cách, xác định chính xác cấu trúc của text và bảng. Giữ hình ảnh ban đầu trong nền để lưu trữ nội dung. Aspose.OCR - Giải pháp rút PDF của bạn cho .NET.

Aspose.OCR Scanned PDF to Text for .NET

.NET OCR plug-in của Aspose.OCR extract text from scanned PDFs or converts them into searchable documents, preserving original images. algorithms advanced accurately identify text and table structures, making it your go-to solution for PDF text extraction.

Làm thế nào để sử dụng Scaned PDF to Text Plugin

  • Cài đặt gói Aspose.OCR từ NuGet hoặc một tệp đã tải về cục bộ.
  • Cài đặt chìa khóa giấy phép của bạn.
  • Tải một hình ảnh đã quét vào đối tượng OcrInput.
  • Tạo một ví dụ của động cơ nhận dạng Aspose.OCR.
  • Thu thập văn bản từ một PDF được quét.
  • Đầu ra văn bản được nhận diện hoặc lưu vào một tệp.

Tải PDF sang Text Converter Plugin

Tải tệp tin hợp của ứng dụng tại downloads hoặc lấy gói từ NuGet để thêm Aspose.OCR trực tiếp vào không gian làm việc của bạn.

  • Tương thích với Microsoft Windows hoặc một hệ điều hành tương thích .NET Standard 2.0
  • Cần một môi trường phát triển như Microsoft Visual Studio.


Tính năng bổ sung

  • Hỗ trợ nhiều trang PDF để lấy văn bản từ mỗi trang.
  • Thiết lập nhận diện văn bản có thể tùy chỉnh để cải thiện độ chính xác.
  • Kết hợp với các thư viện Aspose khác để xử lý tài liệu tiên tiến.

Yêu cầu hệ thống

  • .NET Standard 2.0 hoặc cao hơn là cần thiết để chạy plugin.
  • Tương thích với hệ điều hành Microsoft Windows.
  • Bộ nhớ và không gian đĩa đầy đủ cho hiệu suất tối ưu.


Câu Hỏi Thường Gặp

Việc xác định một ngôn ngữ là cần thiết?

Theo mặc định, Aspose.OCR có thể tự động nhận ra một loạt các ngôn ngữ dựa trên chữ cái Latin mở rộng. Tuy nhiên, việc cung cấp một ngoại ngữ cụ thể có khả năng cải thiện đáng kể độ chính xác nhận thức.

Các định dạng tệp nào được hỗ trợ?

Aspose.OCR hỗ trợ các định dạng phổ biến từ máy quét hoặc máy ảnh, bao gồm PDF, JPEG, PNG, và TIFF. Kết quả nhận dạng được trả về trong văn bản thẳng, HTML, Microsoft Word, pdf, JSON và XML.

Làm thế nào để đạt được kết quả tốt nhất?

Chất lượng hình ảnh tốt rất quan trọng cho việc OCR chính xác. Sử dụng máy quét hoặc máy ảnh có độ phân giải cao. Thư viện bao gồm bộ lọc tiên tiến để tự động cải thiện chất lượng hình ảnh trước khi nhận dạng.

Tìm thêm thông tin và ví dụ ở đâu?

Khám phá tài liệu trực tuyến của chúng tôi hoặc truy cập vào kho lưu trữ Aspose.OCR cho .NET để xem mẫu mã và các dự án trưng bày.

  

Tài Nguyên Hỗ Trợ và Học Tập

  
 Tiếng Việt