1. produk
  2.   Aspose.OCR
  3.   Scanned PDF to Text

Mengimbas PDF untuk teks OCR

Mengekstrak teks daripada PDF yang disemak atau menukarnya kepada dokumen yang boleh dicari.Baca mana-mana tataletak dan gaya, dengan tepat menentukan struktur teks dan jadual.Simpan imej asal dalam latar belakang untuk penyimpanan kandungan.Aspose.OCR - Penyelesaian ekstraksi teks PDF anda untuk .NET.

Aspose.OCR Mengimbas PDF ke teks untuk .NET

Plug-in .NET OCR daripada Aspose.OCR mengekstrak teks daripada PDF yang disemak atau menukarnya kepada dokumen yang boleh dicari, menyimpan imej asal. algoritma canggih dengan tepat mengenal pasti struktur teks dan jadual, menjadikannya penyelesaian anda untuk ekstraksi teks PDF.

Bagaimana untuk menggunakan PDF Scanned untuk Plugin teks

  • Memasang pakej Aspose.OCR daripada NuGet atau fail yang dimuat turun secara tempatan.
  • Setkan kunci lesen anda.
  • Muat turun imej yang disemak ke dalam objek OcrInput.
  • Mencipta contoh enjin pengenalan Aspose.OCR.
  • Mengekstrak teks daripada PDF yang disemak.
  • Keluarkan teks yang diiktiraf atau simpan dalam fail.

Dapatkan PDF yang disemak ke Text Converter Plugin

Dapatkan fail set masing-masing daripada download atau tangkap pakej dari NuGet untuk menambah Aspose.OCR secara langsung ke ruang kerja anda.

  • Sesuai dengan Microsoft Windows atau OS yang kompatibel dengan .NET Standard 2.0 Ia memerlukan persekitaran pembangunan seperti Microsoft Visual Studio.


ciri-ciri tambahan

  • Sokongan untuk pelbagai halaman PDF untuk mengekstrak teks dari setiap halaman.
  • Tetapan pengenalan teks yang boleh disesuaikan untuk ketepatan yang lebih baik.
  • Integrasi dengan perpustakaan Aspose lain untuk pemprosesan dokumen lanjutan.

Keperluan Sistem

.NET Standard 2.0 atau lebih tinggi diperlukan untuk menjalankan plugin.

  • Kompatibel dengan sistem operasi Microsoft Windows. Memori dan ruang cakera yang mencukupi untuk prestasi yang optimum.


Soalan-soalan yang kerap ditanya

Adakah penjelasan bahasa yang diperlukan?

Secara lalai, Aspose.OCR boleh secara automatik mengenali pelbagai bahasa berdasarkan Alphabet Latin Lanjutan. Walau bagaimanapun, menyediakan bahasa tertentu boleh meningkatkan ketepatan pengiktirafan secara signifikan.

Format fail apa yang disokong?

Aspose.OCR menyokong format popular daripada pemindai atau kamera, termasuk PDF, JPEG, PNG, dan TIFF. Hasil pengiktirafan dikembalikan dalam teks rata, HTML, Microsoft Word, pdf, JSON dan XML.

Bagaimana untuk mencapai hasil yang terbaik?

Kualiti imej yang baik adalah penting untuk OCR yang tepat. Gunakan pemindai atau kamera resolusi tinggi. Plugin termasuk penapis canggih untuk secara automatik meningkatkan kualiti gambar sebelum pengiktirafan.

Di manakah saya boleh mendapatkan maklumat dan contoh?

Menjelajahi dokumen dalam talian atau lawati Aspose.OCR untuk repositori .NET untuk sampel kod dan projek pameran.

  

Sumber sokongan dan pembelajaran

  
 Melayu