1. Produktai
  2.   Aspose.OCR
  3.   Scanned PDF to Text

Skanytas PDF į tekstą OCR

Ištrinkite tekstą iš skanintų PDF arba konvertuokite juos į paieškos dokumentus. perskaitykite bet kokį išdėstymą ir stilių, tiksliai apibrėžkite teksto ir lentelių struktūrą. Išsaugokite originalias nuotraukas fone turinio saugojimui. Aspose.OCR - Jūsų PDF teksto ekstrakcijos sprendimas .NET.

ASPOSE.OCR Skanytas PDF į tekstą .NET

ASPOSE.OCR .NET OCR priedai išgauna tekstą iš skanintų PDF arba konvertuoja juos į paieškos dokumentus, išsaugojant originalius vaizdus. Išplėstiniai algoritmai tiksliai nustato teksto ir lentelės struktūras, todėl tai yra jūsų PDF teksto ekstrakcijos sprendimas.

Kaip naudoti Skanytą PDF į Teksto Plugin

  • Įdiegti Aspose.OCR paketą iš NuGet arba lokaliai atsisiųstą failą.
  • Nustatykite savo licencijos raktus. Atsisiųskite vaizdą į OcrInput objektą.
  • Sukurkite Aspose.OCR atpažinimo variklio pavyzdį.
  • Išskaičiuoti tekstą iš nuskaityto PDF.
  • Išvesti pripažintą tekstą arba išsaugoti jį į failą.

Gaukite Skanytą PDF į teksto konverterį Plugin

Gaukite atitinkamus surinkimo failus iš nuolaidų arba įveskite paketą nuo NuGet, kad pridėtumėte Aspose.OCR tiesiogiai į savo darbo erdvę.

  • Suderinamas su „Microsoft Windows“ arba suderinama sistema su .NET Standard 2.0
  • Reikia tokios plėtros aplinkos kaip „Microsoft Visual Studio“.


Papildomos funkcijos

  • Palaiko daugialypį PDF, kad būtų galima iš kiekvieno puslapio ištraukti tekstą.
  • Pritaikytos teksto atpažinimo nustatymai, siekiant pagerinti tikslumą.
  • Integracija su kitomis Aspose bibliotekomis pažangiam dokumentų apdorojimui.

Sistemos reikalavimai

  • .NET Standard 2.0 arba didesnis reikalingas norint paleisti priedą. Suderinama su „Microsoft Windows“ operacinėmis sistemomis. Tinkama atmintis ir diskų erdvė optimaliam veikimui.


Dažnai užduodami klausimai

Ar būtina nustatyti kalbą?

Pavyzdžiui, Aspose.OCR gali automatiškai atpažinti platų kalbų spektrą, pagrįstą išplėstine lotynų abėcėlė. Tačiau, teikiant konkrečią kalbą gali žymiai padidinti pripažinimo tikslumą.

Kokius failų formatus palaiko?

Aspose.OCR palaiko populiarius formatus iš skanerių ar kamerų, įskaitant PDF, JPEG, PNG ir TIFF. Atpažinimo rezultatai grąžinami plokščiajame tekste, HTML, Microsoft Word, pdf, JSON ir XML.

Kaip pasiekti geriausią rezultatą?

Geras vaizdo kokybė yra labai svarbi tiksliam OCR. Naudokite skenerį ar aukštos raiškos kamerą. Pluginas apima pažangius filtrus, kurie automatiškai pagerina vaizdų kokybę prieš atpažįstant.

Kur rasti daugiau informacijos ir pavyzdžių?

Atraskite mūsų internetinę dokumentaciją arba apsilankykite Aspose.OCR .NET repository kodo mėginių ir parodymo projektų.

  

Parama ir mokymosi ištekliai

  
 Lietuvių