OCR en afrikaanse en C#en .NET

Ander weergawes van hierdie dokument:

IronOCR es un componente de software C# que permite a los usuarios de .NET crear y descargar archivos PDF en 126 formatos, sin necesidad de instalar ningún software adicional Afrikaans, kan lees.

Esta es la nueva versión de Tesseract, que se adapta mejor a los usuarios de .NET y es más fácil de usar as ander Tesseract-enjins vir snelheid en akkuraatheid.

Información sobre IronOcr.Languages.Afrikaans

Este paquete contiene 52 archivos OCR para .NET:

  • Afrikaans
  • AfrikaansBeste
  • AfrikaansRápido

Aflaai

Paquete de cocina afrikaanse [Afrikaans]

* Descargar como Rits * Instalar con NuGet

Installasie

Lo primero que tenemos que hacer es Afrikaanse Paquete de OCR para instalar en su proyecto .NET.

PM> Install-Package IronOCR.Languages.Afrikaans

Kode Voorbeeld

Este código de C# le ayuda a aprender afrikáans con un documento en formato PDF o en papel.

```cs //PM> Install-Package IronOcr.Languages.Afrikaans using IronOcr; var Ocr = new IronTesseract(); Ocr.Language = OcrLanguage.Afrikaans; using (var Input = new OcrInput(@"images\Afrikaans.png")) { var Result = Ocr.Read(Input); Var AllText = Result.Text } ```

¿Qué es IronOCR?

IronOCR es una biblioteca de software para .NET fácil de instalar, completa y bien desarrollada.

Kies IronOCR om OCR-akkuraatheid van 99,8% + para utilizar las páginas web de terceros, deurlopende fooie of vertroulike dokumente oor die internet te stuur.

Por qué C#-ontwikkelaars kies IronOCR bo Vanilla Tesseract:

  • Instalarlo como 'n enkele DLL de NuGet
  • Ingesluit vir Tesseract 5, 4 en 3 Motores fuera de la caja.
  • Akkuraatheid 99,8% mejor que Tesseract.
  • Blaai spoed en multithreading
  • MVC, WebApp, Desktop, Console & Server Application versoenbaar
  • No hay ejemplos de C ++ - código para trabajar conmigo
  • Todos los archivos PDF-OCR-ondersteuning
  • Para utilizar OCR en cualquier archivo PDF
  • Total compatibilidad con .NET Core, Standard y FrameWork
  • Ontplooi op Windows, Mac, Linux, Azure, Docker, Lambda, AWS
  • Lees strepieskodes en QR-kodes
  • OCR en XHTML
  • Aplicar OCR a documentos PDF de alto rendimiento
  • Uso de subprocesos múltiples
  • 126 noticias internacionales sobre el mundo a través de NuGet- o OcrData-lêers bestuur
  • Onttrek beelde, koördinate, statistieke en lettertipes. No se preocupe.
  • Puede utilizar Tesseract OCR en aplicaciones empresariales y de servicios.

Yster OCR le permite trabajar con archivos de trabajo y documentos impresos, como fotos o imágenes resolusie wat digitale geraas of onvolmaakthede kan hê.

Ander gratis OCR- biblioteke vir die .NET-platform, soos ander .net tesseract-API's en webdienste, presteer nie so goed in hierdie gebruiksgevalle nie.

OCR se reunió con Tesseract 5 - Comenzar la codificación en C #

El siguiente tutorial explica lo fácil que es aprender a utilizar C# o VB .NET.

OneLiner

```cs string Text = new IronTesseract().Read(@"img\Screenshot.png").Text; ```

Configurar Hello World

```cs // PM> Install-Package IronOCR.Languages.Afrikaans using IronOcr; var Ocr = new IronTesseract(); Ocr.Language = OcrLanguage.Afrikaans; using (var Input = new OcrInput()){ Input.AddImage("images/sample.jpeg") //... u kan enige aantal beelde byvoeg var Result = Ocr.Read(Input); Console.WriteLine(Result.Text); } ```

C#PDF OCR

También puede utilizar esta opción para añadir texto a un documento PDF.

```cs var Ocr = new IronTesseract(); Ocr.Language = OcrLanguage.Afrikaans; using (var input = new OcrInput()) { input.AddPdf("example.pdf", "password"); // Ons kan ook spesifieke PDF-bladsynommers vir OCR kies var Result = Ocr.Read(input); Console.WriteLine(Result.Text); Console.WriteLine($"{Result.Pages.Count()} Pages"); // 1 bladsy vir elke bladsy in die PDF } ```

OCR vir TIFF's multipágina

OCR Lees TIFF-lêerformaat, insluitend dokumente met meerdere bladsye. El formato TIFF también puede guardarse en un archivo PDF con soekbare teks omgeskakel word.

```cs using IronOcr; var Ocr = new IronTesseract(); Ocr.Language = OcrLanguage.Afrikaans; using (var Input = new OcrInput()){ input.AddMultiFrameTiff("multi - frame.tiff"); var Result = Ocr.Read(Input); Console.WriteLine(Result.Text); } ```

Códigos de barras en QR

una característica única de IronOCR es que los códigos de barras y los códigos QR de los documentos se pueden leer cuando no se utilizan. Gevalle van die OcrResult.OcrBarcode el servicio de atención al cliente le proporcionará información detallada sobre el producto geskandeerde strepieskode.

```cs // using IronOcr; var Ocr = new IronTesseract(); Ocr.Configuration.ReadBarCodes = true; using (var input = new OcrInput()) { input.AddImage("img/Barcode.png"); var Result = Ocr.Read(input); foreach (var Barcode in Result.Barcodes) { Console.WriteLine(Barcode.Value); // tipe en liggingseienskappe ook blootgestel } } ```

OCR para campos específicos

Todos los escáneres y leesmetodos de IronOCR se han utilizado para detectar presiones en la superficie de la sangre o en la piel bladsye ons teks wil lees. Es muy práctico, ya que nos ayuda a gestionar los pedidos y nos facilita mucho las cosas doeltreffendheid kan verbeter.

Para obtener más información, póngase en contacto con nosotros Sistema.Dibujo sodat ons die System.Drawing.Rectangle que se puede utilizar.

```cs using IronOcr; var Ocr = new IronTesseract(); Ocr.Language = OcrLanguage.Afrikaans; using (var Input = new OcrInput()) { var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 }; // Die afmetings is in px Input.Add("document.png", ContentArea); var Result = Ocr.Read(Input); Console.WriteLine(Result.Text); } ```

Reconocimiento óptico de caracteres (OCR) de la pantalla del ordenador

Muere IronOCR OcrInput klas kan skanderings regstel wat normale Tesseract nie kan lees nie.

```cs using IronOcr; var Ocr = new IronTesseract(); Ocr.Language = OcrLanguage.Afrikaans; using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff")) { Input.DeNoise(); // herstel digitale geraas en swak skandering Input.Deskew(); // draai rotasie en perspektief reg var Result = Ocr.Read(Input); Console.WriteLine(Result.Text); } ```

Obtenga resultados de OCR en un PDF completo

Descarga en formato PDF con enlaces de texto fáciles de copiar. Se puede descargar desde la página de inicio y la base de datos.

```cs using IronOcr; var Ocr = new IronTesseract(); Ocr.Language = OcrLanguage.Afrikaans; using (var Input = new OcrInput()){ input.Title = "Quarterly Report" input.AddImage("image1.jpeg"); input.AddImage("image2.png"); input.AddImage("image3.gif"); var Result = Ocr.Read(input); Result.SaveAsSearchablePdf("searchable.pdf") } ```

TIFF en PDF de alta calidad

Conectar un documento TIFF (de enige groep beeldlêers) direk na 'n soekbare PDF wat deur middel van intranet-, webwerf- en google-soekenjins geïndekseer kan word.

```cs using IronOcr; var Ocr = new IronTesseract(); Ocr.Language = OcrLanguage.Afrikaans; using (var Input = new OcrInput()){ input.AddMultiFrameTiff("example.tiff") var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf") } ```

Convertir el resultado de OCR en HTML

Reconocimiento óptico de caracteres en XHTML.

```cs using IronOcr; var Ocr = new IronTesseract(); Ocr.Language = OcrLanguage.Afrikaans; using (var Input = new OcrInput()){ input.Title = "Html Title" input.AddImage("image1.jpeg"); var Result = Ocr.Read(input); Result.SaveAsHocrFile("results.html"); } ```

OCR-beeldverbeteringsfilters

IronOCR vende filtros únicos OcrInput para mejorar el OCR.

Código de conducta de la empresa

Haga que la imagen de OCR de su ordenador sea realista para obtener un resultado de OCR mejor y más claro.

```cs using IronOcr; var Ocr = new IronTesseract(); Ocr.Language = OcrLanguage.Afrikaans; using (var Input = new OcrInput(@"LowQuality.jpeg")) { Input.DeNoise(); // herstel digitale geraas en swak skandering Input.Deskew(); // draai rotasie en perspektief reg var Result = Ocr.Read(Input); Console.WriteLine(Result.Text); } ```

Lys se reunió con OCR-beeldfilters

Filtros de facturación para mejorar el reconocimiento óptico de caracteres que se utiliza en IronOCR:

  • OcrInput.Rotate (grado de dubbele) - Draai beelde met 'n aantal grade kloksgewys. Visite negatiewe getalle vir antikloksgewys.
  • OcrInput.Binarizar () - Hierdie filtro de caparazón haz que el píxel sea ingenioso sonder middelgrond. Es un lector de OCR de alta calidad con una distancia muy corta entre la pantalla y el ordenador.
  • OcrInput.ToGrayEscala () - Hierdie filtro de caparazón verander elke pixel in 'n skakering van grysskaal. No se trata de un verificador de OCR, sino de una herramienta de ayuda verbeter
  • OcrInput.Contraste () - Verhoog die kontras outomaties. Este filtro contiene OCR-spoed y akkuraatheid in skanderings met lae kontras.
  • OcrInput.DeNoise () - Verwyder digitale geraas. Este filtro debe usarse sólo cuando geraas verwag word.
  • OcrInput.Invertir () - skakel elke kleur om. Bv. Wit palabra swart: swart palabra wit.
  • OcrInput.Dilate () - Gevorderde morfologie. Dilatasie voeg pixels by aan die grense van voorwerpe in 'n beeld. Oorkant Erode
  • OcrInput.Erode () - Gevorderde morfologie. Erosie verwyder pixels op voorwerpgrense oorkant Dilate
  • OcrInput.Deskew () - Draai 'n beeld sodat dit op die regte manier en ortogonaal is. Es baie handig vir OCR, omdat die toleransie van Tesseract vir skewe skanderings tot 5 grade kan wees.
  • OcrInput.DeepCleanRuido de fondo () - Swaar agtergrondgeraasverwydering. Utilice esta página filter slegs indien ekstreme agtergrondgeluide van dokumente is bekend, omdat hierdie filter ook die OCR-akkuraatheid van skoon dokumente kan verminder, en dit is baie duur vir die CPU.
  • OcrInput.MejorarResolución - Verbeter die resolusie van beelde van lae gehalte. Filtro Hierdie is nie dikwels nodig nie omdat OcrInput.MinimumDPI en OcrInput.TargetDPI outomaties insette met lae resolusie sal opvang en oplos.

Skoon agtergrond lawaai. Dit is 'n bietjie tydrowende omgewing; así es como funciona la biblioteca para hacer más atractivas las tarjetas digitales, los reproductores de papel y otras herramientas de impresión en formato digital, wat dit andersins onbevoeg kan maak om deur ander OCR-biblioteke gelees te word.

MejorarContraste es 'n instelling wat veroorsaak dat IronOCR die kontras van die teks las outomaties ayudan a mejorar la calidad de la imagen, la precisión del OCR y el rendimiento die snelheid van OCR gewoonlik verhoog.

MejorarResolución es 'n instelling wat outomaties beelde met lae resolusie (wat minder as 275 dpi het) sal opspoor en die beeld outomaties sal opskaal en dan die hele teks sal verskerp sodat dit perfek gelees puede descargar su biblioteca OCR. Si bien esta respuesta a su pregunta es obvia, es probable que vuelva a hacerlo algehele tyd vir 'n OCR-bewerking op 'n beeld.

Idioma IronOCR cuenta con 22 paquetes de software internacionales y puede utilizarlos en cualquier momento om een of meer tale te kies wat vir 'n OCR-operasie toegepas moet word.

Estrategia IronOCR desarrolla dos estrategias. Ons kan kies om 'n vinnige en minder akkurate la elaboración de un documento o la aplicación de una estrategia eficaz para ayudar a las personas a sobrevivir uso de un modelo de inteligencia para verificar la exactitud de los datos de OCR en las estadísticas verhouding van woorde in 'n sin te kyk. .

Espacio de color is 'n instelling waardeur ons OCR in grysskaal of kleur kan kies. Para todos es la mejor opción. Soms, as daar tekste of agtergronde van 'n soortgelyke tint is, maar baie anders, sal 'n kleurkleurruimte beter resultate lewer.

DetectarTextoBlancoEnFondosOscuros. Todos los libros OCR están disponibles para su consulta en línea agtergronde te sien. Con esta solicitud, IronOCR puede ofrecer información negativa o falsa sobre sus datos personales en dit lees.

InputImageType. Con esta herramienta, el usuario puede acceder a la biblioteca OCR o no volledige dokument of 'n fragment kyk, soos 'n kiekie.

Girar y enderezar es un pedido urgente de IronOCR para que se convierta en único lea documentos que no son de dominio público, pero que ofrecen una perspectiva más amplia, como las fotos de los documentos.

LeerCódigos es una práctica función que utiliza los códigos de barras y QR de IronOCR bladsye kan lees, aangesien dit ook teks lees, sonder om 'n groot ekstra tydlas por te voeg.

Kleurdiepte. En este ejemplo se muestra la cantidad de bits por píxel que puede utilizar la biblioteca OCR para die diepte van 'n kleur te bepaal. n Groter kleurdiepte kan die OCR-kwaliteit verhoog, maar dit sal ook die tyd wat die OCR-bewerking benodig om te voltooi, vergroot.

126 Taalpakkette

IronOCR ondersteun 126 cuento internaionale via taalpakkette wat as DLL's versprei word, wat en esta página web de van die Gestor de paquetes NuGet afgelaai kan palabra.

Tale sluit Duits, Frans, Engels, Chinees, Japannees and vele meer in. El paquete de servicios especializados está disponible en MRZ, Tarjetas MICR, datos financieros, plantillas nominativas y mucho más. También puede utilizar el tesseract ".traineddata" -lêer gebruik - ook die lêers wat u self skep.

Taalvoorbeeld

El uso de otros OCR.

```cs // using IronOcr; // PM> Install IronOcr.Languages.Arabic var Ocr = new IronTesseract(); Ocr.Language = OcrLanguage.Arabic; using (var input = new OcrInput()) { input.AddImage("img/arabic.gif"); // Voeg prentfilters by indien nodig // In hierdie geval is selfs insette van baie lae gehalte // IronTesseract kan lees wat konvensionele Tesseract nie kan nie. var Result = Ocr.Read(input); // Die konsole kan nie maklik Arabies op Windows druk nie. // Laat ons eerder op die skyf stoor. Result.SaveAsTextFile("arabic.txt"); } ```

Más información

También es posible utilizar el OCR con ayuda de varios tipos de texto. Esto puede ser de gran ayuda para el inglés metadata en urls in Unicode-dokumente te kry.

```cs // using IronOcr; // PM> Install IronOcr.Languages.ChineseSimplified var Ocr = new IronTesseract(); Ocr.Language = OcrLanguage.ChineseSimplified; Ocr.AddSecondaryLanguage(OcrLanguage.Afrikaans); // Ons kan enige aantal tale byvoeg using (var input = new OcrInput()) { input.Add("multi - language.pdf"); var Result = Ocr.Read(input); Result.SaveAsTextFile("results.txt"); } ```

Guía práctica de OCR

IronOCR es un programa de reconocimiento óptico de caracteres para cualquier trabajo de reconocimiento óptico de caracteres. Para un uso más generalizado de las tarjetas de crédito el objetivo de esta encuesta es mejorar la calidad de vida de los ciudadanos. El resultado del OCR en DOM es por ejemplo baie meer gevorderd as dit.

```cs using IronOcr; using System.Drawing; //Voeg vergaderingverwysing by var Ocr = new IronTesseract(); Ocr.Language = OcrLanguage.Afrikaans; Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm; Ocr.Configuration.ReadBarCodes = true; //!Belangrik using (var Input = new OcrInput(@"images\sample.tiff")) { OcrResult Result = Ocr.Read(Input); var Pages = Result.Pages; var Words = Pages [0].Words; var Barcodes = Result.Barcodes; // Verken hier om 'n uitgebreide, gedetailleerde API te vind: // - Bladsye, blokke, parafafs, lyne, woorde, karakters // - Beelduitvoer, lettertypekoördinate, statistiese data } ```

Optrede

IronOCR ha trabajado en el mercado, tanto para mejorar la facturación como para reducir los costes.

La velocidad es ardiente: IronOcr.2020 + es hasta 10 veces más veloz y ofrece hasta un 250% menos de potencia que los modelos anteriores.

Leer más

Para obtener más información sobre OCR en C#, VB, F# o cualquier otro lenguaje .NET, lees gerus ons gemeenskapshandleidings , wat werklike wêreldvoorbeelde gee van hoe IronOCR gebruik kan word en wat die nuanses kan toon van hoe u die beste kan haal uit hierdie biblioteek.

'N Volledige objekverwysing vir .NET-ontwikkelaars es ook beskikbaar.