OCR afrikaans en C# et .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
Other versions of this document:

IronOCR est un composant logiciel C# permettant aux développeurs .NET de lire du texte à partir d'images et de documents PDF dans 126 langues, dont l'afrikaans.

Il s'agit d'une version avancée de Tesseract, conçue exclusivement pour les développeurs .NET et qui surpasse régulièrement les autres moteurs Tesseract en termes de vitesse et de précision.

Contenu d'IronOcr.Languages.Afrikaans

Ce package contient 52 langues OCR pour .NET :

  • Afrikaans
  • AfrikaansBest
  • AfrikaansFast

Télécharger

Pack de langue afrikaans [afrikaans]

  • Télécharger au format Zip
  • Installer avec NuGet

Installation

La première chose à faire est d'installer notre package OCR afrikaans sur votre projet .NET.

Install-Package IronOCR.Languages.Afrikaans

Exemple de code

Cet exemple de code C# lit du texte afrikaans à partir d'une image ou d'un document PDF.

// First, ensure the IronOcr.Languages.Afrikaans package is installed in your project.
// This example requires the IronOcr C# package to read text from images or PDFs.

using IronOcr;

var Ocr = new IronTesseract(); // Initialize the IronTesseract class
Ocr.Language = OcrLanguage.Afrikaans; // Set the language to Afrikaans

// Load the image or PDF document into an OcrInput object
using (var Input = new OcrInput(@"images\Afrikaans.png"))
{
    // Perform OCR on the input document
    var Result = Ocr.Read(Input);

    // Retrieve the complete recognized text
    var AllText = Result.Text;

    // Output the recognized text (this step is customizable for your use-case)
    Console.WriteLine(AllText);
}
// First, ensure the IronOcr.Languages.Afrikaans package is installed in your project.
// This example requires the IronOcr C# package to read text from images or PDFs.

using IronOcr;

var Ocr = new IronTesseract(); // Initialize the IronTesseract class
Ocr.Language = OcrLanguage.Afrikaans; // Set the language to Afrikaans

// Load the image or PDF document into an OcrInput object
using (var Input = new OcrInput(@"images\Afrikaans.png"))
{
    // Perform OCR on the input document
    var Result = Ocr.Read(Input);

    // Retrieve the complete recognized text
    var AllText = Result.Text;

    // Output the recognized text (this step is customizable for your use-case)
    Console.WriteLine(AllText);
}
' First, ensure the IronOcr.Languages.Afrikaans package is installed in your project.
' This example requires the IronOcr C# package to read text from images or PDFs.

Imports IronOcr

Private Ocr = New IronTesseract() ' Initialize the IronTesseract class
Ocr.Language = OcrLanguage.Afrikaans ' Set the language to Afrikaans

' Load the image or PDF document into an OcrInput object
Using Input = New OcrInput("images\Afrikaans.png")
	' Perform OCR on the input document
	Dim Result = Ocr.Read(Input)

	' Retrieve the complete recognized text
	Dim AllText = Result.Text

	' Output the recognized text (this step is customizable for your use-case)
	Console.WriteLine(AllText)
End Using
$vbLabelText   $csharpLabel

Explication :

  • IronTesseract : Cette classe fait partie de la bibliothèque IronOCR et est utilisée pour configurer le processus OCR.
  • OcrLanguage : Cette propriété définit la langue pour la reconnaissance optique de caractères (OCR). Ici, c'est en afrikaans.
  • OcrInput : Cette classe encapsule le fichier d'entrée pour le processus OCR. Il prend en charge différents formats d'image et les fichiers PDF.
  • Ocr.Read() : Cette méthode exécute le processus OCR et renvoie le texte reconnu encapsulé dans un objet résultat.
  • Result.Text : Cette propriété contient le texte extrait du document d'entrée.