Traduction OCR en C# et .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English

126 autres langues

IronOCR est un composant logiciel C# permettant aux développeurs .NET de lire du texte à partir d'images et de documents PDF dans 126 langues, dont le tigrinya. Il s'agit d'une version avancée de Tesseract, conçue exclusivement pour les développeurs .NET et qui surpasse régulièrement les autres moteurs Tesseract en termes de vitesse et de précision.

Contenu de IronOcr.Languages.Tigrinya

Ce package contient 49 langues OCR pour .NET :

  • Tigrinya
  • TigrinyaBest -TigrinyaFast

Télécharger

Pack de langue tigrinya [Tigrinya]

  • Télécharger au format Zip
  • Installer avec NuGet

Installation

La première chose à faire est d'installer le package OCR Tigrinya sur votre projet .NET.

Install-Package IronOCR.Languages.Tigrinya

Exemple de code

Cet exemple de code C# lit du texte tigrinya à partir d'une image ou d'un document PDF.

using IronOcr;

class Program
{
    static void Main()
    {
        // Create a new instance of IronTesseract to perform OCR
        var Ocr = new IronTesseract();

        // Set the OCR language to Tigrinya
        Ocr.Language = OcrLanguage.Tigrinya;

        // Using statement ensures the OcrInput object is disposed of after use
        using (var Input = new OcrInput(@"images\Tigrinya.png"))
        {
            // Perform OCR on the input image
            var Result = Ocr.Read(Input);

            // Extract all text recognized in the image and store it in a variable
            var AllText = Result.Text;

            // Output the extracted text
            Console.WriteLine(AllText);
        }
    }
}
using IronOcr;

class Program
{
    static void Main()
    {
        // Create a new instance of IronTesseract to perform OCR
        var Ocr = new IronTesseract();

        // Set the OCR language to Tigrinya
        Ocr.Language = OcrLanguage.Tigrinya;

        // Using statement ensures the OcrInput object is disposed of after use
        using (var Input = new OcrInput(@"images\Tigrinya.png"))
        {
            // Perform OCR on the input image
            var Result = Ocr.Read(Input);

            // Extract all text recognized in the image and store it in a variable
            var AllText = Result.Text;

            // Output the extracted text
            Console.WriteLine(AllText);
        }
    }
}
Imports IronOcr

Friend Class Program
	Shared Sub Main()
		' Create a new instance of IronTesseract to perform OCR
		Dim Ocr = New IronTesseract()

		' Set the OCR language to Tigrinya
		Ocr.Language = OcrLanguage.Tigrinya

		' Using statement ensures the OcrInput object is disposed of after use
		Using Input = New OcrInput("images\Tigrinya.png")
			' Perform OCR on the input image
			Dim Result = Ocr.Read(Input)

			' Extract all text recognized in the image and store it in a variable
			Dim AllText = Result.Text

			' Output the extracted text
			Console.WriteLine(AllText)
		End Using
	End Sub
End Class
$vbLabelText   $csharpLabel

Explication

  • IronTesseract : Il s'agit d'une classe spécialisée d'IronOCR utilisée pour effectuer la reconnaissance de texte.
  • Ocr.Language : Définit la langue utilisée par le moteur OCR. Dans cet exemple, elle est définie sur le tigrinya.
  • OcrInput : Représente la source d'entrée, une image dans ce cas, qui sera convertie en texte.
  • Ocr.Read(Input) : Exécute la reconnaissance optique de caractères (OCR) sur l'entrée spécifiée et renvoie les résultats.
  • Result.Text : Contient le texte extrait de l'image d'entrée après le processus OCR.
  • Console.WriteLine(AllText) : Affiche le texte extrait dans la console. Cette ligne est facultative et peut être supprimée si la sortie console n'est pas nécessaire.