OCR letton en C# et .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
Other versions of this document:

IronOCR est un composant logiciel C# permettant aux développeurs .NET de lire du texte à partir d'images et de documents PDF dans 126 langues, dont le letton.

Il s'agit d'une version avancée de Tesseract, conçue exclusivement pour les développeurs .NET et qui surpasse régulièrement les autres moteurs Tesseract en termes de vitesse et de précision.

Contenu de IronOcr.Langues.Letton

Ce package contient 46 langues OCR pour .NET :

  • Letton
  • LatvianBest
  • LatvianFast

Télécharger

Pack de langue lettone [langue lettone]

  • Télécharger au format ZIP
  • Installer avec NuGet

Installation

La première chose à faire est d'installer le package OCR letton dans votre projet .NET.

Install-Package IronOCR.Languages.Latvian

Exemple de code

Cet exemple de code C# lit du texte letton à partir d'une image ou d'un document PDF.

using IronOcr;

class LatvianOCRExample
{
    static void Main()
    {
        // Create an instance of IronTesseract for OCR
        var Ocr = new IronTesseract();

        // Set the OCR language to Latvian
        Ocr.Language = OcrLanguage.Latvian;

        // Define the input image file path
        using (var Input = new OcrInput(@"images\Latvian.png"))
        {
            // Perform OCR on the input image
            var Result = Ocr.Read(Input);

            // Extract all recognized text from the OCR result
            var AllText = Result.Text;

            // Output the recognized text to the console
            Console.WriteLine(AllText);
        }
    }
}
using IronOcr;

class LatvianOCRExample
{
    static void Main()
    {
        // Create an instance of IronTesseract for OCR
        var Ocr = new IronTesseract();

        // Set the OCR language to Latvian
        Ocr.Language = OcrLanguage.Latvian;

        // Define the input image file path
        using (var Input = new OcrInput(@"images\Latvian.png"))
        {
            // Perform OCR on the input image
            var Result = Ocr.Read(Input);

            // Extract all recognized text from the OCR result
            var AllText = Result.Text;

            // Output the recognized text to the console
            Console.WriteLine(AllText);
        }
    }
}
Imports IronOcr

Friend Class LatvianOCRExample
	Shared Sub Main()
		' Create an instance of IronTesseract for OCR
		Dim Ocr = New IronTesseract()

		' Set the OCR language to Latvian
		Ocr.Language = OcrLanguage.Latvian

		' Define the input image file path
		Using Input = New OcrInput("images\Latvian.png")
			' Perform OCR on the input image
			Dim Result = Ocr.Read(Input)

			' Extract all recognized text from the OCR result
			Dim AllText = Result.Text

			' Output the recognized text to the console
			Console.WriteLine(AllText)
		End Using
	End Sub
End Class
$vbLabelText   $csharpLabel

Explication

  • Espace de noms IronOcr : L'exemple commence par importer l'espace de noms IronOcr , nécessaire pour accéder aux fonctionnalités OCR.
  • Instance IronTesseract : L'objet IronTesseract ( Ocr ) est créé pour gérer la lecture d'images et l'extraction de texte.
  • Configuration de la langue : Le processus OCR est configuré pour lire le texte letton en définissant la propriété Ocr.Language .
  • Objet OcrInput : Un objet OcrInput est créé, faisant référence au fichier image à traiter.
  • Lecture de l'image : La méthode Read est appelée sur l'instance Ocr pour traiter l'image et extraire le texte, stocké dans la variable Result.
  • Extraction des résultats : Les résultats de la reconnaissance optique de caractères (OCR) sont accessibles via Result.Text et stockés dans AllText pour une utilisation ou un affichage ultérieurs.
  • Sortie console : Le texte letton reconnu est affiché sur la console, fournissant une confirmation visuelle de l'extraction du texte.