OCR de l'alphabet cyrillique en C

This article was translated from English: Does it need improvement?
Translated
View the article in English

126 autres langues

IronOCR est un composant logiciel C# permettant aux développeurs .NET de lire du texte à partir d'images et de documents PDF dans 126 langues, y compris l'alphabet cyrillique.

Il s'agit d'une version avancée de Tesseract, conçue exclusivement pour les développeurs .NET et qui surpasse régulièrement les autres moteurs Tesseract en termes de vitesse et de précision.

Contenu de IronOcr.Languages.Cyrillique

Ce package contient 73 langues OCR pour .NET :

  • Alphabet cyrillique
  • Meilleur alphabet cyrillique
  • Alphabet cyrillique rapide

Télécharger

Pack de langue alphabet cyrillique [Écritures cyrilliques]

  • Télécharger au format Zip
  • Installer avec NuGet

Installation

La première chose à faire est d'installer le package OCR de l'alphabet cyrillique dans votre projet .NET.

Install-Package IronOCR.Languages.Cyrillic

Exemple de code

Cet exemple de code C# lit du texte en alphabet cyrillique à partir d'une image ou d'un document PDF.

using IronOcr;

public class OcrExample
{
    public void ReadCyrillicText()
    {
        // Initialize a new instance of the IronTesseract OCR engine
        var Ocr = new IronTesseract();

        // Set the OCR engine to use the Cyrillic language package
        Ocr.Language = OcrLanguage.Cyrillic;

        // Create a new OCR input from an image file
        using (var Input = new OcrInput(@"images\Cyrillic.png"))
        {
            // Read the image using the OCR engine
            var Result = Ocr.Read(Input);

            // Retrieve Recognized Text
            var AllText = Result.Text;

            // Output the recognized text to the console
            Console.WriteLine(AllText);
        }
    }
}
using IronOcr;

public class OcrExample
{
    public void ReadCyrillicText()
    {
        // Initialize a new instance of the IronTesseract OCR engine
        var Ocr = new IronTesseract();

        // Set the OCR engine to use the Cyrillic language package
        Ocr.Language = OcrLanguage.Cyrillic;

        // Create a new OCR input from an image file
        using (var Input = new OcrInput(@"images\Cyrillic.png"))
        {
            // Read the image using the OCR engine
            var Result = Ocr.Read(Input);

            // Retrieve Recognized Text
            var AllText = Result.Text;

            // Output the recognized text to the console
            Console.WriteLine(AllText);
        }
    }
}
Imports IronOcr

Public Class OcrExample
	Public Sub ReadCyrillicText()
		' Initialize a new instance of the IronTesseract OCR engine
		Dim Ocr = New IronTesseract()

		' Set the OCR engine to use the Cyrillic language package
		Ocr.Language = OcrLanguage.Cyrillic

		' Create a new OCR input from an image file
		Using Input = New OcrInput("images\Cyrillic.png")
			' Read the image using the OCR engine
			Dim Result = Ocr.Read(Input)

			' Retrieve Recognized Text
			Dim AllText = Result.Text

			' Output the recognized text to the console
			Console.WriteLine(AllText)
		End Using
	End Sub
End Class
$vbLabelText   $csharpLabel
  • IronTesseract : Il s'agit de la classe du moteur OCR que vous utilisez pour configurer et exécuter les tâches OCR.
  • OcrInput : Une classe représentant l'image ou le document d'entrée sur lequel vous souhaitez effectuer une reconnaissance optique de caractères (OCR).
  • OcrLanguage.Cyrillic : Spécifie que le moteur OCR doit utiliser le module de langue cyrillique pour la reconnaissance.
  • Result.Text : Accède au texte reconnu à partir de l'objet de résultat OCR.

Cet exemple illustre un cas d'utilisation simple où une image contenant du texte cyrillique est traitée pour en extraire le texte.