Cyrillic Alphabet OCR in C
IronOCR est un composant logiciel C# permettant aux développeurs .NET de lire du texte à partir d'images et de documents PDF dans 126 langues, y compris l'alphabet cyrillique.
Il s'agit d'une version avancée de Tesseract, conçue exclusivement pour les développeurs .NET et qui surpasse régulièrement les autres moteurs Tesseract en termes de vitesse et de précision.
Contenu de IronOcr.Languages.Cyrillique
Ce package contient 73 langues OCR for .NET :
- Alphabet cyrillique
- Meilleur alphabet cyrillique
- Alphabet cyrillique rapide
Télécharger
Pack de langue alphabet cyrillique [Écritures cyrilliques]
Installation
La première chose à faire est d'installer le package OCR de l'alphabet cyrillique dans votre projet .NET.
Install-Package IronOcr.Languages.Cyrillic
Exemple de code
Cet exemple de code C# lit du texte en alphabet cyrillique à partir d'une image ou d'un document PDF.
using IronOcr;
public class OcrExample
{
public void ReadCyrillicText()
{
// Initialize a new instance of the IronTesseract OCR engine
var Ocr = new IronTesseract();
// Set the OCR engine to use the Cyrillic language package
Ocr.Language = OcrLanguage.Cyrillic;
// Create a new OCR input from an image file
using (var Input = new OcrInput(@"images\Cyrillic.png"))
{
// Read the image using the OCR engine
var Result = Ocr.Read(Input);
// Retrieve Recognized Text
var AllText = Result.Text;
// Output the recognized text to the console
Console.WriteLine(AllText);
}
}
}
using IronOcr;
public class OcrExample
{
public void ReadCyrillicText()
{
// Initialize a new instance of the IronTesseract OCR engine
var Ocr = new IronTesseract();
// Set the OCR engine to use the Cyrillic language package
Ocr.Language = OcrLanguage.Cyrillic;
// Create a new OCR input from an image file
using (var Input = new OcrInput(@"images\Cyrillic.png"))
{
// Read the image using the OCR engine
var Result = Ocr.Read(Input);
// Retrieve Recognized Text
var AllText = Result.Text;
// Output the recognized text to the console
Console.WriteLine(AllText);
}
}
}
Imports IronOcr
Public Class OcrExample
Public Sub ReadCyrillicText()
' Initialize a new instance of the IronTesseract OCR engine
Dim Ocr = New IronTesseract()
' Set the OCR engine to use the Cyrillic language package
Ocr.Language = OcrLanguage.Cyrillic
' Create a new OCR input from an image file
Using Input = New OcrInput("images\Cyrillic.png")
' Read the image using the OCR engine
Dim Result = Ocr.Read(Input)
' Retrieve Recognized Text
Dim AllText = Result.Text
' Output the recognized text to the console
Console.WriteLine(AllText)
End Using
End Sub
End Class
IronTesseract: Il s'agit de la classe du moteur OCR que vous utilisez pour configurer et exécuter les tâches OCR.OcrInput: Une classe représentant l'image ou le document d'entrée sur lequel vous souhaitez effectuer une reconnaissance optique de caractères (OCR).OcrLanguage.Cyrillic: Spécifie que le moteur OCR doit utiliser le package de langue cyrillique pour la reconnaissance.Result.Text: Accède au texte reconnu de l'objet de résultat OCR.
Cet exemple illustre un cas d'utilisation simple où une image contenant du texte cyrillique est traitée pour en extraire le texte.

