OCR corse en C# et .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
Other versions of this document:

IronOCR est un composant logiciel C# permettant aux développeurs .NET de lire du texte à partir d'images et de documents PDF dans 126 langues, dont le corse.

Il s'agit d'une version avancée de Tesseract, conçue exclusivement pour les développeurs .NET et qui surpasse régulièrement les autres moteurs Tesseract en termes de vitesse et de précision.

Contenu de IronOcr.Langues.Corse

Ce package contient 49 langues OCR pour .NET :

  • Corse
  • Corse
  • CorsicanFast

Télécharger

Pack de langue corse [corse]

  • Télécharger au format Zip
  • Installer avec NuGet

Installation

La première chose à faire est d'installer notre package OCR corse sur votre projet .NET.

Install-Package IronOCR.Languages.Corsican

Exemple de code

Cet exemple de code C# lit du texte corse à partir d'une image ou d'un document PDF.

// First, ensure the IronOcr.Languages.Corsican package is installed
// You can use the NuGet Package Manager console:
// PM> Install-Package IronOcr.Languages.Corsican

using IronOcr;

var Ocr = new IronTesseract();

// Set the OCR language to Corsican
Ocr.Language = OcrLanguage.Corsican;

// Reading text from an image file
using (var Input = new OcrInput(@"images\Corsican.png"))
{
    // Perform OCR on the input image
    var Result = Ocr.Read(Input);

    // Extract all recognized text from the OCR result
    var AllText = Result.Text;
}
// First, ensure the IronOcr.Languages.Corsican package is installed
// You can use the NuGet Package Manager console:
// PM> Install-Package IronOcr.Languages.Corsican

using IronOcr;

var Ocr = new IronTesseract();

// Set the OCR language to Corsican
Ocr.Language = OcrLanguage.Corsican;

// Reading text from an image file
using (var Input = new OcrInput(@"images\Corsican.png"))
{
    // Perform OCR on the input image
    var Result = Ocr.Read(Input);

    // Extract all recognized text from the OCR result
    var AllText = Result.Text;
}
' First, ensure the IronOcr.Languages.Corsican package is installed
' You can use the NuGet Package Manager console:
' PM> Install-Package IronOcr.Languages.Corsican

Imports IronOcr

Private Ocr = New IronTesseract()

' Set the OCR language to Corsican
Ocr.Language = OcrLanguage.Corsican

' Reading text from an image file
Using Input = New OcrInput("images\Corsican.png")
	' Perform OCR on the input image
	Dim Result = Ocr.Read(Input)

	' Extract all recognized text from the OCR result
	Dim AllText = Result.Text
End Using
$vbLabelText   $csharpLabel

Dans ce code :

  • Nous créons une instance d' IronTesseract qui est utilisée pour effectuer la reconnaissance optique de caractères (OCR).
  • Nous spécifions la langue comme étant le corse en utilisant OcrLanguage.Corsican .
  • Nous lisons à partir d'une image d'entrée appelée Corsican.png .
  • La méthode Read d' Ocr effectue la reconnaissance optique de caractères (OCR) et renvoie le résultat, à partir duquel nous pouvons extraire le texte reconnu.