Italian OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
Other versions of this document:

IronOCR ist eine C# Softwarekomponente, die es .NET-Entwicklern ermöglicht, Text aus Bildern und PDF-Dokumenten in 126 Sprachen, einschließlich Italienisch, zu lesen.

Es ist eine erweiterte Abspaltung von Tesseract, die exklusiv für .NET-Entwickler entwickelt wurde und regelmäßig andere Tesseract-Engines sowohl in Bezug auf Geschwindigkeit als auch Genauigkeit übertrifft.

Inhalt von IronOcr.Languages.Italian

Dieses Paket enthält 6 OCR-Sprachmodi für .NET:

  • Italienisch
  • ItalienischBest
  • ItalienischFast
  • ItalienischOld
  • ItalienischOldBest
  • ItalienischOldFast

Download

Italienisches Sprachpaket style='white-space:default'>[italiano]

Installation

Das erste, was wir tun müssen, ist das Italienisch-OCR-Paket in Ihrem .NET-Projekt zu installieren.

Install-Package IronOCR.Languages.Italian

Beispielcode

Dieses C#-Code-Beispiel liest italienischen Text aus einem Bild oder PDF-Dokument.

// Include IronOcr library
using IronOcr;

class Program
{
    static void Main()
    {
        // Create a new instance of the IronTesseract class
        var Ocr = new IronTesseract();

        // Set the OCR language to Italian
        Ocr.Language = OcrLanguage.Italian;

        // Read text from an image file
        using (var Input = new OcrInput(@"images\Italian.png"))
        {
            // Perform OCR to get the text content from the image
            var Result = Ocr.Read(Input);

            // Get and print all the recognized text
            var AllText = Result.Text;
            Console.WriteLine(AllText);
        }
    }
}
// Include IronOcr library
using IronOcr;

class Program
{
    static void Main()
    {
        // Create a new instance of the IronTesseract class
        var Ocr = new IronTesseract();

        // Set the OCR language to Italian
        Ocr.Language = OcrLanguage.Italian;

        // Read text from an image file
        using (var Input = new OcrInput(@"images\Italian.png"))
        {
            // Perform OCR to get the text content from the image
            var Result = Ocr.Read(Input);

            // Get and print all the recognized text
            var AllText = Result.Text;
            Console.WriteLine(AllText);
        }
    }
}
' Include IronOcr library
Imports IronOcr

Friend Class Program
	Shared Sub Main()
		' Create a new instance of the IronTesseract class
		Dim Ocr = New IronTesseract()

		' Set the OCR language to Italian
		Ocr.Language = OcrLanguage.Italian

		' Read text from an image file
		Using Input = New OcrInput("images\Italian.png")
			' Perform OCR to get the text content from the image
			Dim Result = Ocr.Read(Input)

			' Get and print all the recognized text
			Dim AllText = Result.Text
			Console.WriteLine(AllText)
		End Using
	End Sub
End Class
$vbLabelText   $csharpLabel

Erklärung:

  1. Verwenden von IronOCR: Die IronOcr-Bibliothek ist enthalten, um ihre OCR-Funktionen zu nutzen.
  2. Erstellen einer IronTesseract-Instanz: IronTesseract ist eine Kernklasse, die für die OCR-Verarbeitung verwendet wird.
  3. Sprache einstellen: OCR ist so eingestellt, dass es die italienische Sprache mit Ocr.Language = OcrLanguage.Italian verarbeitet.
  4. Eingabe lesen: Ein OcrInput-Objekt wird erstellt, um die Bilddatei anzugeben.
  5. OCR durchführen: Ocr.Read(Input) führt den OCR-Prozess auf dem Eingabebild durch und gibt das Textergebnis zurück.
  6. Ausgabe: Der resultierende Text wird in AllText gespeichert und in der Konsole angezeigt.

Stellen Sie sicher, dass der Dateipfad images\Italian.png korrekt ist und die Datei vorhanden ist, damit das Beispiel ordnungsgemäß funktioniert.