Latin Alphabet OCR in C# and .NET
IronOCR ist eine C#-Softwarekomponente, die .NET-Programmierern ermöglicht, Text aus Bildern und PDF-Dokumenten in 126 Sprachen, einschließlich des lateinischen Alphabets, zu lesen.
Es ist eine erweiterte Abspaltung von Tesseract, die exklusiv for .NET-Entwickler entwickelt wurde und regelmäßig andere Tesseract-Engines sowohl in Bezug auf Geschwindigkeit als auch Genauigkeit übertrifft.
Inhalt von IronOcr.Languages.LatinAlphabet
Dieses Paket enthält 64 OCR-Sprachen for .NET:
- LatinAlphabet
- LatinAlphabetBest
- LatinAlphabetFast
Download
Sprachpaket für das lateinische Alphabet [latine]
Installation
Das Erste, was wir tun müssen, ist das Lateinische Alphabet OCR-Paket in Ihr .NET-Projekt zu installieren.
Install-Package IronOcr.Languages.LatinAlphabet
Beispielcode
Dieses C#-Codebeispiel liest Text in lateinischem Alphabet aus einem Bild oder PDF-Dokument.
// Install the IronOCR.languages.LatinAlphabet package first
using IronOcr;
var Ocr = new IronTesseract(); // Initialize IronTesseract instance
// Set the OCR language to LatinAlphabet
Ocr.Language = OcrLanguage.LatinAlphabet;
// Define the input image or PDF you want to read
using (var Input = new OcrInput(@"images\LatinAlphabet.png"))
{
// Perform OCR reading on the input
var Result = Ocr.Read(Input);
// Extract the recognized text
var AllText = Result.Text;
// Output the recognized text
Console.WriteLine(AllText);
}
// Install the IronOCR.languages.LatinAlphabet package first
using IronOcr;
var Ocr = new IronTesseract(); // Initialize IronTesseract instance
// Set the OCR language to LatinAlphabet
Ocr.Language = OcrLanguage.LatinAlphabet;
// Define the input image or PDF you want to read
using (var Input = new OcrInput(@"images\LatinAlphabet.png"))
{
// Perform OCR reading on the input
var Result = Ocr.Read(Input);
// Extract the recognized text
var AllText = Result.Text;
// Output the recognized text
Console.WriteLine(AllText);
}
' Install the IronOCR.languages.LatinAlphabet package first
Imports IronOcr
Private Ocr = New IronTesseract() ' Initialize IronTesseract instance
' Set the OCR language to LatinAlphabet
Ocr.Language = OcrLanguage.LatinAlphabet
' Define the input image or PDF you want to read
Using Input = New OcrInput("images\LatinAlphabet.png")
' Perform OCR reading on the input
Dim Result = Ocr.Read(Input)
' Extract the recognized text
Dim AllText = Result.Text
' Output the recognized text
Console.WriteLine(AllText)
End Using
Erklärung
-
IronTesseract-Initialisierung: Es wird eine Instanz von
IronTesseractinitialisiert, die die OCR-Verarbeitung übernimmt. -
Spracheinstellung: Die OCR-Sprache ist auf
LatinAlphabeteingestellt, eine der im IronOCR Paket verfügbaren Sprachen. -
Eingabespezifikation: Es wird ein
OcrInput-Objekt erstellt, das den Pfad zu dem Bild oder PDF angibt, aus dem der Text extrahiert werden soll. -
OCR-Ausführung: Die Methode
Readder InstanzIronTesseractwird aufgerufen, um den TextOcrInputzu verarbeiten. Dies gibt einResult-Objekt zurück, das den extrahierten Text enthält. -
Textextraktion: Die
Text-Eigenschaft desResult-Objekts wird verwendet, um auf den erkannten Text zuzugreifen. - Ausgabe: Der erkannte Text wird zur Überprüfung auf der Konsole ausgegeben.
Stellen Sie sicher, dass der Dateipfad in OcrInput korrekt auf Ihre Bild- oder PDF-Datei verweist, um Ausnahmen vom Typ "Datei nicht gefunden" zu vermeiden.

