Oriya OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
Andere Versionen dieses Dokuments:

IronOCR ist eine C#-Softwarekomponente, die es .NET-Entwicklern ermöglicht, Text aus Bildern und PDF-Dokumenten in 126 Sprachen, einschließlich Oriya, zu lesen. Es ist eine erweiterte Abspaltung von Tesseract, die exklusiv for .NET-Entwickler entwickelt wurde und regelmäßig andere Tesseract-Engines sowohl in Bezug auf Geschwindigkeit als auch Genauigkeit übertrifft.

Inhalte von IronOcr.Languages.Oriya

Dieses Paket enthält mehrere OCR-Sprachen for .NET:

  • Oriya
  • OriyaBest
  • OriyaFast
  • OriyaAlphabet
  • OriyaAlphabetBest
  • OriyaAlphabetFast

Download

Oriya Language Pack [ଓଡଆ]

Installation

Das Erste, was wir tun müssen, ist, unser Oriya-OCR-Paket in Ihr .NET-Projekt zu installieren.

Install-Package IronOcr.Languages.Oriya

Beispielcode

Dieses C#-Codebeispiel liest Oriya-Text aus einem Bild oder PDF-Dokument.

// This example demonstrates how to use the IronOCR library to perform OCR on an Oriya language image.
using IronOcr;

class Program
{
    static void Main()
    {
        // Instantiate the IronTesseract engine
        var Ocr = new IronTesseract();

        // Set the OCR language to Oriya
        Ocr.Language = OcrLanguage.Oriya;

        // Define the input file path for the OCR
        using (var Input = new OcrInput(@"images\Oriya.png"))
        {
            // Perform OCR and obtain the result
            var Result = Ocr.Read(Input);

            // Extract all recognized text from the result
            var AllText = Result.Text;

            // Output the recognized text
            Console.WriteLine(AllText);
        }
    }
}
// This example demonstrates how to use the IronOCR library to perform OCR on an Oriya language image.
using IronOcr;

class Program
{
    static void Main()
    {
        // Instantiate the IronTesseract engine
        var Ocr = new IronTesseract();

        // Set the OCR language to Oriya
        Ocr.Language = OcrLanguage.Oriya;

        // Define the input file path for the OCR
        using (var Input = new OcrInput(@"images\Oriya.png"))
        {
            // Perform OCR and obtain the result
            var Result = Ocr.Read(Input);

            // Extract all recognized text from the result
            var AllText = Result.Text;

            // Output the recognized text
            Console.WriteLine(AllText);
        }
    }
}
$vbLabelText   $csharpLabel
  • Das Objekt IronTesseract dient zur Konfiguration und Durchführung der OCR-Texterkennung.
  • Die Sprache für OCR ist auf Oriya eingestellt mit OcrLanguage.Oriya.
  • Mit dem Befehl OcrInput können Sie das Bild oder Dokument angeben, aus dem der Text extrahiert werden soll. Die Methode Read() führt die OCR durch und erzeugt ein Ergebnis, aus dem der erkannte Text extrahiert und verwendet werden kann.