Telugu OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
Other versions of this document:

IronOCR ist eine C#-Softwarekomponente, die es .NET-Entwicklern ermöglicht, Text aus Bildern und PDF-Dokumenten in 126 Sprachen, einschließlich Telugu, zu lesen.

Es ist eine erweiterte Abspaltung von Tesseract, die exklusiv für .NET-Entwickler entwickelt wurde und regelmäßig andere Tesseract-Engines sowohl in Bezug auf Geschwindigkeit als auch Genauigkeit übertrifft.

Inhalte von IronOcr.Languages.Telugu

Dieses Paket enthält mehrere OCR-Sprachmodelle für .NET im Zusammenhang mit Telugu:

  • Telugu
  • TeluguBest
  • TeluguFast
  • TeluguAlphabet
  • TeluguAlphabetBest
  • TeluguAlphabetFast

Download

Telugu Language Pack style="white-space:default">[తలుగు]

Installation

Der erste Schritt besteht darin, das Telugu OCR-Paket in Ihr .NET-Projekt zu installieren.

Install-Package IronOCR.Languages.Telugu

Beispielcode

Dies ist ein C#-Codebeispiel, das Telugu-Text aus einem Bild- oder PDF-Dokument liest.

// Ensure that you have installed the IronOCR.Languages.Telugu package before running this code.

using IronOcr;

public class TeluguOcrExample
{
    public static void Main()
    {
        // Create a new IronTesseract instance
        var Ocr = new IronTesseract();

        // Specify the OCR language as Telugu
        Ocr.Language = OcrLanguage.Telugu;

        // Create a new OcrInput and specify the path to the image or PDF
        using (var Input = new OcrInput(@"images\Telugu.png"))
        {
            // Perform OCR on the input file
            var Result = Ocr.Read(Input);

            // Extract and store the recognized text
            var AllText = Result.Text;

            // Output the recognized text to the console (optional)
            Console.WriteLine(AllText);
        }
    }
}
// Ensure that you have installed the IronOCR.Languages.Telugu package before running this code.

using IronOcr;

public class TeluguOcrExample
{
    public static void Main()
    {
        // Create a new IronTesseract instance
        var Ocr = new IronTesseract();

        // Specify the OCR language as Telugu
        Ocr.Language = OcrLanguage.Telugu;

        // Create a new OcrInput and specify the path to the image or PDF
        using (var Input = new OcrInput(@"images\Telugu.png"))
        {
            // Perform OCR on the input file
            var Result = Ocr.Read(Input);

            // Extract and store the recognized text
            var AllText = Result.Text;

            // Output the recognized text to the console (optional)
            Console.WriteLine(AllText);
        }
    }
}
' Ensure that you have installed the IronOCR.Languages.Telugu package before running this code.

Imports IronOcr

Public Class TeluguOcrExample
	Public Shared Sub Main()
		' Create a new IronTesseract instance
		Dim Ocr = New IronTesseract()

		' Specify the OCR language as Telugu
		Ocr.Language = OcrLanguage.Telugu

		' Create a new OcrInput and specify the path to the image or PDF
		Using Input = New OcrInput("images\Telugu.png")
			' Perform OCR on the input file
			Dim Result = Ocr.Read(Input)

			' Extract and store the recognized text
			Dim AllText = Result.Text

			' Output the recognized text to the console (optional)
			Console.WriteLine(AllText)
		End Using
	End Sub
End Class
$vbLabelText   $csharpLabel

Dieses Code-Snippet initialisiert eine OCR-Engine mithilfe des IronOCR-Pakets, legt die Telugu-Sprache für die OCR-Verarbeitung fest und liest Text aus einer Eingabebilddatei, die vom Benutzer angegeben wird.