Telugu OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
Inne wersje tego dokumentu:

IronOCR jest komponentem oprogramowania C#, pozwalającym programistom .NET odczytywać tekst z obrazów i dokumentów PDF w 126 językach, w tym w języku telugu.

Jest to zaawansowany fork Tesseracta, zbudowany wyłącznie dla deweloperów .NET i regularnie przewyższający inne silniki Tesseract pod względem szybkości i dokładności.

Zawartość IronOcr.Languages.Telugu

Ten pakiet zawiera kilka modeli językowych OCR dla .NET związanych z językiem telugu:

  • Telugu
  • TeluguBest
  • TeluguFast
  • TeluguAlphabet
  • TeluguAlphabetBest
  • TeluguAlphabetFast

Pobieranie

Pakiet językowy telugu [తలుగు]

Instalacja

Pierwszym krokiem jest zainstalowanie pakietu OCR Telugu w projekcie .NET.

Install-Package IronOcr.Languages.Telugu

Przyklad kodu

To jest przykład kodu C#, który odczytuje tekst telugu z obrazu lub dokumentu PDF.

// Ensure that you have installed the IronOcr.Languages.Telugu package before running this code.

using IronOcr;

public class TeluguOcrExample
{
    public static void Main()
    {
        // Create a new IronTesseract instance
        var Ocr = new IronTesseract();

        // Specify the OCR language as Telugu
        Ocr.Language = OcrLanguage.Telugu;

        // Create a new OcrInput and specify the path to the image or PDF
        using (var Input = new OcrInput(@"images\Telugu.png"))
        {
            // Perform OCR on the input file
            var Result = Ocr.Read(Input);

            // Extract and store the recognized text
            var AllText = Result.Text;

            // Output the recognized text to the console (optional)
            Console.WriteLine(AllText);
        }
    }
}
// Ensure that you have installed the IronOcr.Languages.Telugu package before running this code.

using IronOcr;

public class TeluguOcrExample
{
    public static void Main()
    {
        // Create a new IronTesseract instance
        var Ocr = new IronTesseract();

        // Specify the OCR language as Telugu
        Ocr.Language = OcrLanguage.Telugu;

        // Create a new OcrInput and specify the path to the image or PDF
        using (var Input = new OcrInput(@"images\Telugu.png"))
        {
            // Perform OCR on the input file
            var Result = Ocr.Read(Input);

            // Extract and store the recognized text
            var AllText = Result.Text;

            // Output the recognized text to the console (optional)
            Console.WriteLine(AllText);
        }
    }
}
Imports IronOcr

Public Class TeluguOcrExample
    Public Shared Sub Main()
        ' Create a new IronTesseract instance
        Dim Ocr As New IronTesseract()

        ' Specify the OCR language as Telugu
        Ocr.Language = OcrLanguage.Telugu

        ' Create a new OcrInput and specify the path to the image or PDF
        Using Input As New OcrInput("images\Telugu.png")
            ' Perform OCR on the input file
            Dim Result = Ocr.Read(Input)

            ' Extract and store the recognized text
            Dim AllText = Result.Text

            ' Output the recognized text to the console (optional)
            Console.WriteLine(AllText)
        End Using
    End Sub
End Class
$vbLabelText   $csharpLabel

Ten fragment kodu inicjalizuje silnik OCR za pomocą pakietu IronOCR, ustawia język telugu do przetwarzania OCR i odczytuje tekst z wejściowego pliku obrazowego określonego przez użytkownika.