Tamil OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
Bu belgenin diğer versiyonları:

IronOCR, .NET kodlayıcılarının, Tamil dahil 126 dilde, resimler ve PDF belgelerinden metin okumasını sağlayan bir C# yazılım bileşenidir.

Tesseract'ın geliştirilmiş bir dalıdır, yalnızca .NET geliştiricileri için geliştirilmiştir ve hem hız hem de doğruluk bakımından diğer Tesseract motorlarını düzenli olarak geride bırakır.

IronOcr.Languages.Tamil İçeriği

Bu paket, .NET için 102 OCR dili içerir:

  • Tamilce
  • TamilceBest
  • TamilceFast
  • TamilceAlfabesi
  • TamilceAlfabesiEnIyi
  • TamilceAlfabesiHizli

İndirme

Tamil Dil Paketi [தமிழ]

Kurulum

İlk yapmamız gereken şey, .NET projenize Tamil OCR paketimizi yüklemektir.

Install-Package IronOcr.Languages.Tamil

Kod Örneği

Bu C# kod örneği, bir resim veya PDF belgesinden Tamil metni okur.

// Ensure IronOcr.Languages.Tamil package is installed
using IronOcr;

var Ocr = new IronTesseract();

// Set the language to Tamil for OCR processing
Ocr.Language = OcrLanguage.Tamil;

using (var Input = new OcrInput(@"images\Tamil.png"))
{
    // Perform OCR on the input image
    var Result = Ocr.Read(Input);

    // Get the recognized text
    var AllText = Result.Text;

    // Display the recognized text (for example purpose)
    Console.WriteLine(AllText);
}
// Ensure IronOcr.Languages.Tamil package is installed
using IronOcr;

var Ocr = new IronTesseract();

// Set the language to Tamil for OCR processing
Ocr.Language = OcrLanguage.Tamil;

using (var Input = new OcrInput(@"images\Tamil.png"))
{
    // Perform OCR on the input image
    var Result = Ocr.Read(Input);

    // Get the recognized text
    var AllText = Result.Text;

    // Display the recognized text (for example purpose)
    Console.WriteLine(AllText);
}
Imports IronOcr

' Ensure IronOcr.Languages.Tamil package is installed
Dim Ocr As New IronTesseract()

' Set the language to Tamil for OCR processing
Ocr.Language = OcrLanguage.Tamil

Using Input As New OcrInput("images\Tamil.png")
    ' Perform OCR on the input image
    Dim Result = Ocr.Read(Input)

    ' Get the recognized text
    Dim AllText = Result.Text

    ' Display the recognized text (for example purpose)
    Console.WriteLine(AllText)
End Using
$vbLabelText   $csharpLabel
  • IronTesseract sınıfı, OCR motorunu başlatmak ve kurmak için kullanılır.
  • Ocr.Language özelliği, OCR için kullanılacak dil paketini belirtir.
  • OcrInput sınıfı, Tamil metni içeren görüntü dosyası yoluyla birlikte kullanılır.
  • Ocr.Read() metodu, görüntüyü işler ve metni çıkarır.
  • Son olarak, tanınan metin AllText içinde depolanır ve gerektiği gibi kullanılabilir.