Tamil OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
Bu belgenin diğer versiyonları:

IronOCR, .NET kodlayıcılarının Tamil dahil olmak üzere 126 dilde resimlerden ve PDF belgelerinden metin okumasını sağlayan bir C# yazılım bileşenidir.

Tesseract'ın, yalnızca .NET geliştiricileri için özel olarak oluşturulmuş gelişmiş bir dalıdır ve hız ve doğruluk açısından diğer Tesseract motorlarını düzenli olarak geride bırakır.

IronOcr.Languages.Tamil İçeği

Bu paket, .NET için 102 OCR dilini içerir:

  • Tamil
  • TamilEn İyi
  • TamilHızlı
  • TamilAlfabesi
  • TamilAlfabesiEn İyi
  • TamilAlfabesiHızlı

İndir

Tamil Dil Paketi [தமிழ]

Kurulum

İlk yapmamız gereken şey, .NET projenize Tamil OCR paketimizi yüklemek.

Install-Package IronOcr.Languages.Tamil

Kod Örneği

Bu C# kod örneği, bir resim veya PDF belgesinden Tamil metni okur.

// Ensure IronOcr.Languages.Tamil package is installed
using IronOcr;

var Ocr = new IronTesseract();

// Set the language to Tamil for OCR processing
Ocr.Language = OcrLanguage.Tamil;

using (var Input = new OcrInput(@"images\Tamil.png"))
{
    // Perform OCR on the input image
    var Result = Ocr.Read(Input);

    // Get the recognized text
    var AllText = Result.Text;

    // Display the recognized text (for example purpose)
    Console.WriteLine(AllText);
}
// Ensure IronOcr.Languages.Tamil package is installed
using IronOcr;

var Ocr = new IronTesseract();

// Set the language to Tamil for OCR processing
Ocr.Language = OcrLanguage.Tamil;

using (var Input = new OcrInput(@"images\Tamil.png"))
{
    // Perform OCR on the input image
    var Result = Ocr.Read(Input);

    // Get the recognized text
    var AllText = Result.Text;

    // Display the recognized text (for example purpose)
    Console.WriteLine(AllText);
}
Imports IronOcr

' Ensure IronOcr.Languages.Tamil package is installed
Dim Ocr As New IronTesseract()

' Set the language to Tamil for OCR processing
Ocr.Language = OcrLanguage.Tamil

Using Input As New OcrInput("images\Tamil.png")
    ' Perform OCR on the input image
    Dim Result = Ocr.Read(Input)

    ' Get the recognized text
    Dim AllText = Result.Text

    ' Display the recognized text (for example purpose)
    Console.WriteLine(AllText)
End Using
$vbLabelText   $csharpLabel
  • IronTesseract sınıfı, OCR motorunu başlatmak ve kurmak için kullanılır.
  • Ocr.Language özelliği, OCR için kullanılacak dil paketini belirtir.
  • OcrInput sınıfı, Tamilce metin içeren görüntü dosyasının yolu ile birlikte kullanılır.
  • Ocr.Read() yöntemi, görüntüyü işler ve metni çıkarır.
  • Son olarak, tanınan metin AllText içinde saklanır ve gerektiğinde kullanılabilir.