Estonian OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
Bu belgenin diğer versiyonları:

IronOCR, .NET geliştiricilerinin Estonca dahil 126 dilde resimler ve PDF belgeleri üzerinden metin okumasını sağlayan bir C# yazılım bileşenidir. Tesseract'ın, yalnızca .NET geliştiricileri için özel olarak oluşturulmuş gelişmiş bir dalıdır ve hız ve doğruluk açısından diğer Tesseract motorlarını düzenli olarak geride bırakır.

IronOcr.Languages.Estonian İçeriği

Bu paket, .NET için aşağıdaki OCR dillerini içerir:

  • Estonca
  • EstoncaBest
  • EstoncaFast

İndir

Estonca Dil Paketi [eesti]

Kurulum

Yapmamız gereken ilk şey, Estonca OCR paketimizi .NET projenize yüklemektir.

Install-Package IronOcr.Languages.Estonian

Kod Örneği

Bu C# kod örneği, bir resim veya PDF belgesinden Estonca metni okur.

// Import the IronOcr namespace
using IronOcr;

// Create a new instance of the IronTesseract class
var Ocr = new IronTesseract();

// Set the OCR language to Estonian
Ocr.Language = OcrLanguage.Estonian;

// Load the image or PDF from which text needs to be extracted
using (var Input = new OcrInput(@"images\Estonian.png"))
{
    // Perform OCR to read text from the specified input
    var Result = Ocr.Read(Input);

    // Extract all the recognized text from the OCR result
    var AllText = Result.Text;
}
// Import the IronOcr namespace
using IronOcr;

// Create a new instance of the IronTesseract class
var Ocr = new IronTesseract();

// Set the OCR language to Estonian
Ocr.Language = OcrLanguage.Estonian;

// Load the image or PDF from which text needs to be extracted
using (var Input = new OcrInput(@"images\Estonian.png"))
{
    // Perform OCR to read text from the specified input
    var Result = Ocr.Read(Input);

    // Extract all the recognized text from the OCR result
    var AllText = Result.Text;
}
' Import the IronOcr namespace
Imports IronOcr

' Create a new instance of the IronTesseract class
Private Ocr = New IronTesseract()

' Set the OCR language to Estonian
Ocr.Language = OcrLanguage.Estonian

' Load the image or PDF from which text needs to be extracted
Using Input = New OcrInput("images\Estonian.png")
	' Perform OCR to read text from the specified input
	Dim Result = Ocr.Read(Input)

	' Extract all the recognized text from the OCR result
	Dim AllText = Result.Text
End Using
$vbLabelText   $csharpLabel

Kodun Açıklaması:

  • IronTesseract: Bu, IronOCR tarafından sağlanan OCR işlemlerini gerçekleştirmek için kullanılan birincil sınıftır.
  • Ocr.Language: Bu özelliği ayarlayarak, OCR sırasında hangi dilin kullanılacağını tanımlarız. Burada, Estonca olarak ayarlanmıştır.
  • OcrInput: Bu, okumak istediğimiz görüntü veya PDF belgesini belirtmek için kullanılır. Bir dosya yolu girdi olarak alır.
  • Ocr.Read(Input): Bu yöntem belirtilen girdiyi işler ve üzerinde OCR gerçekleştirir.
  • Result.Text: Bu özellik, görüntü veya PDF belgesinden başarıyla tanınan ve çıkarılan tüm metni içerir.