Latin Alphabet OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English

126 Daha Fazla Dil

IronOCR, .NET kodlayıcılarının Latin Alfabesi dahil 126 dilde resimlerden ve PDF belgelerinden metin okumasına olanak tanıyan bir C# yazılım bileşenidir.

Bu, Tesseract'ın .NET geliştiricileri için özel olarak oluşturulmuş gelişmiş bir çatalıdır ve hem hız hem de doğruluk açısından diğer Tesseract motorlarından düzenli olarak daha iyi performans gösterir.

IronOcr.Languages.LatinAlphabet içeriği

Bu paket, .NET için 64 OCR dili içerir:

  • LatinAlphabet
  • LatinAlphabetBest
  • LatinAlphabetFast

İndir

Latin Alfabe Dil Paketi [latine]

Kurulum

Yapmamız gereken ilk şey, Latin Alfabe OCR paketimizi .NET projenize yüklemektir.

Install-Package IronOcr.Languages.LatinAlphabet

Kod Örneği

Bu C# kod örneği, bir Görüntü veya PDF belgesinden Latin Alfabesi metnini okur.

// Install the IronOCR.languages.LatinAlphabet package first
using IronOcr;

var Ocr = new IronTesseract(); // Initialize IronTesseract instance

// Set the OCR language to LatinAlphabet
Ocr.Language = OcrLanguage.LatinAlphabet;

// Define the input image or PDF you want to read
using (var Input = new OcrInput(@"images\LatinAlphabet.png"))
{
    // Perform OCR reading on the input
    var Result = Ocr.Read(Input);

    // Extract the recognized text
    var AllText = Result.Text;

    // Output the recognized text
    Console.WriteLine(AllText);
}
// Install the IronOCR.languages.LatinAlphabet package first
using IronOcr;

var Ocr = new IronTesseract(); // Initialize IronTesseract instance

// Set the OCR language to LatinAlphabet
Ocr.Language = OcrLanguage.LatinAlphabet;

// Define the input image or PDF you want to read
using (var Input = new OcrInput(@"images\LatinAlphabet.png"))
{
    // Perform OCR reading on the input
    var Result = Ocr.Read(Input);

    // Extract the recognized text
    var AllText = Result.Text;

    // Output the recognized text
    Console.WriteLine(AllText);
}
' Install the IronOCR.languages.LatinAlphabet package first
Imports IronOcr

Private Ocr = New IronTesseract() ' Initialize IronTesseract instance

' Set the OCR language to LatinAlphabet
Ocr.Language = OcrLanguage.LatinAlphabet

' Define the input image or PDF you want to read
Using Input = New OcrInput("images\LatinAlphabet.png")
	' Perform OCR reading on the input
	Dim Result = Ocr.Read(Input)

	' Extract the recognized text
	Dim AllText = Result.Text

	' Output the recognized text
	Console.WriteLine(AllText)
End Using
$vbLabelText   $csharpLabel

Açıklama

  1. IronTesseract Başlatma: OCR işlemesini gerçekleştirecek olan IronTesseract örneği başlatılır.

  2. Dil Ayarı: OCR dili, IronOCR paketinde bulunan dillerden biri olan LatinAlphabet olarak ayarlanmıştır.

  3. Giriş Spesifikasyonu: Metnin çıkarılacağı resim veya PDF dosyasının yolunu belirten bir OcrInput nesnesi oluşturulur.

  4. OCR Yürütme: OcrInput'yi işlemek için IronTesseract örneğinin Read yöntemi çağrılır. Bu, çıkarılan metni içeren bir Result nesnesi döndürür.

  5. Metin Çıkarma: Result nesnesinin Text özelliği, tanınan metne erişmek için kullanılır.

  6. Çıktı: Tanınan metin, doğrulama amacıyla konsola PRINT edilir.

Dosya bulunamadı hatalarını önlemek için OcrInput içindeki dosya yolunun resminize veya PDF dosyanıza doğru şekilde yönlendirildiğinden emin olun.