Latin Alphabet OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English

126 Daha Fazla Dil

IronOCR, .NET kodlayıcılarının Latin Alfabesi dahil olmak üzere 126 dilde görüntülerden ve PDF belgelerinden metin okumalarına olanak tanıyan bir C# yazılım bileşenidir.

Tesseract'ın ileri düzey bir çatallamasıdır, yalnızca .NET geliştiricileri için oluşturulmuş olup hız ve doğruluk açısından diğer Tesseract motorlarını düzenli olarak geride bırakmaktadır.

IronOcr.Languages.LatinAlphabet İçeriği

Bu paket, .NET için 64 OCR dili içerir:

  • LatinAlphabet
  • LatinAlphabetBest
  • LatinAlphabetFast

İndirme

Latin Alfabesi Dil Paketi [latine]

Kurulum

İlk yapmamız gereken şey, .NET projenize Latin Alfabesi OCR paketimizi yüklemektir.

Install-Package IronOcr.Languages.LatinAlphabet

Kod Örneği

Bu C# kod örneği, bir görüntü veya PDF belgesinden Latin Alfabesi metni okur.

// Install the IronOCR.languages.LatinAlphabet package first
using IronOcr;

var Ocr = new IronTesseract(); // Initialize IronTesseract instance

// Set the OCR language to LatinAlphabet
Ocr.Language = OcrLanguage.LatinAlphabet;

// Define the input image or PDF you want to read
using (var Input = new OcrInput(@"images\LatinAlphabet.png"))
{
    // Perform OCR reading on the input
    var Result = Ocr.Read(Input);

    // Extract the recognized text
    var AllText = Result.Text;

    // Output the recognized text
    Console.WriteLine(AllText);
}
// Install the IronOCR.languages.LatinAlphabet package first
using IronOcr;

var Ocr = new IronTesseract(); // Initialize IronTesseract instance

// Set the OCR language to LatinAlphabet
Ocr.Language = OcrLanguage.LatinAlphabet;

// Define the input image or PDF you want to read
using (var Input = new OcrInput(@"images\LatinAlphabet.png"))
{
    // Perform OCR reading on the input
    var Result = Ocr.Read(Input);

    // Extract the recognized text
    var AllText = Result.Text;

    // Output the recognized text
    Console.WriteLine(AllText);
}
' Install the IronOCR.languages.LatinAlphabet package first
Imports IronOcr

Private Ocr = New IronTesseract() ' Initialize IronTesseract instance

' Set the OCR language to LatinAlphabet
Ocr.Language = OcrLanguage.LatinAlphabet

' Define the input image or PDF you want to read
Using Input = New OcrInput("images\LatinAlphabet.png")
	' Perform OCR reading on the input
	Dim Result = Ocr.Read(Input)

	' Extract the recognized text
	Dim AllText = Result.Text

	' Output the recognized text
	Console.WriteLine(AllText)
End Using
$vbLabelText   $csharpLabel

Açıklama

  1. IronTesseract Başlatma: OCR işlemine handle edecek bir IronTesseract ornegi başlatiliyor.

  2. Dil Ayarlari: OCR dili, IronOCR paketindeki mevcut dillerden biri olan LatinAlphabet olarak ayarlanir.

  3. Girdi Spesifikasyonu: Metnin cikarilacagi resim veya PDF'in yolunu belirten bir OcrInput nesnesi oluşturulur.

  4. OCR Uygulama: IronTesseract ornegine ait Read metodu, OcrInput işlemek icin cagrilir. Bu, cikarilan metni iceren bir Result nesnesi dondurur.

  5. Metin Cikarma: Tanimlanan metne erismek icin Result nesnesinin Text ozelligi kullanilir.

  6. Çıktı: Tanınan metin doğrulama için konsola yazdırılır.

Dosya bulunamama hatalarini onlemek icin OcrInput icindeki dosya yolunun resim veya PDF dosyanizina dogru yonlendirildigini dogrulayin.