Latin Alphabet OCR in C# and .NET
IronOCR, .NET kodlayıcılarının Latin Alfabesi dahil olmak üzere 126 dilde görüntülerden ve PDF belgelerinden metin okumalarına olanak tanıyan bir C# yazılım bileşenidir.
Tesseract'ın ileri düzey bir çatallamasıdır, yalnızca .NET geliştiricileri için oluşturulmuş olup hız ve doğruluk açısından diğer Tesseract motorlarını düzenli olarak geride bırakmaktadır.
IronOcr.Languages.LatinAlphabet İçeriği
Bu paket, .NET için 64 OCR dili içerir:
- LatinAlphabet
- LatinAlphabetBest
- LatinAlphabetFast
İndirme
Latin Alfabesi Dil Paketi [latine]
Kurulum
İlk yapmamız gereken şey, .NET projenize Latin Alfabesi OCR paketimizi yüklemektir.
Install-Package IronOcr.Languages.LatinAlphabet
Kod Örneği
Bu C# kod örneği, bir görüntü veya PDF belgesinden Latin Alfabesi metni okur.
// Install the IronOCR.languages.LatinAlphabet package first
using IronOcr;
var Ocr = new IronTesseract(); // Initialize IronTesseract instance
// Set the OCR language to LatinAlphabet
Ocr.Language = OcrLanguage.LatinAlphabet;
// Define the input image or PDF you want to read
using (var Input = new OcrInput(@"images\LatinAlphabet.png"))
{
// Perform OCR reading on the input
var Result = Ocr.Read(Input);
// Extract the recognized text
var AllText = Result.Text;
// Output the recognized text
Console.WriteLine(AllText);
}
// Install the IronOCR.languages.LatinAlphabet package first
using IronOcr;
var Ocr = new IronTesseract(); // Initialize IronTesseract instance
// Set the OCR language to LatinAlphabet
Ocr.Language = OcrLanguage.LatinAlphabet;
// Define the input image or PDF you want to read
using (var Input = new OcrInput(@"images\LatinAlphabet.png"))
{
// Perform OCR reading on the input
var Result = Ocr.Read(Input);
// Extract the recognized text
var AllText = Result.Text;
// Output the recognized text
Console.WriteLine(AllText);
}
' Install the IronOCR.languages.LatinAlphabet package first
Imports IronOcr
Private Ocr = New IronTesseract() ' Initialize IronTesseract instance
' Set the OCR language to LatinAlphabet
Ocr.Language = OcrLanguage.LatinAlphabet
' Define the input image or PDF you want to read
Using Input = New OcrInput("images\LatinAlphabet.png")
' Perform OCR reading on the input
Dim Result = Ocr.Read(Input)
' Extract the recognized text
Dim AllText = Result.Text
' Output the recognized text
Console.WriteLine(AllText)
End Using
Açıklama
-
IronTesseract Başlatma: OCR işlemine handle edecek bir
IronTesseractornegi başlatiliyor. -
Dil Ayarlari: OCR dili, IronOCR paketindeki mevcut dillerden biri olan
LatinAlphabetolarak ayarlanir. -
Girdi Spesifikasyonu: Metnin cikarilacagi resim veya PDF'in yolunu belirten bir
OcrInputnesnesi oluşturulur. -
OCR Uygulama:
IronTesseractornegine aitReadmetodu,OcrInputişlemek icin cagrilir. Bu, cikarilan metni iceren birResultnesnesi dondurur. -
Metin Cikarma: Tanimlanan metne erismek icin
ResultnesnesininTextozelligi kullanilir. - Çıktı: Tanınan metin doğrulama için konsola yazdırılır.
Dosya bulunamama hatalarini onlemek icin OcrInput icindeki dosya yolunun resim veya PDF dosyanizina dogru yonlendirildigini dogrulayin.

