Han Simplified Alphabet OCR in C# and .NET
IronOCR, .NET kodlayiciya, 126 dilde, Han Basitlestirilmis Alfabesi dahil olmak üzere, resimlerden ve PDF belgelerinden metin okumalarini olanak taniyan bir C# yazilim bileşenidir.
Tesseract'ın ileri düzey bir çatallamasıdır, yalnızca .NET geliştiricileri için oluşturulmuş olup hız ve doğruluk açısından diğer Tesseract motorlarını düzenli olarak geride bırakmaktadır.
IronOcr.Languages.Han'in Icerigi
Bu paket, .NET icin 400 OCR dili icerir:
- HanSimplifiedAlphabet
- HanSimplifiedAlphabetBest
- HanSimplifiedAlphabetFast
- HanSimplifiedVerticalAlphabet
- HanSimplifiedVerticalAlphabetBest
- HanSimplifiedVerticalAlphabetFast
- HanTraditionalAlphabet
- HanTraditionalAlphabetBest
- HanTraditionalAlphabetFast
- HanTraditionalVerticalAlphabet
- HanTraditionalVerticalAlphabetBest
- HanTraditionalVerticalAlphabetFast
İndirme
Han Basitlestirilmis Alfabe Dil Paketi [Samhan]
Kurulum
Yapmamiz gereken ilk şey, .NET projenize Han Basitlestirilmis Alfabe OCR paketimizi kurmaktir.
Paket Yonetici Konsolunda asagidaki komutu calistirin:
Install-Package IronOcr.Languages.Han
Kod Örneği
Bu C# kod ornegi, bir resim veya PDF belgesinden Han Basitlestirilmis Alfabe metni okur.
// Reference the IronOcr library
using IronOcr;
class Program
{
static void Main()
{
// Create an IronTesseract OCR engine
var Ocr = new IronTesseract();
// Load the Han language for OCR processing
Ocr.Language = OcrLanguage.Han;
// Using a 'using' statement for resource management
using (var Input = new OcrInput(@"images\Han.png"))
{
// Process the image to extract text
var Result = Ocr.Read(Input);
// Retrieve and display the extracted text
string AllText = Result.Text;
System.Console.WriteLine(AllText);
}
}
}
// Reference the IronOcr library
using IronOcr;
class Program
{
static void Main()
{
// Create an IronTesseract OCR engine
var Ocr = new IronTesseract();
// Load the Han language for OCR processing
Ocr.Language = OcrLanguage.Han;
// Using a 'using' statement for resource management
using (var Input = new OcrInput(@"images\Han.png"))
{
// Process the image to extract text
var Result = Ocr.Read(Input);
// Retrieve and display the extracted text
string AllText = Result.Text;
System.Console.WriteLine(AllText);
}
}
}
' Reference the IronOcr library
Imports IronOcr
Friend Class Program
Shared Sub Main()
' Create an IronTesseract OCR engine
Dim Ocr = New IronTesseract()
' Load the Han language for OCR processing
Ocr.Language = OcrLanguage.Han
' Using a 'using' statement for resource management
Using Input = New OcrInput("images\Han.png")
' Process the image to extract text
Dim Result = Ocr.Read(Input)
' Retrieve and display the extracted text
Dim AllText As String = Result.Text
System.Console.WriteLine(AllText)
End Using
End Sub
End Class
Açıklama
- OCR yeteneklerini kullanmak icin IronOcr kutuphanesine referans vererek başlariz.
IronTesseractbir örneği, görüntü/PDF belgelerini işlemek için oluşturulur.- OCR süreci için dil
Hanile ayarlanır veOcr.Languagekullanılarak gerçekleştirilir. - Bir görüntü
OcrInputkullanılarak yüklenir veOcr.Read()çağrılarak işlenir. - OCR sürecinin sonucu, belgelerden çıkarılan metni içeren
Result.Text'da saklanır. - Son olarak metni konsola yazdiririz.
Dosya akışları gibi yönetilmeyen kaynaklarla uğraşırken, uygun using yönergelerine sahip olun ve kaynakları using ifadeleriyle verimli bir şekilde yönetin.

