Han Simplified Alphabet OCR in C# and .NET
IronOCR, .NET kodlayıcılarının 126 dil, Han Basitleştirilmiş Alfabe dahil, içerisinden resimler ve PDF belgelerinden metin okumalarını sağlayan bir C# yazılım bileşenidir.
Tesseract'ın, yalnızca .NET geliştiricileri için özel olarak oluşturulmuş gelişmiş bir dalıdır ve hız ve doğruluk açısından diğer Tesseract motorlarını düzenli olarak geride bırakır.
IronOcr.Languages.Han İçeriği
Bu paket, .NET için 400 OCR dilini içerir:
- HanSimplifiedAlphabet
- HanSimplifiedAlphabetBest
- HanSimplifiedAlphabetFast
- HanSimplifiedVerticalAlphabet
- HanSimplifiedVerticalAlphabetBest
- HanSimplifiedVerticalAlphabetFast
- HanTraditionalAlphabet
- HanTraditionalAlphabetBest
- HanTraditionalAlphabetFast
- HanTraditionalVerticalAlphabet
- HanTraditionalVerticalAlphabetBest
- HanTraditionalVerticalAlphabetFast
İndir
Han Basitleştirilmiş Alfabe Dil Paketi [Samhan]
- Download as [Zip](javascript:window.open("/csharp/ocr/packages/language-packs/Han.ocrdata.zip")
- NuGet ile yükle
Kurulum
Yapmamız gereken ilk şey, .NET projenize Han Basitleştirilmiş Alfabe OCR paketimizi kurmaktır.
Paket Yöneticisi Konsolu'nda aşağıdaki komutu çalıştırın:
Install-Package IronOcr.Languages.Han
Kod Örneği
Bu C# kod örneği, bir resim veya PDF belgesinden Han Basitleştirilmiş Alfabe metni okur.
// Reference the IronOcr library
using IronOcr;
class Program
{
static void Main()
{
// Create an IronTesseract OCR engine
var Ocr = new IronTesseract();
// Load the Han language for OCR processing
Ocr.Language = OcrLanguage.Han;
// Using a 'using' statement for resource management
using (var Input = new OcrInput(@"images\Han.png"))
{
// Process the image to extract text
var Result = Ocr.Read(Input);
// Retrieve and display the extracted text
string AllText = Result.Text;
System.Console.WriteLine(AllText);
}
}
}
// Reference the IronOcr library
using IronOcr;
class Program
{
static void Main()
{
// Create an IronTesseract OCR engine
var Ocr = new IronTesseract();
// Load the Han language for OCR processing
Ocr.Language = OcrLanguage.Han;
// Using a 'using' statement for resource management
using (var Input = new OcrInput(@"images\Han.png"))
{
// Process the image to extract text
var Result = Ocr.Read(Input);
// Retrieve and display the extracted text
string AllText = Result.Text;
System.Console.WriteLine(AllText);
}
}
}
' Reference the IronOcr library
Imports IronOcr
Friend Class Program
Shared Sub Main()
' Create an IronTesseract OCR engine
Dim Ocr = New IronTesseract()
' Load the Han language for OCR processing
Ocr.Language = OcrLanguage.Han
' Using a 'using' statement for resource management
Using Input = New OcrInput("images\Han.png")
' Process the image to extract text
Dim Result = Ocr.Read(Input)
' Retrieve and display the extracted text
Dim AllText As String = Result.Text
System.Console.WriteLine(AllText)
End Using
End Sub
End Class
Açıklama
- Öncelikle, OCR özelliklerini kullanmak için IronOCR kütüphanesine başvuruyoruz.
- Görüntü/PDF belgelerini işlemek için
IronTesseractörneği oluşturulur. - OCR işlemi için dil,
Ocr.LanguagekullanılarakHanolarak ayarlanmıştır. - Bir görüntü
OcrInputkullanılarak yüklenir veOcr.Read()çağrılarak işlenir. - OCR işleminin sonucu, belgeden çıkarılan metni içeren
Result.Textiçinde saklanır. - Son olarak, metni konsola yazdırıyoruz.
Uygun using yönergelerinin bulunduğundan emin olun ve özellikle dosya akışları gibi yönetilmeyen kaynaklarla çalışırken using deyimleriyle kaynakları verimli bir şekilde yönetin.

