Han Simplified Alphabet OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English

126 Daha Fazla Dil

IronOCR, .NET kodlayıcılarının 126 dil, Han Basitleştirilmiş Alfabe dahil, içerisinden resimler ve PDF belgelerinden metin okumalarını sağlayan bir C# yazılım bileşenidir.

Tesseract'ın, yalnızca .NET geliştiricileri için özel olarak oluşturulmuş gelişmiş bir dalıdır ve hız ve doğruluk açısından diğer Tesseract motorlarını düzenli olarak geride bırakır.

IronOcr.Languages.Han İçeriği

Bu paket, .NET için 400 OCR dilini içerir:

  • HanSimplifiedAlphabet
  • HanSimplifiedAlphabetBest
  • HanSimplifiedAlphabetFast
  • HanSimplifiedVerticalAlphabet
  • HanSimplifiedVerticalAlphabetBest
  • HanSimplifiedVerticalAlphabetFast
  • HanTraditionalAlphabet
  • HanTraditionalAlphabetBest
  • HanTraditionalAlphabetFast
  • HanTraditionalVerticalAlphabet
  • HanTraditionalVerticalAlphabetBest
  • HanTraditionalVerticalAlphabetFast

İndir

Han Basitleştirilmiş Alfabe Dil Paketi [Samhan]

  • Download as [Zip](javascript:window.open("/csharp/ocr/packages/language-packs/Han.ocrdata.zip")
  • NuGet ile yükle

Kurulum

Yapmamız gereken ilk şey, .NET projenize Han Basitleştirilmiş Alfabe OCR paketimizi kurmaktır.

Paket Yöneticisi Konsolu'nda aşağıdaki komutu çalıştırın:

Install-Package IronOcr.Languages.Han

Kod Örneği

Bu C# kod örneği, bir resim veya PDF belgesinden Han Basitleştirilmiş Alfabe metni okur.

// Reference the IronOcr library
using IronOcr;

class Program
{
    static void Main()
    {
        // Create an IronTesseract OCR engine
        var Ocr = new IronTesseract();

        // Load the Han language for OCR processing
        Ocr.Language = OcrLanguage.Han;

        // Using a 'using' statement for resource management
        using (var Input = new OcrInput(@"images\Han.png"))
        {
            // Process the image to extract text
            var Result = Ocr.Read(Input);

            // Retrieve and display the extracted text
            string AllText = Result.Text;
            System.Console.WriteLine(AllText);
        }
    }
}
// Reference the IronOcr library
using IronOcr;

class Program
{
    static void Main()
    {
        // Create an IronTesseract OCR engine
        var Ocr = new IronTesseract();

        // Load the Han language for OCR processing
        Ocr.Language = OcrLanguage.Han;

        // Using a 'using' statement for resource management
        using (var Input = new OcrInput(@"images\Han.png"))
        {
            // Process the image to extract text
            var Result = Ocr.Read(Input);

            // Retrieve and display the extracted text
            string AllText = Result.Text;
            System.Console.WriteLine(AllText);
        }
    }
}
' Reference the IronOcr library
Imports IronOcr

Friend Class Program
	Shared Sub Main()
		' Create an IronTesseract OCR engine
		Dim Ocr = New IronTesseract()

		' Load the Han language for OCR processing
		Ocr.Language = OcrLanguage.Han

		' Using a 'using' statement for resource management
		Using Input = New OcrInput("images\Han.png")
			' Process the image to extract text
			Dim Result = Ocr.Read(Input)

			' Retrieve and display the extracted text
			Dim AllText As String = Result.Text
			System.Console.WriteLine(AllText)
		End Using
	End Sub
End Class
$vbLabelText   $csharpLabel

Açıklama

  • Öncelikle, OCR özelliklerini kullanmak için IronOCR kütüphanesine başvuruyoruz.
  • Görüntü/PDF belgelerini işlemek için IronTesseract örneği oluşturulur.
  • OCR işlemi için dil, Ocr.Language kullanılarak Han olarak ayarlanmıştır.
  • Bir görüntü OcrInput kullanılarak yüklenir ve Ocr.Read() çağrılarak işlenir.
  • OCR işleminin sonucu, belgeden çıkarılan metni içeren Result.Text içinde saklanır.
  • Son olarak, metni konsola yazdırıyoruz.

Uygun using yönergelerinin bulunduğundan emin olun ve özellikle dosya akışları gibi yönetilmeyen kaynaklarla çalışırken using deyimleriyle kaynakları verimli bir şekilde yönetin.