Han Simplified Alphabet OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English

126 Daha Fazla Dil

IronOCR, .NET kodlayiciya, 126 dilde, Han Basitlestirilmis Alfabesi dahil olmak üzere, resimlerden ve PDF belgelerinden metin okumalarini olanak taniyan bir C# yazilim bileşenidir.

Tesseract'ın ileri düzey bir çatallamasıdır, yalnızca .NET geliştiricileri için oluşturulmuş olup hız ve doğruluk açısından diğer Tesseract motorlarını düzenli olarak geride bırakmaktadır.

IronOcr.Languages.Han'in Icerigi

Bu paket, .NET icin 400 OCR dili icerir:

  • HanSimplifiedAlphabet
  • HanSimplifiedAlphabetBest
  • HanSimplifiedAlphabetFast
  • HanSimplifiedVerticalAlphabet
  • HanSimplifiedVerticalAlphabetBest
  • HanSimplifiedVerticalAlphabetFast
  • HanTraditionalAlphabet
  • HanTraditionalAlphabetBest
  • HanTraditionalAlphabetFast
  • HanTraditionalVerticalAlphabet
  • HanTraditionalVerticalAlphabetBest
  • HanTraditionalVerticalAlphabetFast

İndirme

Han Basitlestirilmis Alfabe Dil Paketi [Samhan]

Kurulum

Yapmamiz gereken ilk şey, .NET projenize Han Basitlestirilmis Alfabe OCR paketimizi kurmaktir.

Paket Yonetici Konsolunda asagidaki komutu calistirin:

Install-Package IronOcr.Languages.Han

Kod Örneği

Bu C# kod ornegi, bir resim veya PDF belgesinden Han Basitlestirilmis Alfabe metni okur.

// Reference the IronOcr library
using IronOcr;

class Program
{
    static void Main()
    {
        // Create an IronTesseract OCR engine
        var Ocr = new IronTesseract();

        // Load the Han language for OCR processing
        Ocr.Language = OcrLanguage.Han;

        // Using a 'using' statement for resource management
        using (var Input = new OcrInput(@"images\Han.png"))
        {
            // Process the image to extract text
            var Result = Ocr.Read(Input);

            // Retrieve and display the extracted text
            string AllText = Result.Text;
            System.Console.WriteLine(AllText);
        }
    }
}
// Reference the IronOcr library
using IronOcr;

class Program
{
    static void Main()
    {
        // Create an IronTesseract OCR engine
        var Ocr = new IronTesseract();

        // Load the Han language for OCR processing
        Ocr.Language = OcrLanguage.Han;

        // Using a 'using' statement for resource management
        using (var Input = new OcrInput(@"images\Han.png"))
        {
            // Process the image to extract text
            var Result = Ocr.Read(Input);

            // Retrieve and display the extracted text
            string AllText = Result.Text;
            System.Console.WriteLine(AllText);
        }
    }
}
' Reference the IronOcr library
Imports IronOcr

Friend Class Program
	Shared Sub Main()
		' Create an IronTesseract OCR engine
		Dim Ocr = New IronTesseract()

		' Load the Han language for OCR processing
		Ocr.Language = OcrLanguage.Han

		' Using a 'using' statement for resource management
		Using Input = New OcrInput("images\Han.png")
			' Process the image to extract text
			Dim Result = Ocr.Read(Input)

			' Retrieve and display the extracted text
			Dim AllText As String = Result.Text
			System.Console.WriteLine(AllText)
		End Using
	End Sub
End Class
$vbLabelText   $csharpLabel

Açıklama

  • OCR yeteneklerini kullanmak icin IronOcr kutuphanesine referans vererek başlariz.
  • IronTesseract bir örneği, görüntü/PDF belgelerini işlemek için oluşturulur.
  • OCR süreci için dil Han ile ayarlanır ve Ocr.Language kullanılarak gerçekleştirilir.
  • Bir görüntü OcrInput kullanılarak yüklenir ve Ocr.Read() çağrılarak işlenir.
  • OCR sürecinin sonucu, belgelerden çıkarılan metni içeren Result.Text'da saklanır.
  • Son olarak metni konsola yazdiririz.

Dosya akışları gibi yönetilmeyen kaynaklarla uğraşırken, uygun using yönergelerine sahip olun ve kaynakları using ifadeleriyle verimli bir şekilde yönetin.