Serbian OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
Bu belgenin diğer versiyonları:

IronOCR, .NET kodlayıcılarının Sırpça dahil 126 dili içeren görüntülerden ve PDF belgelerinden metin okumalarına olanak tanıyan bir C# yazılım bileşenidir. Tesseract'ın ileri düzey bir çatallamasıdır, yalnızca .NET geliştiricileri için oluşturulmuş olup hız ve doğruluk açısından diğer Tesseract motorlarını düzenli olarak geride bırakmaktadır.

IronOcr.Languages.Serbian içeriği

Bu paket, .NET için 105 OCR dilini içerir:

  • Sırpça
  • SırpçaBest
  • SırpçaFast
  • SırpçaLatin
  • SırpçaLatinBest
  • SırpçaLatinFast

İndirme

Sırpça Dil Paketi [српски језик]

Kurulum

Yapmamız gereken ilk şey, Sırpça OCR paketimizi .NET projenize kurmaktır.

Install-Package IronOcr.Languages.Serbian

Kod Örneği

Bu C# kod örneği, bir Görüntüden veya PDF belgesinden Sırpça metin okur.

// Ensure all necessary namespaces are imported
using IronOcr;

class Program
{
    static void Main()
    {
        // Create a new instance of IronTesseract
        var Ocr = new IronTesseract();

        // Set the language to Serbian
        Ocr.Language = OcrLanguage.Serbian;

        // Use a using statement to ensure resources are disposed properly
        using (var Input = new OcrInput(@"images\Serbian.png"))
        {
            // Perform OCR and store the result
            var Result = Ocr.Read(Input);

            // Extract all text from the OCR result
            var AllText = Result.Text;

            // Output the resulting text
            Console.WriteLine(AllText);
        }
    }
}
// Ensure all necessary namespaces are imported
using IronOcr;

class Program
{
    static void Main()
    {
        // Create a new instance of IronTesseract
        var Ocr = new IronTesseract();

        // Set the language to Serbian
        Ocr.Language = OcrLanguage.Serbian;

        // Use a using statement to ensure resources are disposed properly
        using (var Input = new OcrInput(@"images\Serbian.png"))
        {
            // Perform OCR and store the result
            var Result = Ocr.Read(Input);

            // Extract all text from the OCR result
            var AllText = Result.Text;

            // Output the resulting text
            Console.WriteLine(AllText);
        }
    }
}
' Ensure all necessary namespaces are imported
Imports IronOcr

Friend Class Program
	Shared Sub Main()
		' Create a new instance of IronTesseract
		Dim Ocr = New IronTesseract()

		' Set the language to Serbian
		Ocr.Language = OcrLanguage.Serbian

		' Use a using statement to ensure resources are disposed properly
		Using Input = New OcrInput("images\Serbian.png")
			' Perform OCR and store the result
			Dim Result = Ocr.Read(Input)

			' Extract all text from the OCR result
			Dim AllText = Result.Text

			' Output the resulting text
			Console.WriteLine(AllText)
		End Using
	End Sub
End Class
$vbLabelText   $csharpLabel

Kodun Açıklaması:

  • OCR gerçekleştirmek için kullanılan yeni bir IronTesseract örneği başlatıyoruz.
  • OCR motorunun dili, OcrLanguage.Serbian kullanılarak Sırpça'ya ayarlanır.
  • Belirtilen yoldan dosyayı okuyarak yükleyen OcrInput kullanılarak Serbian.png görüntüsünü yüklüyoruz.
  • Görüntüyü işlemek ve metin çıkarmak için OCR nesnesi üzerinde Read fonksiyonu çağrılır.
  • Görüntüden çıkarılan metin, AllText değişkeninde saklanır ve ardından konsola yazdırılır.