Sundanese OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English
本文檔的其他版本:

迪娜·巴薩·桑達納 新增 125 種 OCR 語言

IronOCR是一個 C# 軟體元件,允許.NET設計師從圖像和 PDF 文件中讀取 126 種語言(包括巽他語)的文字。

它是 Tesseract 的一個高級分支,專為.NET開發人員構建,在速度和準確性方面通常優於其他 Tesseract 引擎。

IronOCR的內容。語言。巽他語

此軟體包包含 52 種適用於.NET的 OCR 語言:

  • 巽他語
  • 巽他族最佳
  • 巽他早餐

下載

巽他語語言包[Basa Sunda]

安裝

我們首先需要做的就是將我們的巽他語OCR 套件安裝到您的.NET專案中。

Install-Package IronOcr.Languages.Sundanese

程式碼範例

此 C# 程式碼範例從圖像或 PDF 文件中讀取巽他語文字。

// Import the IronOcr namespace
using IronOcr;

class Program
{
    static void Main()
    {
        // Create a new instance of the IronTesseract class
        var Ocr = new IronTesseract();

        // Specify the language the OCR engine should use
        Ocr.Language = OcrLanguage.Sundanese;

        // Initialize the OCR input with an image file containing Sundanese text
        using (var Input = new OcrInput(@"images\Sundanese.png"))
        {
            // Process the input and get the result
            var Result = Ocr.Read(Input);

            // Extract all recognized text from the result
            var AllText = Result.Text;

            // Output the recognized text
            System.Console.WriteLine(AllText);
        }
    }
}
// Import the IronOcr namespace
using IronOcr;

class Program
{
    static void Main()
    {
        // Create a new instance of the IronTesseract class
        var Ocr = new IronTesseract();

        // Specify the language the OCR engine should use
        Ocr.Language = OcrLanguage.Sundanese;

        // Initialize the OCR input with an image file containing Sundanese text
        using (var Input = new OcrInput(@"images\Sundanese.png"))
        {
            // Process the input and get the result
            var Result = Ocr.Read(Input);

            // Extract all recognized text from the result
            var AllText = Result.Text;

            // Output the recognized text
            System.Console.WriteLine(AllText);
        }
    }
}
$vbLabelText   $csharpLabel

解釋

  • 我們首先導入 IronOcr 命名空間以使用其 OCR 功能。
  • 創建了一個 IronTesseract 的實例,它作為我們的主要 OCR 引擎。
  • 我們將 Language 屬性設為 OcrLanguage.Sundanese,以指定引擎應該期望讀取巽他語文本。
  • 我們建立一個 OcrInput 物件來指定 OCR 引擎的映像檔來源。
  • Read 方法處理輸入並嘗試辨識文字。
  • 辨識出的文字儲存在 AllText 變數中,隨後列印到控制台。

此設定允許在.NET環境中使用IronOCR庫從圖像中可靠地識別巽他語文字。