Tibetan Alphabet OCR in C# and .NET

This article was translated from English: Does it need improvement?
Translated
View the article in English

還有126種語言

IronOCR是一個 C# 軟體元件,允許.NET設計師從圖像和 PDF 文件中讀取 126 種語言的文本,包括藏文。

它是 Tesseract 的一個高級分支,專為.NET開發人員構建,在速度和準確性方面通常優於其他 Tesseract 引擎。

IronOCR的內容。語言。藏語

此軟體包包含 114 種適用於.NET的 OCR 語言:

藏族

  • 藏族最佳
  • 藏式快食 藏文
  • 藏文字母最佳
  • 藏文字母表快速

下載

藏文字母語言包 [藏文標準]

安裝

首先,你需要將藏文字母OCR 套件安裝到你的.NET專案中。

Install-Package IronOcr.Languages.Tibetan

程式碼範例

這段 C# 程式碼範例從圖像或 PDF 文件中讀取藏文文字。

// Import the IronOcr namespace to use its components
using IronOcr;

class Program
{
    static void Main()
    {
        // Initialize a new IronTesseract object for OCR
        var Ocr = new IronTesseract();

        // Set the OCR language to Tibetan
        Ocr.Language = OcrLanguage.Tibetan;

        // Use a using statement for automatic resource disposal
        using (var Input = new OcrInput(@"images\Tibetan.png"))
        {
            // Perform OCR to read text from the input image
            var Result = Ocr.Read(Input);

            // Retrieve all recognized text from the OCR Result
            var AllText = Result.Text;

            // Output the recognized text to the console
            // Note: Ensure that the console supports Tibetan script for correct display
            Console.WriteLine(AllText);
        }
    }
}
// Import the IronOcr namespace to use its components
using IronOcr;

class Program
{
    static void Main()
    {
        // Initialize a new IronTesseract object for OCR
        var Ocr = new IronTesseract();

        // Set the OCR language to Tibetan
        Ocr.Language = OcrLanguage.Tibetan;

        // Use a using statement for automatic resource disposal
        using (var Input = new OcrInput(@"images\Tibetan.png"))
        {
            // Perform OCR to read text from the input image
            var Result = Ocr.Read(Input);

            // Retrieve all recognized text from the OCR Result
            var AllText = Result.Text;

            // Output the recognized text to the console
            // Note: Ensure that the console supports Tibetan script for correct display
            Console.WriteLine(AllText);
        }
    }
}
$vbLabelText   $csharpLabel

筆記

  • OCR 庫 (IronTesseract) 已配置為從提供的影像讀取藏語。
  • OcrInput 處理載入輸入影像,並確保使用 using 語句正確處置資源。
  • Result.Text 包含 OCR 處理後的文本,可列印或在應用程式中使用。