在 IronOCR 中使用阿拉伯數字

This article was translated from English: Does it need improvement?
Translated
View the article in English

阿拉伯語、波斯語和烏爾都語語言包無法辨識阿拉伯數字?

這是 Tesseract 語言包的已知問題。

以下語言包或許有助於解決阿拉伯數字的顯示問題: Shreeshrii 的 Tessdata 阿拉伯語

然後可以將其與 IronOCR 功能結合使用,載入自訂語言套件: IronOCR 自訂語言範例

using IronOcr;

class ArabicNumeralOCR
{
    static void Main(string[] args)
    {
        // Initialize a new instance of IronTesseract for OCR
        var Ocr = new IronTesseract();

        // Load the custom Tesseract language file for better numeral recognition
        Ocr.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata");

        // Specify the image input for OCR processing
        using (var Input = new OcrInput(@"images\image.png"))
        {
            // Execute the OCR process on the input image
            var Result = Ocr.Read(Input);

            // Output the recognized text
            Console.WriteLine(Result.Text);
        }
    }
}
using IronOcr;

class ArabicNumeralOCR
{
    static void Main(string[] args)
    {
        // Initialize a new instance of IronTesseract for OCR
        var Ocr = new IronTesseract();

        // Load the custom Tesseract language file for better numeral recognition
        Ocr.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata");

        // Specify the image input for OCR processing
        using (var Input = new OcrInput(@"images\image.png"))
        {
            // Execute the OCR process on the input image
            var Result = Ocr.Read(Input);

            // Output the recognized text
            Console.WriteLine(Result.Text);
        }
    }
}
Imports IronOcr

Friend Class ArabicNumeralOCR
	Shared Sub Main(ByVal args() As String)
		' Initialize a new instance of IronTesseract for OCR
		Dim Ocr = New IronTesseract()

		' Load the custom Tesseract language file for better numeral recognition
		Ocr.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata")

		' Specify the image input for OCR processing
		Using Input = New OcrInput("images\image.png")
			' Execute the OCR process on the input image
			Dim Result = Ocr.Read(Input)

			' Output the recognized text
			Console.WriteLine(Result.Text)
		End Using
	End Sub
End Class
$vbLabelText   $csharpLabel

注意:此 C# 範例示範如何在 IronOCR 中使用自訂 Tesseract 語言檔案來提高影像中阿拉伯數字的辨識率。 它假定您已經下載了相應的語言包並將其放置在指定位置。 請務必安裝 IronOCR 並在生產代碼中加入必要的錯誤處理。

Curtis Chau
技術作家

Curtis Chau 擁有卡爾頓大學計算機科學學士學位,專注於前端開發,擅長於 Node.js、TypeScript、JavaScript 和 React。Curtis 熱衷於創建直觀且美觀的用戶界面,喜歡使用現代框架並打造結構良好、視覺吸引人的手冊。

除了開發之外,Curtis 對物聯網 (IoT) 有著濃厚的興趣,探索將硬體和軟體結合的創新方式。在閒暇時間,他喜愛遊戲並構建 Discord 機器人,結合科技與創意的樂趣。

準備好開始了嗎?
Nuget 下載 5,167,857 | Version: 2025.11 剛發表