Working with Arabic Numerals in IronOCR

This article was translated from English: Does it need improvement?
Translated
View the article in English

阿拉伯語、波斯語和烏爾都語語言套件無法辨識阿拉伯數字? 這是 Tesseract 語言套件的已知問題。 以下語言包可能有助於解決阿拉伯數字的這個問題: [Shreeshrii's Tessdata Arabic](https://github.com/Shreeshrii/tessdata_arabic) 接下來就可以搭配 IronOCR 功能來載入自訂的語言套件: [IronOCR 自訂語言範例](https://ironsoftware.com/csharp/ocr/languages/#custom-language-example) ```csharp using IronOcr; class ArabicNumeralOCR { static void Main(string[] args) { // Initialize a new instance of IronTesseract for OCR var Ocr = new IronTesseract(); // Load the custom Tesseract language file for better numeral recognition Ocr.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata"); // Specify the image input for OCR processing using (var Input = new OcrInput(@"images\image.png")) { // Execute the OCR process on the input image var Result = Ocr.Read(Input); // Output the recognized text Console.WriteLine(Result.Text); } } } ``` **註:**此 C# 範例示範如何在 IronOCR 中使用自訂的 Tesseract 語言檔案,以改善影像中阿拉伯數字的辨識能力。 假設您已下載適當的語言套件,並將其放置在指定位置。 請務必安裝 IronOCR,並在生產程式碼中加入必要的錯誤處理。

Curtis Chau
技術作家

Curtis Chau 擁有卡爾頓大學計算機科學學士學位,專注於前端開發,擅長於 Node.js、TypeScript、JavaScript 和 React。Curtis 熱衷於創建直觀且美觀的用戶界面,喜歡使用現代框架並打造結構良好、視覺吸引人的手冊。

除了開發之外,Curtis 對物聯網 (IoT) 有著濃厚的興趣,探索將硬體和軟體結合的創新方式。在閒暇時間,他喜愛遊戲並構建 Discord 機器人,結合科技與創意的樂趣。

準備好開始了嗎?
Nuget 下載 5,044,537 | 版本: 2025.11 剛剛發布