Using Custom OCR Language Packs with IronOCR

This article was translated from English: Does it need improvement?
Translated
View the article in English

如何建立自訂語言套件供 IronOCR 使用? 建立自訂語言套件需要從字型訓練新的 Tesseract 4 LSTM 語言檔案/字典。 線上有許多教學,說明執行此工作所需的步驟。 這個過程並不簡單,但值得慶幸的是它有相當完善的文件記錄。 As a good place to start, we suggest this [YouTube tutorial](https://www.youtube.com/watch?v=KE4xEzFGSU8) from [Gabriel Garcia](https://www.youtube.com/c/GabrielGarciaGG) (no affiliation) and their linked [GitHub repository](https://github.com/astutejoe/tesseract_tutorial). 完成後,輸出將會是一個 `.traineddata` 檔案。 然後,`.traineddata` 檔案可以如下方式在 IronOCR 中引用: 文件:[IronOCR自訂語言](https://ironsoftware.com/csharp/ocr/languages/)。 ```csharp using IronOcr; class Program { static void Main() { // Initialize the IronTesseract OCR engine var Ocr = new IronTesseract(); // Load your custom Tesseract language file (trained .traineddata file) Ocr.UseCustomTesseractLanguageFile("mydir/custom.traineddata"); //<--- your new font // Multiple fonts can be used by calling the method multiple times with different files // Load an image into the OCR Input for processing using (var Input = new OcrInput(@"images\image.png")) { // Perform OCR on the input image var Result = Ocr.Read(Input); // Output the recognized text to the console Console.WriteLine(Result.Text); } } } ```

Curtis Chau
技術作家

Curtis Chau 擁有卡爾頓大學計算機科學學士學位,專注於前端開發,擅長於 Node.js、TypeScript、JavaScript 和 React。Curtis 熱衷於創建直觀且美觀的用戶界面,喜歡使用現代框架並打造結構良好、視覺吸引人的手冊。

除了開發之外,Curtis 對物聯網 (IoT) 有著濃厚的興趣,探索將硬體和軟體結合的創新方式。在閒暇時間,他喜愛遊戲並構建 Discord 機器人,結合科技與創意的樂趣。

準備好開始了嗎?
Nuget 下載 5,044,537 | 版本: 2025.11 剛剛發布