影片

在 IronOCR 中如何使用 OCR 語言包

Kannaopat Udonpant
坎納帕特·烏頓潘
2023年12月10日
分享:


在本教程中,您將學習如何使用IronOCR在C#中從多語言PDF文件中提取文本。 這段影片展示了如何設置IronOCR並安裝額外的語言包——特別是英語和日語。 您將了解如何配置OCR引擎以支持多種語言,並將其應用於含有英語和日文文本的範例PDF。 本教程演示了如何初始化OCR引擎、定義輸入檔案並使用Read方法提取文字。 提取的內容隨後被保存到 .txt 文件,並且設有錯誤處理機制以應對失敗的操作。 這是一個很好的例子,展示了IronOCR如何通過在一次掃描中識別多種語言來支持全球文件處理。 無論您是在處理多語言表單、國際文件,還是來自全球來源的 PDF,此指南講解了如何在 C# 中輕鬆獲得準確且具語言識別能力的 OCR 結果。

進一步閱讀附加 OCR 語言包

現在開始使用IronOCR。
green arrow pointer

Kannaopat Udonpant
坎納帕特·烏頓潘
軟體工程師
在成為軟體工程師之前,Kannapat 在日本北海道大學完成了環境資源博士學位。在攻讀學位期間,Kannapat 也成為了車輛機器人實驗室的成員,該實驗室隸屬於生物生產工程學系。2022 年,他利用自己的 C# 技能,加入了 Iron Software 的工程團隊,專注於 IronPDF 的開發。Kannapat 珍視這份工作,因為他可以直接向負責撰寫大部分 IronPDF 程式碼的開發人員學習。除了同儕學習外,Kannapat 還享受在 Iron Software 工作的社交方面。當他不在撰寫程式碼或文件時,Kannapat 通常會在 PS5 上玩遊戲或重看《最後生還者》。
< 上一頁
為何 IronOCR 優於 Tesseract 4 Nuget 套件
下一個 >
如何使用多種語言與Tesseract