使用自定義語言文件
Iron Tesseract OCR 完全支持自定或下載的語言和字體,並符合 Tesseract .traineddata 文件格式標準(4或以上版本). 您通常可以找到這類文件在[Github.com]().
如果您希望訓練自己的自訂字體支援或語言包,我們建議閱讀我們的自訂 Tesseract 語言包的教程。
如何使用 Tesseract 語言進行光學字符識別 (OCR)
- 安裝一個OCR庫來選擇Tesseract語言選項。
- 在使用時提供自定義語言文件
使用自定義 Tesseract 語言檔案
. - 創建一個
OcrInput
使用圖像路徑作為參數建立物件。 - 通過
OcrInput
對象至讀取
讀取語言文本的方法。