使用自定義語言文件
Iron Tesseract OCR 完全支持自訂或下載的語言和字體,符合 Tesseract .traineddata 文件格式標準(版本 4 或以上)。 您可以在 [Github.com]() 上常見找到這些文件。
如果您希望訓練自己的自定義字體支持或語言包,我們建議閱讀我們的建立自定義 Tesseract 語言包的教程。
如何使用 Tesseract 語言進行光學字符識別 (OCR)
- 安裝 OCR 庫以選擇 Tesseract 語言選項。
- 使用
UseCustomTesseractLanguageFile
提供自訂語言檔案。 - 使用圖片路徑作為參數創建一個
OcrInput
對象。 - 將
OcrInput
物件傳遞給Read
方法,以便以語言讀取文本。