使用自定义语言文件
Iron Tesseract OCR 完全支持自定义或下载的语言和字体,遵循 Tesseract .traineddata 文件格式标准(版本 4 或以上)。 您可以在 [Github.com]() 上常见到这样的文件。
如果您希望训练自己的自定义字体支持或语言包,我们建议您阅读我们的创建自定义 Tesseract 语言包的教程。
如何使用 Tesseract 语言进行 OCR 识别
- 安装 OCR 库以选择 Tesseract 语言选项。
- 在使用
UseCustomTesseractLanguageFile
时提供自定义语言文件。 - 使用图像路径作为参数创建一个
OcrInput
对象。 - 将
OcrInput
对象传递给Read
方法以读取语言中的文本。