多线程Tesseract OCR
IronTesseract
2021 之前有一个 ReadMultithreaded
方法,使 .NET 开发人员可以更高效地读取图像和 PDF。
这在2022年已不再需要。所有IronOCR图像处理和OCR阅读操作都是多线程的,且不需要开发者使用特殊的API。
IronTesseract
将自动尝试使用所有内核上可用的所有线程,并优雅地考虑主线程/GUI线程的响应能力。
如何使用 Tesseract 多线程技术
- 安装一个OCR库以使用Tesseract多线程
- 创建一个
IronTesseract
对象。 - 使用
AddImage
来构建OcrInput
并将图像路径提供给对象 - 调用所有必要的方法进行图像处理。
- 使用
Read
方法来读取文本