IronOCR 操作指南 读取多国语言 How to use Multiple Languages with Tesseract Kannapat Udonpant 已更新:七月 22, 2025 Download IronOCR NuGet 下载 DLL 下载 Windows 安装程序 Start Free Trial Copy for LLMs Copy for LLMs Copy page as Markdown for LLMs Open in ChatGPT Ask ChatGPT about this page Open in Gemini Ask Gemini about this page Open in Grok Ask Grok about this page Open in Perplexity Ask Perplexity about this page Share Share on Facebook Share on X (Twitter) Share on LinkedIn Copy URL Email article This article was translated from English: Does it need improvement? Translated View the article in English 在光学字符识别 (OCR) 技术领域,IronOCR 是一款广受赞誉的工具,以能够从各种语言和脚本中提取文本而著称。我们使用 Tesseract 引擎提供可靠易用的 OCR 工具。 在本文中,我们将探讨 IronOCR 如何借助 Tesseract 有效处理多语言文本。 无论您是正在寻找可靠的多语言 OCR 解决方案的资深开发人员,还是仅仅对其工作原理感到好奇,本文都将帮助您了解 IronOCR 及其 Tesseract 引擎,阐明这一宝贵工具的功能。 as-heading:2(快速入门:使用 IronOCR 识别多语言文本)</em 只需一行代码,您就可以用一种主要语言配置 IronOCR,并添加辅助语言,从文档或图像中提取多种语言的文本。 这种设置使开发人员能够快速、轻松地使用多语言 OCR。 Get started making PDFs with NuGet now: Install IronOCR with NuGet Package Manager PM > Install-Package IronOcr Copy and run this code snippet. string text = new IronTesseract { Language = OcrLanguage.Spanish }.AddSecondaryLanguage(OcrLanguage.French).Read("doc_or_image_path").Text; Deploy to test on your live environment Start using IronOCR in your project today with a free trial Free 30 day Trial 最小工作流程(5 个步骤)下载用于读取多种语言的 C# 库。 为阅读准备 PDF 文档和图像通过 NuGet 安装附加语言包使用 AddSecondaryLanguage 方法启用所需的语言。 设置 Language 属性以更改默认语言。 阅读多语言 PDF 示例阅读多语言图像示例结论 常见问题解答 我如何在OCR处理过程中使用多国语言? 要在IronOCR中使用多国语言进行OCR处理,请从NuGet下载库,准备文档,安装附加语言包,并使用AddSecondaryLanguage方法启用其他语言。 如何从多语言PDF中提取文本? 您可以通过初始化IronTesseract OCR引擎,设置主语言,使用AddSecondaryLanguage方法添加次语言,并处理PDF以读取其内容,从而从多语言PDF中提取文本。 在一张图像中识别多国语言文本是否可能? 是的,使用IronOCR,您可以在一张图像中识别多国语言文本,通过在处理图像之前设置主语言并添加次语言到OCR引擎。 添加多国语言如何影响OCR性能? 在IronOCR中添加多国语言可能会影响OCR过程的速度和性能。添加语言的顺序决定它们的优先级,首先添加的语言具有较高优先级。 我如何更改IronOCR的默认语言? 您可以在处理文档或图像之前通过设置Language属性为所需语言来更改IronOCR的默认语言。 IronOCR支持多少语言包? IronOCR支持约125种语言包,尽管默认仅安装了英语语言包。附加语言包可以通过NuGet下载。 我如何在IronOCR中安装附加语言包? 要在IronOCR中安装附加语言包,请使用NuGet包管理器下载所需的语言包并将它们包括在您的项目中。 IronOCR可以读取不同文字体系的语言文本吗? 是的,IronOCR通过利用Tesseract引擎和启用相关语言包可以读取各种不同文字体系的语言文本。 使用IronOCR处理多语言内容有什么好处? IronOCR为识别和提取多语言内容中的文本提供了一种多功能的解决方案,使其成为处理包含多语言文本的文档或图像的开发人员的理想选择。 Kannapat Udonpant 立即与工程团队聊天 软件工程师 在成为软件工程师之前,Kannapat 在日本北海道大学完成了环境资源博士学位。在攻读学位期间,Kannapat 还成为了车辆机器人实验室的成员,隶属于生物生产工程系。2022 年,他利用自己的 C# 技能加入 Iron Software 的工程团队,专注于 IronPDF。Kannapat 珍视他的工作,因为他可以直接从编写大多数 IronPDF 代码的开发者那里学习。除了同行学习外,Kannapat 还喜欢在 Iron Software 工作的社交方面。不撰写代码或文档时,Kannapat 通常可以在他的 PS5 上玩游戏或重温《最后生还者》。 审核者 Jeffrey T. Fritz 首席项目经理 - .NET 社区团队 Jeff 也是 .NET 和 Visual Studio 团队的首席项目经理。他是 .NET Conf 虚拟会议系列的执行制片人,并主持“Fritz and Friends”直播节目,每周两次与观众一起谈论技术并编写代码。Jeff 撰写研讨会、演示文稿并计划包括 Microsoft Build、Microsoft Ignite、.NET Conf 和 Microsoft MVP 峰会在内的最大型微软开发者活动的内容。 准备开始了吗? Nuget 下载 5,044,537 | 版本: 2025.11 刚刚发布 免费 NuGet 下载 总下载量:5,044,537 查看许可证