IronOCR 语言 汉 使用 C# 和 .NET 实现汉字简体字母 OCR Curtis Chau 已更新:七月 22, 2025 下载 IronOCR NuGet 下载 DLL 下载 Windows 安装程序 免费试用 法学硕士副本 法学硕士副本 将页面复制为 Markdown 格式,用于 LLMs 在 ChatGPT 中打开 向 ChatGPT 咨询此页面 在双子座打开 向 Gemini 询问此页面 在双子座打开 向 Gemini 询问此页面 打开困惑 向 Perplexity 询问有关此页面的信息 分享 在 Facebook 上分享 分享到 X(Twitter) 在 LinkedIn 上分享 复制链接 电子邮件文章 This article was translated from English: Does it need improvement? Translated View the article in English 还有126种语言 IronOCR 是一个 C# 软件组件,允许 .NET 程序员从图像和 PDF 文档中读取 126 种语言的文本,包括简体汉字。 它是 Tesseract 的一个高级分支,专为 .NET 开发人员构建,在速度和准确性方面通常优于其他 Tesseract 引擎。 IronOcr.Languages.Han 的内容 此软件包包含 400 种适用于 .NET 的 OCR 语言: 汉字简体字母 汉简体字母最佳 HanSimplifiedAlphabetFast 汉简体垂直字母 汉简体垂直字母最佳 汉简体垂直字母快速 汉传统字母 汉字传统字母最佳 HanTraditionalAlphabetFast 汉字竖写 汉字传统竖式字母最佳 汉字传统竖式字母快速 下载 汉字简体字母语言包 [Samhan] Download as Zip 使用NuGet安装 安装 我们首先需要做的是将我们的汉字简体字母OCR 包安装到您的 .NET 项目中。 在Package Manager Console中运行以下命令: Install-Package IronOCR.Languages.Han 代码示例 这段 C# 代码示例从图像或 PDF 文档中读取简体汉字文本。 // Reference the IronOcr library using IronOcr; class Program { static void Main() { // Create an IronTesseract OCR engine var Ocr = new IronTesseract(); // Load the Han language for OCR processing Ocr.Language = OcrLanguage.Han; // Using a 'using' statement for resource management using (var Input = new OcrInput(@"images\Han.png")) { // Process the image to extract text var Result = Ocr.Read(Input); // Retrieve and display the extracted text string AllText = Result.Text; System.Console.WriteLine(AllText); } } } // Reference the IronOcr library using IronOcr; class Program { static void Main() { // Create an IronTesseract OCR engine var Ocr = new IronTesseract(); // Load the Han language for OCR processing Ocr.Language = OcrLanguage.Han; // Using a 'using' statement for resource management using (var Input = new OcrInput(@"images\Han.png")) { // Process the image to extract text var Result = Ocr.Read(Input); // Retrieve and display the extracted text string AllText = Result.Text; System.Console.WriteLine(AllText); } } } ' Reference the IronOcr library Imports IronOcr Friend Class Program Shared Sub Main() ' Create an IronTesseract OCR engine Dim Ocr = New IronTesseract() ' Load the Han language for OCR processing Ocr.Language = OcrLanguage.Han ' Using a 'using' statement for resource management Using Input = New OcrInput("images\Han.png") ' Process the image to extract text Dim Result = Ocr.Read(Input) ' Retrieve and display the extracted text Dim AllText As String = Result.Text System.Console.WriteLine(AllText) End Using End Sub End Class $vbLabelText $csharpLabel 解释 我们首先引用 IronOcr 库来使用其 OCR 功能。 创建IronTesseract实例来处理图像/PDF 文档。 OCR 过程的语言设置为Han ,使用Ocr.Language 。 使用OcrInput加载图像,并通过调用Ocr.Read()进行处理。 OCR 处理的结果存储在Result.Text中,其中包含从文档中提取的文本。 最后,我们将文本打印到控制台。 确保使用正确的using指令,并using语句有效地管理资源,尤其是在处理文件流等非托管资源时。