使用 IRONOCR 如何在 C# 中创建 OCR 软件演示 Kannapat Udonpant 已更新:七月 28, 2025 下载 IronOCR NuGet 下载 DLL 下载 Windows 安装程序 免费试用 法学硕士副本 法学硕士副本 将页面复制为 Markdown 格式,用于 LLMs 在 ChatGPT 中打开 向 ChatGPT 咨询此页面 在双子座打开 向 Gemini 询问此页面 在双子座打开 向 Gemini 询问此页面 打开困惑 向 Perplexity 询问有关此页面的信息 分享 在 Facebook 上分享 分享到 X(Twitter) 在 LinkedIn 上分享 复制链接 电子邮件文章 光学字符识别 (OCR) 是一种将各种文档格式(包括扫描的纸质文档、PDF、数字文件或用数码相机拍摄的印刷文本图像)转换为可编辑和可搜索的机器编码文本数据的技术。 IronOCR 是一个出色的 OCR 引擎库,可为开发人员提供强大的 OCR 功能。 在本文中,我们将通过 OCR 软件演示,结合代码示例探讨如何使用 IronOCR 执行 OCR。 什么是 IronOCR? IronOCR 是一个功能强大的 .NET 库,旨在促进 C# 和 VB.NET 应用程序中的光学字符识别 (OCR)。 利用先进的算法和机器学习技术,IronOCR 可以准确地从扫描的 PDF 文件、图像和 PDF 中提取文本和内容,从而更轻松地以编程方式处理、搜索和分析此类文件。 凭借其简单明了的 API 和丰富的功能,开发人员可以将 OCR 功能无缝集成到他们的应用程序中,实现数据提取、文档处理、数据录入和内容管理任务的自动化。 无论您是从事商务工作,还是处理发票、报告、自动数据提取、可搜索的 PDF 或任何其他文本丰富的文档,IronOCR 都能提供可靠的解决方案,高效处理 OCR 要求。 IronOCR 入门 在深入学习代码示例之前,您需要通过 NuGet 软件包管理器安装 IronOCR 。 在软件包管理器控制台运行以下命令即可安装 IronOCR: Install-Package IronOcr 使用 IronOCR 执行 OCR. 基本文本识别 要使用 IronOCR 执行基本的文本识别,可以使用以下代码片段: using IronOcr; using System; class Program { static void Main() { var ocrTesseract = new IronTesseract(); using (var ocrInput = new OcrInput("ocr.png")) { var ocrResult = ocrTesseract.Read(ocrInput); string recognizedText = ocrResult.Text; Console.WriteLine(recognizedText); } } } using IronOcr; using System; class Program { static void Main() { var ocrTesseract = new IronTesseract(); using (var ocrInput = new OcrInput("ocr.png")) { var ocrResult = ocrTesseract.Read(ocrInput); string recognizedText = ocrResult.Text; Console.WriteLine(recognizedText); } } } Imports IronOcr Imports System Friend Class Program Shared Sub Main() Dim ocrTesseract = New IronTesseract() Using ocrInput As New OcrInput("ocr.png") Dim ocrResult = ocrTesseract.Read(ocrInput) Dim recognizedText As String = ocrResult.Text Console.WriteLine(recognizedText) End Using End Sub End Class $vbLabelText $csharpLabel 这段代码使用 IronOCR 对名为 "ocr.png "的图像文件执行光学字符识别(OCR)。 它初始化了一个 IronTesseract 对象,并将图像文件的文本层读入一个 OcrInput 对象。 然后以 recognizedText 的形式检索 OCR 结果并打印到控制台。 输出 - LOGO SHOP - LOREM IPSUM - DOLOR SITAMET CONSECTETUR - ADIPISCING ELIT - 1 LOREM IPSUM $3.20 - 2 ORNARE MALESUADA $9.50 - 3 PORTA FERMENTUM $5.90 - 4 SODALES ARCU $6.00 - 5 ELEIFEND $9.00 - 6 SEMNISIMASSA $0.50 - 7 DUIS FAMES DIS $7.60 - 8 FACILISIRISUS $810 - TOTAL AMOUNT $49.80 - CASH $50.00 高级 OCR 选项 IronOCR 提供多种选项,您可以根据自己的图像文件和要求定制 OCR 流程。 例如,您可以指定 OCR 语言、调整图像预处理设置或启用文本清理。 下面的示例展示了其中一些高级选项: using IronOcr; using System; class Program { static void Main() { var ocr = new IronTesseract(); using var ocrInput = new OcrInput(); ocrInput.LoadImage(@"images\image.png"); // Set OCR language to English ocr.Language = OcrLanguage.English; // Enable text cleaning and enhance the resolution ocrInput.DeNoise(); ocrInput.EnhanceResolution(225); var result = ocr.Read(ocrInput); if (!string.IsNullOrEmpty(result.Text)) { Console.WriteLine($"Recognized Text: {result.Text}"); } } } using IronOcr; using System; class Program { static void Main() { var ocr = new IronTesseract(); using var ocrInput = new OcrInput(); ocrInput.LoadImage(@"images\image.png"); // Set OCR language to English ocr.Language = OcrLanguage.English; // Enable text cleaning and enhance the resolution ocrInput.DeNoise(); ocrInput.EnhanceResolution(225); var result = ocr.Read(ocrInput); if (!string.IsNullOrEmpty(result.Text)) { Console.WriteLine($"Recognized Text: {result.Text}"); } } } Imports IronOcr Imports System Friend Class Program Shared Sub Main() Dim ocr = New IronTesseract() Dim ocrInput As New OcrInput() ocrInput.LoadImage("images\image.png") ' Set OCR language to English ocr.Language = OcrLanguage.English ' Enable text cleaning and enhance the resolution ocrInput.DeNoise() ocrInput.EnhanceResolution(225) Dim result = ocr.Read(ocrInput) If Not String.IsNullOrEmpty(result.Text) Then Console.WriteLine($"Recognized Text: {result.Text}") End If End Sub End Class $vbLabelText $csharpLabel 代码使用 IronOCR 对位于 "images "文件夹中的图像文件 "image.png "执行 OCR。 它将 OCR 语言设置为英语,清除图像噪点并增强其分辨率。 从图像中提取识别的文本,然后打印到控制台。 条形码读取 IronOCR 还支持条形码读取,允许您制作软件从图像中提取条形码信息。 下面是一个代码示例,演示了如何使用 IronOCR 读取条形码: using IronOcr; using System; class Program { static void Main() { var ocrTesseract = new IronTesseract(); ocrTesseract.Configuration.ReadBarCodes = true; using var ocrInput = new OcrInput(); ocrInput.LoadImage(@"images\imageWithBarcode.png"); var ocrResult = ocrTesseract.Read(ocrInput); foreach (var barcode in ocrResult.Barcodes) { Console.WriteLine(barcode.Value); } } } using IronOcr; using System; class Program { static void Main() { var ocrTesseract = new IronTesseract(); ocrTesseract.Configuration.ReadBarCodes = true; using var ocrInput = new OcrInput(); ocrInput.LoadImage(@"images\imageWithBarcode.png"); var ocrResult = ocrTesseract.Read(ocrInput); foreach (var barcode in ocrResult.Barcodes) { Console.WriteLine(barcode.Value); } } } Imports IronOcr Imports System Friend Class Program Shared Sub Main() Dim ocrTesseract = New IronTesseract() ocrTesseract.Configuration.ReadBarCodes = True Dim ocrInput As New OcrInput() ocrInput.LoadImage("images\imageWithBarcode.png") Dim ocrResult = ocrTesseract.Read(ocrInput) For Each barcode In ocrResult.Barcodes Console.WriteLine(barcode.Value) Next barcode End Sub End Class $vbLabelText $csharpLabel 代码使用 IronOCR 从 "images "文件夹中的图像文件 "imageWithBarcode.png "中检测和读取条形码。 它通过将 ReadBarCodes 设置为 true 来配置 IronOCR 以启用条形码读取功能。 检测到的条形码值将被打印到控制台。 PDF 文本提取 IronOCR 还可以从 PDF 和扫描文档中提取文本。 这是一个代码示例,演示了如何使用 IronOCR 从 PDF 文件中提取文本: using IronOcr; using System; class Program { static void Main() { var ocrTesseract = new IronTesseract(); using var ocrInput = new OcrInput(); // OCR entire document ocrInput.LoadPdf("Email_Report.pdf"); // Alternatively OCR selected page numbers int[] pages = { 1, 2, 3, 4, 5 }; ocrInput.LoadPdfPages("example.pdf", pages, Password: "password"); var ocrResult = ocrTesseract.Read(ocrInput); Console.WriteLine(ocrResult.Text); } } using IronOcr; using System; class Program { static void Main() { var ocrTesseract = new IronTesseract(); using var ocrInput = new OcrInput(); // OCR entire document ocrInput.LoadPdf("Email_Report.pdf"); // Alternatively OCR selected page numbers int[] pages = { 1, 2, 3, 4, 5 }; ocrInput.LoadPdfPages("example.pdf", pages, Password: "password"); var ocrResult = ocrTesseract.Read(ocrInput); Console.WriteLine(ocrResult.Text); } } Imports IronOcr Imports System Friend Class Program Shared Sub Main() Dim ocrTesseract = New IronTesseract() Dim ocrInput As New OcrInput() ' OCR entire document ocrInput.LoadPdf("Email_Report.pdf") ' Alternatively OCR selected page numbers Dim pages() As Integer = { 1, 2, 3, 4, 5 } ocrInput.LoadPdfPages("example.pdf", pages, Password:= "password") Dim ocrResult = ocrTesseract.Read(ocrInput) Console.WriteLine(ocrResult.Text) End Sub End Class $vbLabelText $csharpLabel 代码使用 IronOCR 对名为 "Email_Report.pdf "的 PDF 文档执行 OCR 处理。 它可以使用 LoadPdf 对整个文档进行 OCR,也可以使用 LoadPdfPages 对 "example.pdf "中的特定页面进行 OCR 并输入密码。 OCR 操作识别出的文本将打印到控制台。 结论 IronOCR是一个功能强大的.NET库,提供先进的OCR软件功能,使开发人员可以轻松地在应用程序中执行OCR任务。 在本文中,我们通过代码示例探讨了如何使用 IronOCR 进行基础和高级 OCR 软件演示。 如果您正在开发 .NET 项目,并需要集成 OCR 功能,那么 IronOCR 绝对值得您在考察不同的 OCR 引擎时加以考虑。 其易用性、速度、灵活性和丰富的文档使其成为开发人员执行 OCR 自动化任务的热门选择。 那么,为什么不试试 IronOCR,看看它如何简化您自己的 OCR 项目开发流程呢? 它可能是最适合您的项目的 OCR 引擎。 IronOCR 提供免费的 试用许可证,然后起价为 $799 美元,允许您在项目中继续充分利用 IronOCR。 要了解有关 IronOCR 的更多信息,请访问 此处。 常见问题解答 如何在 C# 中执行 OCR? 您可以使用 IronOCR 库在 C# 中执行 OCR。首先,使用命令 Install-Package IronOcr 通过 NuGet 包管理器安装它。然后,使用 IronTesseract 对象从图像或 PDF 中读取文本并将其转换为可编辑文本。 使用 C# 从图像中提取文本涉及哪些步骤? 要在 C# 中从图像中提取文本,使用 IronOCR 创建一个 IronTesseract 对象的实例。加载图像,例如 'ocr.png',然后调用 Read() 方法来处理图像并提取文本。 我可以使用 IronOCR 自定义 OCR 过程吗? 是的,IronOCR 允许您通过设置 OCR 语言、启用图像预处理以减少噪声以及调整分辨率来提高准确性,来自定义 OCR 过程。 是否可以使用 IronOCR 执行条形码读取? 是的,IronOCR 支持条形码读取。您可以通过在 OCR 设置中启用条形码读取功能来配置它,以检测并从图像中提取条形码信息。 如何使用 C# 从 PDF 中提取文本? 使用 IronOCR,您可以在 C# 中从 PDF 文件中提取文本。您可以选择对整个文档或特定页面进行 OCR,通过将 PDF 加载到 IronTesseract 并使用其 Read() 方法来提取文本。 是什么让 IronOCR 成为开发人员的推荐选择? 由于其全面的 OCR 功能、易用性、快速处理和灵活性,IronOCR 被推荐给开发人员。它可无缝集成到 .NET 项目中,允许有效地自动化 OCR 任务。 IronOCR 是否有可用的许可选项? IronOCR 提供多种许可选项,从免费试用开始。开发人员可以选择不同的许可证来继续在他们的应用程序中使用 IronOCR 的完整功能。 在哪里可以找到使用 IronOCR 的代码示例? 您可以在文章 'C# 中的 OCR 软件演示(开发者教程)' 中找到使用 IronOCR 的代码示例。示例展示了基本文本识别、高级 OCR 选项和条形码读取。 Kannapat Udonpant 立即与工程团队聊天 软件工程师 在成为软件工程师之前,Kannapat 在日本北海道大学完成了环境资源博士学位。在攻读学位期间,Kannapat 还成为了车辆机器人实验室的成员,隶属于生物生产工程系。2022 年,他利用自己的 C# 技能加入 Iron Software 的工程团队,专注于 IronPDF。Kannapat 珍视他的工作,因为他可以直接从编写大多数 IronPDF 代码的开发者那里学习。除了同行学习外,Kannapat 还喜欢在 Iron Software 工作的社交方面。不撰写代码或文档时,Kannapat 通常可以在他的 PS5 上玩游戏或重温《最后生还者》。 相关文章 已发布十二月 18, 2025 C# 读取 PDF 表单字段:以编程方式提取表单数据 了解如何使用IronPDF在C#中读取PDF表单字段。从可填写PDF中提取文本、复选框、下拉列表等,提供简单的代码示例。 阅读更多 已发布十二月 18, 2025 C# 从 PDF 中提取图像:完整开发者指南 了解如何在C#中使用IronPDF强大的方法从PDF文档中提取图像。包含.NET开发人员的完整指南和代码示例。 阅读更多 已发布十二月 18, 2025 C# 将 PDF 转换为图像:完整开发者指南 了解如何在C#中使用IronPDF将PDF文档转换为图像。提供JPG、PNG和TIFF转换的逐步指南和代码示例。 阅读更多 用于多种语言的 Tesseract OCR(开发者教程)如何在 C# 中执行车辆登记 OCR
已发布十二月 18, 2025 C# 读取 PDF 表单字段:以编程方式提取表单数据 了解如何使用IronPDF在C#中读取PDF表单字段。从可填写PDF中提取文本、复选框、下拉列表等,提供简单的代码示例。 阅读更多