如何提取读取结果

查克尼特·宾

2023年十月31日

更新 2024年十二月10日

Translated

View the article in English

读取或OCR结果包含了大量关于检测到的段落、行、单词和个别字符的信息。对于这些元素中的每一个，结果提供了一套全面的细节。

对于每个元素，它提供文本内容、精确的X和Y坐标、尺寸（宽度和高度）、文本方向（从左到右或从上到下）以及在CropRectangle对象中的位置。

开始使用IronOCR

立即在您的项目中开始使用IronOCR，并享受免费试用。

第一步：

如何提取读取结果

下载 C# 库以访问读取结果
准备目标图像和 PDF 文档
使用Read方法对导入的文档执行OCR
访问结果的 X、Y、宽度、高度和文字方向
检查检测到的段落、行、单词和字符对比

OcrResult 中的数据

结果值不仅包含提取的文本，还提供了由IronOCR在PDF和图像文档中发现的页面、段落、行、单词、字符和条形码的信息。您可以使用Read方法从返回的OcrResult对象中访问此信息。

:path=/static-assets/ocr/content-code-examples/how-to/read-results-output-information.cs

using IronOcr;
using System;
using static IronOcr.OcrResult;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Retrieve list of detected paragraphs
Paragraph[] paragraphs = ocrResult.Paragraphs;

// Output information to console
Console.WriteLine($"Text: {paragraphs[0].Text}");
Console.WriteLine($"X: {paragraphs[0].X}");
Console.WriteLine($"Y: {paragraphs[0].Y}");
Console.WriteLine($"Width: {paragraphs[0].Width}");
Console.WriteLine($"Height: {paragraphs[0].Height}");
Console.WriteLine($"Text direction: {paragraphs[0].TextDirection}");

Imports IronOcr
Imports System
Imports IronOcr.OcrResult

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Add image
Private imageInput = New OcrImageInput("sample.jpg")
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)

' Retrieve list of detected paragraphs
Private paragraphs() As Paragraph = ocrResult.Paragraphs

' Output information to console
Console.WriteLine($"Text: {paragraphs(0).Text}")
Console.WriteLine($"X: {paragraphs(0).X}")
Console.WriteLine($"Y: {paragraphs(0).Y}")
Console.WriteLine($"Width: {paragraphs(0).Width}")
Console.WriteLine($"Height: {paragraphs(0).Height}")
Console.WriteLine($"Text direction: {paragraphs(0).TextDirection}")

$vbLabelText $csharpLabel

对于文本的每个部分，如段落、行、词和单个字符，我们提供以下信息：

文本：实际文本为字符串。
X：距页面左边缘的位置，以像素为单位。
Y：从页面顶部边缘向下的像素位置。
宽度：像素宽度。
高度：像素中的高度。
文本方向：文本的阅读方向，例如“从左到右”或“从上到下”。
位置：一个矩形，显示此文本在页面上的像素位置。

段落、行、单词和字符比较

以下是检测到的段落、行、单词和字符的比较。

Paragraph	Line
Word	Character

条形码和二维码

没错！ IronOcr可以读取条形码和二维码。虽然该功能可能不如 IronBarcode 强大，但 IronOCR 确实支持常见的条形码类型。要启用条形码检测，请将Configuration.ReadBarCodes属性设置为 true。

此外，可以从检测到的条形码中提取有价值的信息，包括其格式、值、坐标（x，y）、高度、宽度和位置，作为IronSoftware.Drawing.Rectangle对象。在 IronDrawing 中，这个Rectangle类允许在文档上进行精确定位。

:path=/static-assets/ocr/content-code-examples/how-to/read-results-barcodes.cs

using IronOcr;
using System;
using static IronOcr.OcrResult;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Enable barcodes detection
ocrTesseract.Configuration.ReadBarCodes = true;

// Add image
using OcrInput ocrInput = new OcrInput();
ocrInput.LoadPdf("sample.pdf");

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(ocrInput);

// Output information to console
foreach(var barcode in ocrResult.Barcodes)
{
    Console.WriteLine("Format = " + barcode.Format);
    Console.WriteLine("Value = " + barcode.Value);
    Console.WriteLine("X = " + barcode.X);
    Console.WriteLine("Y = " + barcode.Y);
}
Console.WriteLine(ocrResult.Text);

Imports IronOcr
Imports System
Imports IronOcr.OcrResult

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Enable barcodes detection
ocrTesseract.Configuration.ReadBarCodes = True

' Add image
Using ocrInput As New OcrInput()
	ocrInput.LoadPdf("sample.pdf")
	
	' Perform OCR
	Dim ocrResult As OcrResult = ocrTesseract.Read(ocrInput)
	
	' Output information to console
	For Each barcode In ocrResult.Barcodes
		Console.WriteLine("Format = " & barcode.Format)
		Console.WriteLine("Value = " & barcode.Value)
		Console.WriteLine("X = " & barcode.X)
		Console.WriteLine("Y = " & barcode.Y)
	Next barcode
	Console.WriteLine(ocrResult.Text)
End Using

$vbLabelText $csharpLabel

输出

查克尼特·宾

立即与工程团队聊天

软件工程师

Chaknith 是开发者中的福尔摩斯。他第一次意识到自己可能在软件工程方面有前途，是在他出于乐趣做代码挑战的时候。他的重点是 IronXL 和 IronBarcode，但他为能帮助客户解决每一款产品的问题而感到自豪。Chaknith 利用他从直接与客户交谈中获得的知识，帮助进一步改进产品。他的轶事反馈不仅仅局限于 Jira 票据，还支持产品开发、文档编写和市场营销，从而提升客户的整体体验。当他不在办公室时，他可能会在学习机器学习、编程或徒步旅行。