How to Extract Read Results

This article was translated from English: Does it need improvement?
Translated
View the article in English

讀取或OCR結果包含與檢測到的段落、行、單詞和單個字符有關的大量信息。 對於每個這些元素,結果提供了一套全面的細節。

對於每個元素,它提供了文本內容、精確的X和Y坐標、尺寸(寬度和高度)、文本方向(從左到右或從上到下)以及在CropRectangle對象中的位置。

作為標題:2(快速開始:從檢測到的第一個單詞中檢索單詞文本)

立刻開始:使用IronTesseract的Read方法對圖像進行OCR,並使用Words集合提取第一個單詞的文本。 非常適合快速設置和簡單的提取任務。

Nuget IconGet started making PDFs with NuGet now:

  1. Install IronOCR with NuGet Package Manager

    PM > Install-Package IronOcr

  2. Copy and run this code snippet.

    string wordText = new IronTesseract().Read("file.jpg").Words[0].Text;
  3. Deploy to test on your live environment

    Start using IronOCR in your project today with a free trial
    arrow pointer
class="hsg-featured-snippet">

最小工作流(5步)

  1. 下載一個C#庫以訪問讀取結果
  2. 準備目標圖像和PDF文件
  3. 使用Read方法對導入的文檔進行OCR
  4. 訪問結果的X, Y, 寬度, 高度和文本方向
  5. 檢查檢測到的段落、行、單詞和字符比較


OcrResult中的數據

結果值不僅包含提取的文本,還提供關於IronOcr在PDF和圖像文檔中發現的頁面、段落、行、單詞、字符和條形碼的信息。 您可以使用返回的OcrResult對象中的Read方法訪問此信息。

:path=/static-assets/ocr/content-code-examples/how-to/read-results-output-information.cs
using IronOcr;
using System;
using static IronOcr.OcrResult;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Retrieve list of detected paragraphs
Paragraph[] paragraphs = ocrResult.Paragraphs;

// Output information to console
Console.WriteLine($"Text: {paragraphs[0].Text}");
Console.WriteLine($"X: {paragraphs[0].X}");
Console.WriteLine($"Y: {paragraphs[0].Y}");
Console.WriteLine($"Width: {paragraphs[0].Width}");
Console.WriteLine($"Height: {paragraphs[0].Height}");
Console.WriteLine($"Text direction: {paragraphs[0].TextDirection}");
Imports IronOcr
Imports System
Imports IronOcr.OcrResult

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Add image
Private imageInput = New OcrImageInput("sample.jpg")
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)

' Retrieve list of detected paragraphs
Private paragraphs() As Paragraph = ocrResult.Paragraphs

' Output information to console
Console.WriteLine($"Text: {paragraphs(0).Text}")
Console.WriteLine($"X: {paragraphs(0).X}")
Console.WriteLine($"Y: {paragraphs(0).Y}")
Console.WriteLine($"Width: {paragraphs(0).Width}")
Console.WriteLine($"Height: {paragraphs(0).Height}")
Console.WriteLine($"Text direction: {paragraphs(0).TextDirection}")
$vbLabelText   $csharpLabel
class="content-img-align-center">
class="center-image-wrapper">Data in OcrResult

對於文本的每個部分,例如段落、行、單詞和單個字符,我們提供以下信息:

  • 文本:實際文本作為字符串。
  • X:從頁面左邊緣的像素位置。
  • Y:從頁面頂部邊緣的像素位置。
  • 寬度:以像素為單位的寬度。
  • 高度:以像素為單位的高度。
  • 文本方向:讀取文本的方向,例如“從左到右”或“從上到下”。
  • 位置:顯示此文本在頁面上像素位置的矩形。

段落、行、單詞和字符比較

以下是檢測到的段落、行、單詞和字符的比較。

class="content-img-align-center">
class="center-image-wrapper">Highlight paragraph
class="content-img-align-center">
class="center-image-wrapper">Highlight line
class="content-img-align-center">
class="center-image-wrapper">Highlight word
class="content-img-align-center">
class="center-image-wrapper">Highlight character

條形碼和二維碼

沒錯! IronOcr能夠讀取條形碼和二維碼。 雖然此功能可能不如IronBarcode那樣強大,但IronOcr仍支持常見的條形碼類型。要啟用條形碼檢測,將Configuration.ReadBarCodes屬性設置為true。

此外,可以從檢測到的條形碼中提取有價值的信息,包括其格式、值、坐標(x,y)、高度、寬度和作為IronSoftware.Drawing.Rectangle對象的位置。 在IronDrawing中的此Rectangle類允許在文檔上精確定位。

:path=/static-assets/ocr/content-code-examples/how-to/read-results-barcodes.cs
using IronOcr;
using System;
using static IronOcr.OcrResult;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Enable barcodes detection
ocrTesseract.Configuration.ReadBarCodes = true;

// Add image
using OcrInput ocrInput = new OcrInput();
ocrInput.LoadPdf("sample.pdf");

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(ocrInput);

// Output information to console
foreach(var barcode in ocrResult.Barcodes)
{
    Console.WriteLine("Format = " + barcode.Format);
    Console.WriteLine("Value = " + barcode.Value);
    Console.WriteLine("X = " + barcode.X);
    Console.WriteLine("Y = " + barcode.Y);
}
Console.WriteLine(ocrResult.Text);
Imports IronOcr
Imports System
Imports IronOcr.OcrResult

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Enable barcodes detection
ocrTesseract.Configuration.ReadBarCodes = True

' Add image
Using ocrInput As New OcrInput()
	ocrInput.LoadPdf("sample.pdf")
	
	' Perform OCR
	Dim ocrResult As OcrResult = ocrTesseract.Read(ocrInput)
	
	' Output information to console
	For Each barcode In ocrResult.Barcodes
		Console.WriteLine("Format = " & barcode.Format)
		Console.WriteLine("Value = " & barcode.Value)
		Console.WriteLine("X = " & barcode.X)
		Console.WriteLine("Y = " & barcode.Y)
	Next barcode
	Console.WriteLine(ocrResult.Text)
End Using
$vbLabelText   $csharpLabel

輸出

class="content-img-align-center">
class="center-image-wrapper">Detect barcodes

常見問題解答

如何使用 C# 從圖像和 PDF 中提取文字元素?

您可以使用 IronOCR 從圖像和 PDF 中提取文字元素,方法是利用其「讀取」方法,該方法執行光學字元辨識 (OCR) 以獲取有關段落、行、單字和字元的詳細信息,包括它們的文字內容、座標和尺寸。

在.NET C#中如何開始使用OCR?

要開始在 .NET C# 中使用 OCR,請從 NuGet 下載 IronOCR 庫,準備圖像或 PDF 文檔,然後使用 `Read` 方法獲取 `OcrResult` 對象,其中包含有關提取的文本和文檔結構的詳細資訊。

IronOCR能否偵測並擷取條碼資訊?

是的,IronOCR 可以透過將 `Configuration.ReadBarCodes` 屬性設為 true 來偵測和提取條碼訊息,從而檢索條碼的格式、值及其在文件中的位置等資料。

IronOCR可以偵測哪些類型的文檔元素?

IronOCR 可以檢測各種文件元素,包括頁面、段落、行、單字和單個字符,以及條碼和二維碼,從而提供對文件結構的全面分析。

如何配置 IronOCR 以讀取不同方向的文字?

IronOCR 能夠透過分析 `OcrResult` 物件中的 direction 屬性,以多種方向讀取文本,例如「從左到右」或「從上到下」。

IronOCR 中的 `CropRectangle` 物件是什麼?

IronOCR 中的 `CropRectangle` 物件根據座標和尺寸定義頁面上文字元素的位置和大小,有助於精確識別和提取文字。

如何使用 IronOCR 的 `Read` 方法分析文件?

若要在 IronOCR 中使用 `Read` 方法,請建立 IronOCR 引擎的實例,載入目標文檔,然後執行 `Read` 方法以取得 OCR 結果,這些結果可用於存取文字資料和文件屬性。

IronOCR如何處理二維碼的偵測?

IronOCR 透過啟用 `Configuration.ReadBarCodes` 設定來處理二維碼的偵測,從而啟用條碼讀取功能,提取二維碼數據,包括其格式、值和位置。

`OcrResult` 在文字擷取中扮演什麼角色?

`OcrResult` 物件在文字擷取中起著至關重要的作用,它保存提取的文字以及文字元素的位置、尺寸和方向等詳細信息,以及條碼資訊。

如何確保使用 IronOCR 準確提取文字?

為了確保使用 IronOCR 準確提取文本,請務必提供高品質的輸入文檔,並正確配置諸如 `Configuration.ReadBarCodes` 之類的條碼檢測設置,以優化 OCR 性能。

A PHP Error was encountered

Severity: Warning

Message: Illegal string offset 'name'

Filename: sections/author_component.php

Line Number: 18

Backtrace:

File: /var/www/ironpdf.com/application/views/main/sections/author_component.php
Line: 18
Function: _error_handler

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 63
Function: view

File: /var/www/ironpdf.com/application/views/products/sections/three_column_docs_page_structure.php
Line: 64
Function: main_view

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 88
Function: view

File: /var/www/ironpdf.com/application/views/products/how-to/index.php
Line: 2
Function: view

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 88
Function: view

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 552
Function: view

File: /var/www/ironpdf.com/application/controllers/Products/Howto.php
Line: 31
Function: render_products_view

File: /var/www/ironpdf.com/index.php
Line: 292
Function: require_once

A PHP Error was encountered

Severity: Warning

Message: Illegal string offset 'title'

Filename: sections/author_component.php

Line Number: 38

Backtrace:

File: /var/www/ironpdf.com/application/views/main/sections/author_component.php
Line: 38
Function: _error_handler

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 63
Function: view

File: /var/www/ironpdf.com/application/views/products/sections/three_column_docs_page_structure.php
Line: 64
Function: main_view

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 88
Function: view

File: /var/www/ironpdf.com/application/views/products/how-to/index.php
Line: 2
Function: view

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 88
Function: view

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 552
Function: view

File: /var/www/ironpdf.com/application/controllers/Products/Howto.php
Line: 31
Function: render_products_view

File: /var/www/ironpdf.com/index.php
Line: 292
Function: require_once

A PHP Error was encountered

Severity: Warning

Message: Illegal string offset 'comment'

Filename: sections/author_component.php

Line Number: 48

Backtrace:

File: /var/www/ironpdf.com/application/views/main/sections/author_component.php
Line: 48
Function: _error_handler

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 63
Function: view

File: /var/www/ironpdf.com/application/views/products/sections/three_column_docs_page_structure.php
Line: 64
Function: main_view

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 88
Function: view

File: /var/www/ironpdf.com/application/views/products/how-to/index.php
Line: 2
Function: view

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 88
Function: view

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 552
Function: view

File: /var/www/ironpdf.com/application/controllers/Products/Howto.php
Line: 31
Function: render_products_view

File: /var/www/ironpdf.com/index.php
Line: 292
Function: require_once

準備好開始了嗎?
Nuget 下載 5,044,537 | 版本: 2025.11 剛剛發布