跳至頁尾內容

文件閱讀

使用 IronOCR 從發票和報告中準確提取文字和數據,更快地建立功能。

Icon Main related to 文件閱讀
文件閱讀

1

閱讀掃描文檔

將紙本文件和圖像型 PDF 文件精確數位化為機器可讀文字。非常適合建立可搜尋的檔案、自動輸入紙本表單數據,以及使掃描內容易於存取和索引。我們的引擎能夠出色地處理常見的掃描缺陷。

學習如何在 C# 中使用讀取掃描文檔
using IronOcr;
using System;

// Instantiate OCR engine
var ocr = new IronTesseract();

// Configure OCR engine
using var input = new OcrInput();
input.LoadImage("potter.tiff");

// Perform OCR
OcrResult result = ocr.ReadDocument(input);
Console.WriteLine(result.Text);
C#
2

閱讀發票文件

透過智慧地從發票中提取結構化數據,實現應付帳款工作流程自動化。超越簡單的文字提取,即使面對不同的佈局和模板,也能捕獲發票編號、到期日、總金額和供應商名稱等鍵值對。

學習如何:讀取文件中的複雜表格
using IronOcr;

// Instantiate OCR engine
var ocr = new IronTesseract();

// Enable table detection
ocr.Configuration.ReadDataTables = true;
using var input = new OcrPdfInput("sample.pdf");
var result = ocr.Read(input);

// Retrieve the data
var table = result.Tables[0].DataTable;

// Print the retrieved item to the console
Console.WriteLine($"The first item in the table is: {result.Tables[0].DataTable.Rows[0][0]}");
C#
3

閱讀照片

將智慧型手機照片和相機影像轉換為可用的文字。非常適合用於行動應用程序,例如捕捉收據以進行費用追蹤、將白板筆記數位化、從產品標籤中提取資訊或讀取路標和海報上的文字。

學習如何在 C# 中使用 Read Photo 函數
using IronOcr;

var ocr = new IronTesseract();
using var inputPhoto = new OcrInput();
inputPhoto.LoadImageFrame("ocr.tiff", 0);

// Read photo
OcrPhotoResult result = ocr.ReadPhoto(inputPhoto);

// Extract the text in the first region
string textinregion = result.TextRegions[0].TextInRegion;

// Print the text in the first region 
Console.WriteLine($"Full Scnned Photo Text: {textinregion}");
C#
4

看螢幕截圖

即時擷取並處理來自應用程式視窗、使用者介面或網頁內容的螢幕文字。透過讀取其他應用程式的使用者介面元素,實現與其他應用程式的無縫整合。

學習如何在 C# 中使用 Read Screenshot 功能
using IronOcr;
using System;
using System.Linq;

// Instantiate OCR engine
var ocr = new IronTesseract();
using var inputScreenshot = new OcrInput();
inputScreenshot.LoadImage("screenshotOCR.png");

// Perform OCR
OcrPhotoResult result = ocr.ReadScreenShot(inputScreenshot);

// Output screenshot information
Console.WriteLine(result.Text);
C#
準備好開始了嗎?
Nuget 下載 5,299,091 | 版本: 2025.12 剛剛發布