如何讀取圖像
光學字符識別(OCR)是一種用於識別和提取圖像中文本的技術。這項技術對於數位化打印文件特別有用,因為它允許您從掃描頁面、照片或其他圖像文件中提取並處理文本內容。
IronOCR 支持各種圖像格式,包括 jpg、png、gif、tiff 和 bmp。圖像過濾器也可用於提高讀取能力。
如何讀取圖像
- 下載用於讀取圖片的C#庫
- 支持多種格式的圖像,包括jpg、png、gif、tiff和bmp
- 實例化 OcrImageInput 用於輸入圖像的類別
- 使用
讀取
對輸入圖像執行OCR的方法 - 指定裁剪區域以定義讀取區域
立即開始在您的專案中使用IronPDF,並享受免費試用。
查看 IronOCR 上 Nuget 快速安裝和部署。已被下載超過800萬次,它正用C#改變OCR。
Install-Package IronOcr
請考慮安裝 IronOCR DLL 直接下載並手動安裝到您的專案或GAC表單: IronOcr.zip
手動安裝到您的項目中
下載DLL讀取圖像範例
首先,實例化 IronTesseract 類以啟用 OCR。使用 'using' 語句來創建一個 OcrImageInput 對象,指定圖像文件路徑。這確保了在不再需要資源時正確釋放資源。IronOCR 支持多種格式的輸入圖像,包括 jpg、png、gif、tiff 和 bmp。最後,使用 Read
方法執行 OCR。
:path=/static-assets/ocr/content-code-examples/how-to/input-images-read.cs
using IronOcr;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Add image
using var imageInput = new OcrImageInput("Potter.png");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
Imports IronOcr
' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()
' Add image
Private imageInput = New OcrImageInput("Potter.png")
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)
訪問 如何讀取多幀/頁的GIF和TIFF 文章以了解有關閱讀 TIFF 和 GIF 圖像的更多信息。
導入影像為位元組
除了使用一般的檔案路徑,OcrImageInput 類還接受位元組、AnyBitmap、Stream 和 Image 形式的影像資訊。AnyBitmap 是一個點陣圖對象。 IronSoftware.Drawing.AnyBitmap.
:path=/static-assets/ocr/content-code-examples/how-to/input-images-import-byte.cs
using IronOcr;
using System.IO;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Read byte from file
byte[] data = File.ReadAllBytes("Potter.tiff");
// Import image byte
using var imageInput = new OcrImageInput(data);
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
Imports IronOcr
Imports System.IO
' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()
' Read byte from file
Private data() As Byte = File.ReadAllBytes("Potter.tiff")
' Import image byte
Private imageInput = New OcrImageInput(data)
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)
指定掃描區域
在實例化 OcrImageInput 類時,也接受 CropRectangle。這允許您指定圖像文檔中應該進行 OCR 的區域。根據圖像文檔的不同,指定掃描區域可以顯著提高性能。在我提供的代碼示例中,我指定僅讀取章節號和標題。
:path=/static-assets/ocr/content-code-examples/how-to/input-images-read-specific-region.cs
using IronOcr;
using IronSoftware.Drawing;
using System;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Specify crop region
Rectangle scanRegion = new Rectangle(800, 200, 900, 400);
// Add image
using var imageInput = new OcrImageInput("Potter.tiff", ContentArea: scanRegion);
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
// Output the result to console
Console.WriteLine(ocrResult.Text);
Imports IronOcr
Imports IronSoftware.Drawing
Imports System
' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()
' Specify crop region
Private scanRegion As New Rectangle(800, 200, 900, 400)
' Add image
Private imageInput = New OcrImageInput("Potter.tiff", ContentArea:= scanRegion)
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)
' Output the result to console
Console.WriteLine(ocrResult.Text)