如何讀取圖像
OCR(光學字元識別)是一種用於識別和提取圖像中文字的技術。 這項技術對於數位化印刷文件特別有用,因為它可以讓您從掃描的頁面、照片或其他影像檔案中提取並處理文本內容。
IronOCR支援多種影像格式,包括jpg、png、gif、tiff和bmp。亦提供影像過濾功能以增強讀取能力。
開始使用IronOCR
立即在您的專案中使用IronOCR,並享受免費試用。
如何讀取圖像
- 下載用於讀取圖片的C#庫
- 支持多種格式的圖像,包括jpg、png、gif、tiff和bmp
- 實例化 OcrImageInput 用於輸入圖像的類別
- 使用
讀取
對輸入圖像執行OCR的方法 - 指定裁剪區域以定義讀取區域
讀取圖片範例
首先實例化 IronTesseract 類以啟用 OCR。 使用 'using' 語句來創建一個 OcrImageInput 對象,指定圖像文件路徑。 這確保了資源不再需要時能夠適當地處理。 IronOCR支持各種格式的輸入圖像,包括jpg、png、gif、tiff和bmp。最後,使用Read
方法來執行OCR。
:path=/static-assets/ocr/content-code-examples/how-to/input-images-read.cs
using IronOcr;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Add image
using var imageInput = new OcrImageInput("Potter.png");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
Imports IronOcr
' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()
' Add image
Private imageInput = New OcrImageInput("Potter.png")
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)
訪問如何讀取多幀/頁的GIF和TIFF文章以了解有關閱讀 TIFF 和 GIF 圖像的更多信息。
將圖像導入為位元組
除了普通的文件路徑外,OcrImageInput類還接受以位元組、AnyBitmap、Stream 以及 Image 形式的圖像資訊。 AnyBitmap 是一個位圖物件IronSoftware.Drawing.AnyBitmap.
:path=/static-assets/ocr/content-code-examples/how-to/input-images-import-byte.cs
using IronOcr;
using System.IO;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Read byte from file
byte[] data = File.ReadAllBytes("Potter.tiff");
// Import image byte
using var imageInput = new OcrImageInput(data);
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
Imports IronOcr
Imports System.IO
' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()
' Read byte from file
Private data() As Byte = File.ReadAllBytes("Potter.tiff")
' Import image byte
Private imageInput = New OcrImageInput(data)
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)
指定掃描區域
在實例化 OcrImageInput 類時,也接受 CropRectangle。 這允許您指定圖像文件的哪個區域應進行OCR識別。 根據圖像文件,指定要掃描的區域可以顯著提高性能。 在我提供的程式碼範例中,我指定只讀取章節號碼和標題。
:path=/static-assets/ocr/content-code-examples/how-to/input-images-read-specific-region.cs
using IronOcr;
using IronSoftware.Drawing;
using System;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Specify crop region
Rectangle scanRegion = new Rectangle(800, 200, 900, 400);
// Add image
using var imageInput = new OcrImageInput("Potter.tiff", ContentArea: scanRegion);
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
// Output the result to console
Console.WriteLine(ocrResult.Text);
Imports IronOcr
Imports IronSoftware.Drawing
Imports System
' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()
' Specify crop region
Private scanRegion As New Rectangle(800, 200, 900, 400)
' Add image
Private imageInput = New OcrImageInput("Potter.tiff", ContentArea:= scanRegion)
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)
' Output the result to console
Console.WriteLine(ocrResult.Text)