如何讀取圖像

This article was translated from English: Does it need improvement?
Translated
View the article in English

查克尼思·賓

OCR(光學字元識別)是一種用於識別和提取圖像中文字的技術。 這項技術對於數位化印刷文件特別有用,因為它可以讓您從掃描的頁面、照片或其他影像檔案中提取並處理文本內容。

IronOCR支援多種影像格式,包括jpg、png、gif、tiff和bmp。亦提供影像過濾功能以增強讀取能力。

開始使用IronOCR

立即在您的專案中使用IronOCR,並享受免費試用。

第一步:
green arrow pointer



讀取圖片範例

首先實例化 IronTesseract 類以啟用 OCR。 使用 'using' 語句來創建一個 OcrImageInput 對象,指定圖像文件路徑。 這確保了資源不再需要時能夠適當地處理。 IronOCR支持各種格式的輸入圖像,包括jpg、png、gif、tiff和bmp。最後,使用Read方法來執行OCR。

:path=/static-assets/ocr/content-code-examples/how-to/input-images-read.cs
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("Potter.png");

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
Imports IronOcr

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Add image
Private imageInput = New OcrImageInput("Potter.png")

' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)
VB   C#
讀取PNG圖片

訪問如何讀取多幀/頁的GIF和TIFF文章以了解有關閱讀 TIFF 和 GIF 圖像的更多信息。

將圖像導入為位元組

除了普通的文件路徑外,OcrImageInput類還接受以位元組、AnyBitmap、Stream 以及 Image 形式的圖像資訊。 AnyBitmap 是一個位圖物件IronSoftware.Drawing.AnyBitmap.

:path=/static-assets/ocr/content-code-examples/how-to/input-images-import-byte.cs
using IronOcr;
using System.IO;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Read byte from file
byte[] data = File.ReadAllBytes("Potter.tiff");

// Import image byte
using var imageInput = new OcrImageInput(data);
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
Imports IronOcr
Imports System.IO

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Read byte from file
Private data() As Byte = File.ReadAllBytes("Potter.tiff")

' Import image byte
Private imageInput = New OcrImageInput(data)
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)
VB   C#

指定掃描區域

在實例化 OcrImageInput 類時,也接受 CropRectangle。 這允許您指定圖像文件的哪個區域應進行OCR識別。 根據圖像文件,指定要掃描的區域可以顯著提高性能。 在我提供的程式碼範例中,我指定只讀取章節號碼和標題。

:path=/static-assets/ocr/content-code-examples/how-to/input-images-read-specific-region.cs
using IronOcr;
using IronSoftware.Drawing;
using System;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Specify crop region
Rectangle scanRegion = new Rectangle(800, 200, 900, 400);

// Add image
using var imageInput = new OcrImageInput("Potter.tiff", ContentArea: scanRegion);
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Output the result to console
Console.WriteLine(ocrResult.Text);
Imports IronOcr
Imports IronSoftware.Drawing
Imports System

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Specify crop region
Private scanRegion As New Rectangle(800, 200, 900, 400)

' Add image
Private imageInput = New OcrImageInput("Potter.tiff", ContentArea:= scanRegion)
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)

' Output the result to console
Console.WriteLine(ocrResult.Text)
VB   C#

OCR結果

讀取特定區域
Chaknith related to OCR結果

查克尼思·賓

軟體工程師

Chaknith 是開發者界的夏洛克福爾摩斯。他第一次意識到自己可能有個軟體工程的未來,是在他為了娛樂而參加程式挑戰的時候。他的重點是 IronXL 和 IronBarcode,但他也引以為豪的是,他幫助客戶解決所有產品的問題。Chaknith 利用他與客戶直接對話中獲得的知識,以進一步改進產品。他的實際反饋超越了 Jira 工單,並支持產品開發、文件撰寫和行銷,以提升客戶的整體體驗。不在公司時,他通常在學習機器學習、寫程式和徒步旅行。