使用 IRONOCR

使用計算機視覺進行OCR(範例教程)

已更新 2024年1月28日
分享:

光學字符識別(光學字符識別)是一種技術,使機器能夠從影像中讀取和解釋文本,使資料處理和自動化更快速且更高效。 本文提供了使用IronOCR庫進行OCR計算機視覺的指南,並介紹了如何通過自動化此過程來增強文字識別。

為什麼光學字符識別 (光學字符識別) 很重要?

光學字符識別與電腦視覺是一種先進的光學字符識別技術(光學字符識別)利用人工智慧和機器學習演算法的力量,更準確和高效地從圖像中識別文字字符。

電腦視覺影像處理算法使 OCR 系統能夠理解圖像中文本的上下文和佈局,並根據字符的形狀和結構識別字符。 光學字符識別(OCR)與計算機視覺相結合,可以從包含多種字體、樣式和大小的複雜圖像中提取文本,使其成為文件數位化、資料提取和自動化中的寶貴工具。

IronOCR:C# OCR 庫

IronOCR是一個流行的OCR庫,使用計算機視覺技術從圖像和文件中提取文本。 它易於使用,並可與多種程式語言整合,包括 C# 和 VB.NET。 IronOCR 提供內部部署和雲端版本,並提供多種功能以處理和提取圖像中的文本。

安裝 IronOCR

若要安裝 IronOCR,請在 NuGet 套件管理器主控台中使用以下命令:

:ProductInstall

IronOCR 的 OCR 系統

以下圖片用於測試具有計算機視覺的OCR系統使用 IronOCR。

使用電腦視覺的光學字符識別 (範例教程),圖 1:用於 OCR 檢測的影像樣本

用於OCR檢測的圖像範例

尋找文本區域

尋找文字區域方法用於識別圖像中的單個文字區域。 該方法接受多個可選參數,包括 ScaleDilationAmountBinarizeInvert。 Scale 調整影像的大小,DilationAmount 增加文字的粗細,Binarize 將影像轉換為黑白,Invert 則反轉影像的顏色。

using IronOcr;
using System;

var ocr = new IronTesseract();
using (var inputOCR = new OcrInput("test.jpg")) 
{
    inputOCR.FindTextRegion();
    OcrResult result = ocr.Read(input);
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
using IronOcr;
using System;

var ocr = new IronTesseract();
using (var inputOCR = new OcrInput("test.jpg")) 
{
    inputOCR.FindTextRegion();
    OcrResult result = ocr.Read(input);
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
Imports IronOcr
Imports System

Private ocr = New IronTesseract()
Using inputOCR = New OcrInput("test.jpg")
	inputOCR.FindTextRegion()
	Dim result As OcrResult = ocr.Read(input)
	Dim resultText As String = result.Text
	Console.WriteLine(resultText)
End Using
VB   C#

运行代码后,您会看到它使用机器学习过程从文本区域中提取文本。 輸出結果在控制台中顯示,文字辨識準確率幾乎達到100%。 IronOCR 對各種形式的文字(無論是印刷還是手寫)準確率幾乎達到 100%。

使用計算機視覺的OCR(示例教程),圖2:文字提取過程中的控制台結果

從文字提取過程中獲得的控制台結果

FindMultipleTextRegions 方法

查找多個文本區域方法類似於 FindTextRegion 方法,但當圖片中有多個文字區域時使用。 它返回一個 CropRectangle 對象的列表,這些對象定義了每個文本區域的位置。 當您想從包含多個文字區段的圖像中提取文字時,這個方法非常有用。

using IronOcr;

var ocr = new IronTesseract();
using (var input = new OcrInput("test.jpg"))
{
    input.FindMultipleTextRegions(Scale: 2.0, DilationAmount: -1, Binarize: true, Invert: false);
    OcrResult result = ocr.Read(input);
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
using IronOcr;

var ocr = new IronTesseract();
using (var input = new OcrInput("test.jpg"))
{
    input.FindMultipleTextRegions(Scale: 2.0, DilationAmount: -1, Binarize: true, Invert: false);
    OcrResult result = ocr.Read(input);
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
Imports IronOcr

Private ocr = New IronTesseract()
Using input = New OcrInput("test.jpg")
	input.FindMultipleTextRegions(Scale:= 2.0, DilationAmount:= -1, Binarize:= True, Invert:= False)
	Dim result As OcrResult = ocr.Read(input)
	Dim resultText As String = result.Text
	Console.WriteLine(resultText)
End Using
VB   C#

上面提供的程式碼片段是如何使用IronOCR庫對圖像文件進行光學字符識別(OCR)的範例。它首先導入IronOCR庫並創建一個新实例IronTesseract類別。 然後,它初始化一個OcrInput將輸入影像檔案路徑的物件應用一些影像校正的前處理技術使用 FindMultipleTextRegions 方法。

之後,它會呼叫讀取IronTesseract 對象的方法,執行預處理圖像的 OCR 並返回一個OcrResult物件。 從 OcrResult 對象提取的文本然後被儲存到一個字串變數中,並輸出到控制台。

IronOCR 的輸出

IronOCR 的輸出非常精確,即使在處理具有多種字體、大小和文本樣式的複雜圖像時也是如此。

當從影像中提取數據時,OCR 的準確性至關重要,因為提取的文本通常用於進一步處理,例如數據分析、手動數據輸入、機器學習或自然語言處理。 如果提取的文本包含錯誤,可能會導致後續出現問題。 此外,IronOCR允許對結果對象進行調查以便檢查信心水平.

OCR電腦視覺的使用案例

光學字符識別(光學字符識別)科技已徹底改變了處理印刷和手寫文本的方式。 OCR 工具已成為文件處理和數據提取中不可或缺的一部分。 以下是光學字符識別軟體的一些用例:

OCR 牌照識別

車牌識別在自動化交通管理、停車系統和執法活動中發揮重要作用。 透過在 C# 中實現 OCR 電腦視覺,開發者可以創建應用程式,快速且準確地從影像或即時視頻流中識別車牌。 此技術可用於:

  • 監控交通違規並識別涉及犯罪活動的車輛。
  • 自動化停車系統,便利進出管理並簡化計費流程。
  • 透過追蹤和監控車輛在限制區域的移動來增強安全措施。

從發票中提取文本

在 C# 中的 OCR 計算機視覺可用於開發自動化的 OCR 應用程式。從發票中提取文本和其他財務文件。 此過程可以大幅減少手動資料輸入錯誤並簡化會計任務。 主要優勢包括:

  • 透過自動化數據輸入流程提高生產力。
  • 提高精確度,因為光學字元辨識(OCR)減少了人為錯誤的可能性。
  • 與會計軟體和系統無縫整合,以實現高效的資料管理。

OCR字幕生成

為影片創建字幕可能既耗時又費力。在 C# 中使用 OCR 計算機視覺可以自動化此過程,從而簡化此流程。檢測並轉錄螢幕上的文本,使開發人員能夠:

  • 為電影、電視節目和線上視頻製作準確的字幕。
  • 提高對聽力障礙者或使用不同語言者的可及性。
  • 通過為視頻平台提供可搜尋、可編索引的內容來提升 SEO 效果。

OCR PDF 處理

PDF 廣泛用於共享和存儲文件,但從中提取文本可能很有挑戰性。 C# 中的 OCR 電腦視覺可以協助開發者建立 OCR 應用程式,輕鬆處理 PDF 文件並提取其內容,促進:

數字化印刷文字

OCR 軟體被廣泛用於從文件圖像中數位化印刷文本. OCR 工具可以從掃描的數位文件中提取文本,PDFs,和多種格式的圖像. 這在文件管理中特別有用,您可以輕鬆搜索、存儲和共享基於文本的文件。

提取手寫文本

OCR技術已經發展到可以...識別手寫文字具有高準確性。 這在醫療保健等領域特別有用,因為醫療記錄通常包含手寫筆記。 OCR 工具可以從醫療記錄、處方標籤和其他手寫文件中提取手寫文本。

資料提取

OCR 技術被廣泛用於從輸入數據中提取資料,例如發票、收據和表格。 OCR模型可以識別和提取關鍵數據欄位,如姓名、地址、日期和金額。 這樣可以消除手動數據輸入的需求並減少數據處理中的錯誤。

圖片搜索

OCR 技術也用於圖片搜尋,可以根據圖片中所包含的文字來搜尋圖片。 這對於大型圖像庫特別有用,因為手動搜尋會非常耗時。

翻譯

OCR 軟體可以用來從文件中提取文本,並將其翻譯成其他語言。 這對於國際企業特別有用,因為文件需要快速且準確地翻譯。

摘要

光學字元識別(光學字符識別)是一種使電腦能夠從圖像中讀取文字的技術。 光學字符識別(OCR)及電腦視覺的重要性在於,它使機器能夠理解和解釋視覺世界,這對於自動駕駛汽車、機器人技術和自動化文件處理等應用至關重要。

IronOCR 是一個強大的 OCR 引擎,可以使用計算機視覺來準確識別文本並從圖像中執行文本提取。 它提供了一系列用於查找和提取文字區域的方法,包括FindTextRegionFindMultipleTextRegionsGetTextRegions。 每個方法都有自己的一組參數,可以用來微調 OCR 過程並提供高 OCR 準確性。

使用IronOCR,您可以快速且準確地從輸入圖像中提取掃描的文本。並發性自訂配置,在處理大量輸入影像資料時,可以節省您的時間和精力。 無論您處理的是掃描的文件、照片還是截圖,IronOCR都能幫助您擷取其中的文字。

IronOCR 提供免費試用給想在購買前測試軟體的用戶。 這IronOCR 授權從 $749 開始,包括一年支援和更新。 IronOCR 具有強大的功能和合理的價格,是尋找可靠 OCR 解決方案且具備高精確度的理想選擇。

< 上一頁
OCR 收據數據提取(逐步教程)
下一個 >
如何在C#中進行駕照的OCR

準備開始了嗎? 版本: 2024.11 剛剛發布

免費 NuGet 下載 總下載次數: 2,698,613 查看許可證 >