使用 IRONOCR

使用計算機視覺進行OCR(範例教程)

已更新 2024年1月28日
分享:

光學字符識別 (光學字符識別) 是一種技術,能夠讓機器從影像中讀取和解釋文字,使數據處理和自動化更快、更有效率。本文提供了使用IronOCR庫進行OCR計算機視覺的指導,並說明它如何能夠增強文字識別,自動化這個過程。

為什麼 OCR 很重要?

光學字符識別與電腦視覺 是一種先進的光學字符識別技術 (光學字符識別) 利用人工智慧和機器學習算法的強大功能,更準確和高效地從圖像中識別文字字符。

計算機視覺圖像處理算法使OCR系統能夠理解圖像中文本的上下文和佈局,並根據其形狀和結構識別字符。OCR結合計算機視覺,可以從具有多種字體、樣式和大小的複雜圖像中提取文本,使其成為文件數位化、資料提取和自動化的重要工具。

IronOCR:C# OCR 库

IronOCR 是一個受歡迎的OCR庫,使用計算機視覺技術從圖片和文件中提取文字。它易於使用,並與多種編程語言(包括C#和VB.NET)集成。IronOCR 有內部部署和雲端版本,並提供處理和提取圖片中文字的多種功能。

安裝 IronOCR

要安裝 IronOCR,請在 NuGet 套件管理員控制台中使用以下命令:

:ProductInstall

使用 IronOCR 的 OCR 系統

以下圖片用於測試 具有計算機視覺的OCR系統 使用 IronOCR。

使用電腦視覺的光學字符識別 (範例教程),圖 1:用於 OCR 檢測的影像樣本

用於 OCR 檢測的圖片範例

找到文字區域

尋找文字區域 該方法用於識別圖像中的單個文本區域。該方法接受幾個可選參數,包括 ScaleDilationAmountBinarizeInvertScale 調整圖像的大小,DilationAmount 增加文本的厚度,Binarize 將圖像轉換為黑白,Invert 則反轉圖像的顏色。

using IronOcr;
using System;

var ocr = new IronTesseract();
using (var inputOCR = new OcrInput("test.jpg")) 
{
    inputOCR.FindTextRegion();
    OcrResult result = ocr.Read(input);
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
using IronOcr;
using System;

var ocr = new IronTesseract();
using (var inputOCR = new OcrInput("test.jpg")) 
{
    inputOCR.FindTextRegion();
    OcrResult result = ocr.Read(input);
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
Imports IronOcr
Imports System

Private ocr = New IronTesseract()
Using inputOCR = New OcrInput("test.jpg")
	inputOCR.FindTextRegion()
	Dim result As OcrResult = ocr.Read(input)
	Dim resultText As String = result.Text
	Console.WriteLine(resultText)
End Using
VB   C#

在執行程式碼之後,您將看到它透過機器學習過程從文字區域中提取文字。輸出結果會以幾乎 100% 的文本識別精確度顯示在控制台中。IronOCR 的準確率對於每種形式的文字(無論是印刷文字還是手寫文字)都幾乎達到 100%。

使用計算機視覺的OCR(示例教程),圖2:文字提取過程中的控制台結果

從文本提取過程中獲得的控制台結果

FindMultipleTextRegions 方法

查找多個文本區域 方法類似於 FindTextRegion 方法,但用於圖片中有多個文字區域時。它會返回一個 CropRectangle 物件的列表,用以定義每個文字區域的位置。這個方法在您想從包含多個文字區域的圖片中提取文字時非常有用。

using IronOcr;

var ocr = new IronTesseract();
using (var input = new OcrInput("test.jpg"))
{
    input.FindMultipleTextRegions(Scale: 2.0, DilationAmount: -1, Binarize: true, Invert: false);
    OcrResult result = ocr.Read(input);
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
using IronOcr;

var ocr = new IronTesseract();
using (var input = new OcrInput("test.jpg"))
{
    input.FindMultipleTextRegions(Scale: 2.0, DilationAmount: -1, Binarize: true, Invert: false);
    OcrResult result = ocr.Read(input);
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
Imports IronOcr

Private ocr = New IronTesseract()
Using input = New OcrInput("test.jpg")
	input.FindMultipleTextRegions(Scale:= 2.0, DilationAmount:= -1, Binarize:= True, Invert:= False)
	Dim result As OcrResult = ocr.Read(input)
	Dim resultText As String = result.Text
	Console.WriteLine(resultText)
End Using
VB   C#

上面提供的程式碼片段是如何使用IronOCR庫對圖像文件進行光學字符識別(OCR)的範例。它首先導入IronOCR庫並創建一個新实例 IronTesseract 類別。然後,初始化一個 OcrInput 將輸入影像檔案路徑的物件應用 一些影像校正的前處理技術 使用 FindMultipleTextRegions 方法。

之後,它呼叫 讀取 IronTesseract 對象的方法,執行預處理圖像的 OCR 並返回一個 OcrResult 物件。然後,從 OcrResult 物件中提取的文本被存儲在字串變數中,並打印到控制台。

IronOCR 的輸出

IronOCR 的輸出非常準確,即使面對包含多種字體、大小和風格的複雜圖像。

從圖像中提取數據時,OCR 準確性至關重要,因為提取的文字經常用於進一步處理,比如數據分析、手動數據輸入、機器學習或自然語言處理。如果提取的文字包含錯誤,可能會導致後續的問題。此外,IronOCR 還允許對結果對象進行調查,以進一步...... 檢查信心水平.

OCR計算機視覺的使用案例

光學字符識別 (光學字符識別) 技術已經徹底改變了處理印刷和手寫文字的方式。OCR 工具已成為文件處理和數據提取中不可或缺的一部分。以下是光學字符識別軟體的一些使用案例:

OCR 車牌識別

車牌識別 在交通管理、停車系統和執法活動的自動化中發揮著重要作用。通過在 C# 中實施 OCR 計算機視覺,開發人員可以創建能夠快速、準確地從圖像或實時視頻中識別車牌的應用程序。此技術可用於:

  • 監控交通違規並識別涉及犯罪活動的車輛。
  • 自動化停車系統,便利進出管理並簡化計費過程。
  • 透過追蹤和監控限制區域內的車輛移動,提升安全措施。

從發票中提取文字

在 C# 中的 OCR 電腦視覺可以用來開發自動化的 OCR 應用程式 從發票中提取文本 和其他財務文件。此過程可以顯著減少手動數據輸入錯誤並簡化會計任務。主要優勢包括:

  • 通過自動化數據輸入過程提高生產力。
  • 改善準確性,因為OCR減少了人工錯誤的可能性。
  • 與會計軟件和系統無縫集成以高效管理數據。

OCR 字幕生成

創建影片字幕可能既費時又勞累。C#中的OCR電腦視覺可以通過自動化過程來簡化此過程。 檢測並轉錄螢幕上的文本, 使開發者能夠:

  • 為電影、電視節目和在線視頻創建精確的字幕。
  • 提高聽障人士或說不同語言人士的可訪問性。
  • 通過為視頻平台提供可搜索、可索引的內容來提升SEO效果。

OCR PDF處理

PDF廣泛用於共享和存儲文件,但從中提取文字可能會很具挑戰性。C#中的OCR計算機視覺技術可以幫助開發人員構建OCR應用程式,輕鬆處理PDF文件並 提取其內容,促進:

將印刷文字數位化

OCR 軟體被廣泛應用於 從文件圖像中數位化印刷文本OCR工具可以從掃描的數位文件中提取文本, PDFs,和 多種格式的圖像這在文件管理方面特別有用,您可以輕鬆搜尋、儲存和共享以文本為基礎的文件。

提取手寫文字

OCR技術已經發展到可以 識別手寫文字 高準確度。這在醫療等領域特別有用,因為醫療記錄中經常包含手寫筆記。OCR 工具可以從醫療記錄、處方標籤和其他手寫文件中提取手寫文字。

數據提取

光學字符識別(OCR)技術廣泛應用於從發票、收據和表單等輸入數據中提取數據。OCR 模型可以識別並提取關鍵數據字段,如姓名、地址、日期和金額。這消除了手動輸入數據的需求,並減少了數據處理中的錯誤。

圖像搜索

OCR技術也用於圖像搜索,這樣你可以根據圖像中包含的文本進行搜索。這對於需要手工搜索的大型圖像庫特別有用,因為手工搜索會非常耗時。

翻譯

光學字符識別軟體可用於從一種語言的文件中提取文本,並將其翻譯成另一種語言。這對於需要快速且準確地翻譯文件的國際業務特別有用。

摘要

光学字符识别 (光學字符識別) 是一項使計算機可以從圖像中讀取文字的技術。OCR(光學字符識別)與計算機視覺一樣重要,因為它允許機器理解和解釋視覺世界,這對於自駕車、機器人和自動化文檔處理等應用至關重要。

IronOCR是一個強大的OCR引擎,可以與計算機視覺一起應用來準確識別文本並從圖像中提取文本。它提供了一系列用於查找和提取文本區域的方法,包括 FindTextRegionFindMultipleTextRegionsGetTextRegions。每種方法都有其自己的參數集,可用於 微調 OCR 過程 並提供高準確度的OCR。

通過使用IronOCR,您可以快速準確地從輸入圖像中提取掃描的文本 並發性自訂配置,這可以在處理大量輸入圖片數據時節省您的時間和精力。無論您是在處理掃描文件、照片還是截圖,IronOCR 都能幫助您提取其中包含的文字。

IronOCR 提供 免費試用 供用戶在做出購買決定之前測試軟體。 IronOCR 授權 $749起提供,並包含一年的支持和更新。憑藉其強大的功能和合理的定價,IronOCR 是任何尋找可靠的 OCR 解決方案並具有高 OCR 精準度的人的絕佳選擇。

< 上一頁
OCR 收據數據提取(逐步教程)
下一個 >
如何在C#中進行駕照的OCR

準備開始了嗎? 版本: 2024.10 剛剛發布

免費 NuGet 下載 總下載次數: 2,433,305 查看許可證 >