白皮書

使用機器學習軟體從圖像中提取文本

2023年2月28日
技術
分享:

使用機器學習從捕獲或掃描的文本圖像中提取文字是一個新興領域,位於計算機視覺與自然語言處理的交叉點。 這項技術利用先進的機器學習、物體識別算法、先進的圖形軟體、深層和暗網,以及神經網絡架構,以精確識別並提取影像和掃描紙質文件中的文字信息。 透過使用各種機器學習技術,如光學字符識別(OCR)和深度學習,它能夠自動且高效地將視覺場景文本檢測轉換為可編輯和可搜索的結構化資料,以及物件檢測。

在這個不斷變化的領域中,研究人員和實踐者不斷努力提高準確性、速度和多功能性,使得從圖像、機器可讀數據和掃描文檔中檢測和提取文本成為印刷文件數字化、內容索引、翻譯和無障礙增強等應用程序中的一個關鍵組件。

在本文中,我們將討論如何使用IronOCR這個由強大的機器學習算法和文字相關功能驅動的OCR庫來從圖片中提取文字。 文字擷取,也稱為關鍵字擷取,是基於機器學習自動掃描並從非結構化資料或公司的中央資料庫中提取相關或基本的詞彙和短語。

如何使用機器學習從圖像中提取文字?

  1. 下載用於從圖像中提取文字的C#庫。

  2. 通過實例化OcrInput物件來加載特定圖像以進行場景文字識別。

  3. 使用ocrTesseract.Read方法從圖像中提取數據。

  4. 使用 Console.WriteLine 方法在控制台中打印提取的文本。

  5. 使用CropRectangle物件在圖像的特定區域執行 OCR

IronOCR - 一個OCR(光學字符識別)庫

IronOCR 是一款突出的、先進的光學字符識別(OCR)軟體,處於從圖像和文件中提取文本技術的前沿。 由Iron Software開發的這款強大的OCR引擎旨在精確且高效地將掃描圖像、PDF或甚至是文本照片轉換為可編輯和可搜索的數字內容。 憑藉其對機器學習算法和神經網絡的熟練運用,IronOCR為包括數據提取、內容索引和需要精確文字識別的自動化過程等各種應用提供了強大的解決方案。

它能夠處理多種語言和不同字體,使其成為開發者和企業尋求在其軟體和應用程式中簡化文本識別算法提取功能的多功能工具。 您可以使用IronOCR自動掃描文本,透過使用一種常見的文字識別技術,將無結構數據轉換成使用文字提取算法的完美掃描頁面。

安裝 IronOCR

IronOCR 可以透過 NuGet 套件管理員安裝,以下是安裝 IronOCR 的步驟。

  1. 首先建立一個新的 C# Visual Studio 專案或開啟現有的專案。

    Visual Studio

  2. 建立專案後,請在頂部菜單中選擇“工具”,然後選擇“NuGet 套件管理員”,再選擇解決方案的 NuGet 套件管理員。

    工具選單

  3. 將有一個新視窗出現在螢幕上。 前往瀏覽頁籤並在搜索欄中輸入IronOCR。

  4. 將顯示 IronOCR 套件列表,選擇最新的套件並點擊安裝。

    IronOCR

  5. 幾秒鐘之後,根據您的網路速度,IronOCR即可在您的C#項目中使用。

從圖像中檢測文本以編輯和搜索數據

使用IronOCR,您可以輕鬆地利用影像處理技術和機器學習提取文本。 在本節中,我們將討論如何使用IronOCR從圖片中提取文字。

using IronOcr;
using System;

var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput(@"images\image.png"))
{
    var ocrResult = ocrTesseract.Read(ocrInput);
    Console.WriteLine(ocrResult.Text);
}
using IronOcr;
using System;

var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput(@"images\image.png"))
{
    var ocrResult = ocrTesseract.Read(ocrInput);
    Console.WriteLine(ocrResult.Text);
}
Imports IronOcr
Imports System

Private ocrTesseract = New IronTesseract()
Using ocrInput As New OcrInput("images\image.png")
	Dim ocrResult = ocrTesseract.Read(ocrInput)
	Console.WriteLine(ocrResult.Text)
End Using
$vbLabelText   $csharpLabel

此 C# 程式碼展示了 IronOCR 的使用,這是一個進行光學字符識別(OCR)的程式庫。 以下是逐步解釋:

  1. 匯入函式庫
    using IronOcr; 
    using System;
    using IronOcr; 
    using System;
Imports IronOcr
	Imports System
$vbLabelText   $csharpLabel

程式碼首先匯入必要的庫,包括IronOcr提供的OCR功能,以及提供一般功能的System命名空間。

  1. 初始化 IronTesseract 並載入圖像
    var ocrTesseract = new IronTesseract();
    var ocrTesseract = new IronTesseract();
IRON VB CONVERTER ERROR developers@ironsoftware.com
$vbLabelText   $csharpLabel

此行創建了一個IronTesseract實例,這是由IronOCR提供的OCR引擎。

    using (var ocrInput = new OcrInput(@"images\image.png"))
    using (var ocrInput = new OcrInput(@"images\image.png"))
Using ocrInput As New OcrInput("images\image.png")
$vbLabelText   $csharpLabel

使用要處理的圖像路徑來實例化一個 OcrInput 對象。 在這個案例中,圖像文件名為 "image.png",位於 "images" 目錄中。

  1. 執行 OCR 並提取文字
    var ocrResult = ocrTesseract.Read(ocrInput);
    var ocrResult = ocrTesseract.Read(ocrInput);
IRON VB CONVERTER ERROR developers@ironsoftware.com
$vbLabelText   $csharpLabel

這行代碼調用 IronTesseract 實例的 Read 方法,傳入 OcrInput 物件。 此方法對提供的圖像執行OCR並提取文字。

  1. 顯示提取的文本
    Console.WriteLine(ocrResult.Text);
    Console.WriteLine(ocrResult.Text);
Console.WriteLine(ocrResult.Text)
$vbLabelText   $csharpLabel

最後,提取的文字使用Console.WriteLine打印到控制台,顯示從圖像中獲得的OCR結果。

此代碼段使用 IronOCR 來對指定圖像進行文字識別的 OCR,並將提取的文字輸出到控制台。

輸入圖像

發票

輸出

客戶發票輸出

在圖片上指定區域執行OCR

您也可以使用IronOCR在圖片的特定區域執行OCR,這裡有一個程式碼範例。

using IronOcr;
using IronSoftware.Drawing;
using System;
var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput())
{
    var ContentArea = new CropRectangle(x: 20, y: 20, width: 400, height: 50);
    ocrInput.AddImage("r3.png", ContentArea);
    var ocrResult = ocrTesseract.Read(ocrInput);
    Console.WriteLine(ocrResult.Text);
}
using IronOcr;
using IronSoftware.Drawing;
using System;
var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput())
{
    var ContentArea = new CropRectangle(x: 20, y: 20, width: 400, height: 50);
    ocrInput.AddImage("r3.png", ContentArea);
    var ocrResult = ocrTesseract.Read(ocrInput);
    Console.WriteLine(ocrResult.Text);
}
Imports IronOcr
Imports IronSoftware.Drawing
Imports System
Private ocrTesseract = New IronTesseract()
Using ocrInput As New OcrInput()
	Dim ContentArea = New CropRectangle(x:= 20, y:= 20, width:= 400, height:= 50)
	ocrInput.AddImage("r3.png", ContentArea)
	Dim ocrResult = ocrTesseract.Read(ocrInput)
	Console.WriteLine(ocrResult.Text)
End Using
$vbLabelText   $csharpLabel

此 C# 程式碼利用 IronOCR 函式庫進行光學字元識別 (OCR)。 首先導入必要的庫,包括IronOCR和System。 建立了一個 IronTesseract 實例,即 OCR 引擎。 程式碼使用 CropRectangle 設定圖像中一個特定的 ContentArea 進行處理,專注於一個定義的區域。 然後將該指定區域內的圖像 ("r3.png") 添加進行 OCR 處理。 OCR 引擎讀取指定的內容區域,提取文本,然後使用 Console.WriteLine 將結果文本打印到控制台。

輸出

輸出

結論

通過機器學習從圖像中提取文本,特別是使用像 IronOCR 這樣的光學字符識別(OCR)庫,標誌著在計算機視覺和自然語言處理交叉領域的一項變革性進步。 OCR 技術和深度學習技術在高效地將視覺文字轉換成可編輯和可檢索的數據方面扮演著關鍵角色,用於文件數位化、內容索引和提高可訪問性等重要用途。

IronOCR 作為一個突出的 OCR 函式庫,展示了這種融合的潛力,在將掃描圖像和 PDF 檔案精確轉換成多語言和多字體風格的數位可編輯內容方面表現出色。 其無縫整合到像C#這樣的程式語言中,使得實現更為流暢,進一步放大了在眾多應用和領域中從圖像中提取文字的轉變影響。

欲了解更多有關IronOCR及所有相關功能,請點擊此鏈接這裡。 有關從圖像中提取文本的完整教程,請訪問以下連結。 IronOCR 授權可以從這個鏈接購買。

< 上一頁
人壽保險理賠處理軟體
下一個 >
活動票券列印軟體

獲取您的免費白皮書

謝謝,

帶有下載鏈接的電子郵件將很快發送給您。