白皮書

使用機器學習軟體從圖像中提取文本

已更新 2023年2月28日
技術
分享:

使用機器學習從捕獲的文本圖像或掃描的文件中提取文本是計算機視覺和自然語言處理交叉領域的一個新興領域。這項技術利用先進的機器學習、物體識別算法、高級圖形軟件、深層和暗網以及神經網絡架構來準確識別和提取圖像和掃描紙質文件中的文本信息,範圍從手寫筆記和印刷文本到不同背景中的複雜排版。通過使用各種機器學習技術,如光學字符識別 (光學字符識別) 並使用深度學習,實現自動且高效地將視覺場景中的文字檢測轉換為可編輯和可搜索的結構化數據,並進行物體檢測。

在這個不斷發展的領域中,研究人員和從業者不斷努力提高準確性、速度和靈活性,使從圖像中檢測和提取文本、機器可讀數據和掃描文件成為應用程序中的核心組成部分,如打印文件數字化、內容索引、翻譯和無障礙性增強。

在本文中,我們將討論如何使用 IronOCR, 一個由強大的機器學習演算法和文本相關功能驅動的OCR庫。文本提取,也稱為關鍵字提取,基於機器學習自動掃描並從非結構化數據或公司的中央數據庫中提取相關或基本詞彙和短語。

如何使用機器學習從圖像中提取文本?

  1. 下載用於從圖像中提取文本的 C# 庫。

  2. 通過實例化 OcrInput 對象來加載特定圖像以進行場景文本識別。

  3. 使用 ocrTesseract.Read 方法從圖像中提取數據。

  4. 使用 Console.WriteLine 方法在控制台中打印提取的文本。

  5. 使用 CropRectangle 對象對圖像的區域進行光學字符識別。

IronOCR - 光學字符識別(光學字符識別) 圖書館

IronOCR,突出且先進的光學字符識別 (光學字符識別) 軟件,處於從圖像和文檔中提取文字技術的前沿。由 Iron Software 開發,這一強大的 OCR 引擎旨在準確且高效地將掃描的圖像、PDF 或甚至是文本的照片轉換成可編輯和可搜索的數字內容。通過巧妙地使用機器學習算法和神經網絡,IronOCR 為各種應用提供了強大的解決方案,包括數據提取、內容索引和需要精確文字識別的自動化過程。

其處理多種語言和多樣字體的能力,使其成為開發人員和企業在其軟件和應用程序中,尋求精簡的文字識別算法提取功能的多用途工具。您可以使用 IronOCR 自動掃描文本,使用一種常見的文本識別技術,通過文本提取算法將非結構化數據轉換為完美掃描頁面。

安裝 IronOCR

IronOCR 可以使用 NuGet 套件管理器安裝,以下是安裝 IronOCR 的步驟。

  1. 首先建立一個新的 C# Visual Studio 專案或開啟現有的專案。

Visual Studio

  1. 一旦專案建立後,前往頂部選單中的工具,選擇 NuGet 套件管理員,然後選擇解決方案的 NuGet 套件管理員。

工具選單

  1. 一個新視窗將會出現在螢幕上。前往瀏覽標籤頁,在搜尋框中輸入 IronOCR。

  2. IronOCR 套件列表將會出現,選擇最新的一個並點擊安裝。

IronOCR

  1. 根據您的網速,可能需要幾秒鐘,之後 IronOCR 即可在您的 C# 項目中使用。

從圖像到可編輯和可搜索數據的文字檢測

使用 IronOCR,您可以輕鬆使用圖像處理技術和機器學習來提取文本。在本節中,我們將討論如何使用 IronOCR 從圖像中提取文本。

using IronOcr;
using System;

var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput(@"images\image.png"))
{
    var ocrResult = ocrTesseract.Read(ocrInput);
    Console.WriteLine(ocrResult.Text);
}
using IronOcr;
using System;

var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput(@"images\image.png"))
{
    var ocrResult = ocrTesseract.Read(ocrInput);
    Console.WriteLine(ocrResult.Text);
}
Imports IronOcr
Imports System

Private ocrTesseract = New IronTesseract()
Using ocrInput As New OcrInput("images\image.png")
	Dim ocrResult = ocrTesseract.Read(ocrInput)
	Console.WriteLine(ocrResult.Text)
End Using
VB   C#

這段 C# 代碼展示了 IronOCR 的使用,一個用於光學字符識別的庫 (光學字符識別). 以下是逐步說明:

  1. 導入庫
使用 IronOcr;

使用 System;

程式碼首先匯入必要的庫,包括提供 OCR 功能的 **IronOcr** 和用於一般功能的 **System** 命名空間。

2. **初始化 IronTesseract 並加載圖像**:```

var ocrTesseract = new IronTesseract();

這行程式碼創建了一個 IronTesseract 的實例,它是由 IronOCR 提供的 OCR 引擎。


```cs
using (var ocrInput = new OcrInput(@"images\image.png"))

一個 OcrInput 物件是用要處理的影像路徑實例化的。在這個例子中,影像文件位於 "images" 目錄中的 "image.png"。

  1. 執行 OCR 並提取文字:
var ocrResult = ocrTesseract.Read
```(OCR輸入);

這行調用了 IronTesseract 實例的 Read 方法,傳入 OcrInput 對象。此方法對提供的圖像執行光學字符識別並提取文本。

  1. 顯示提取的文本
Console.WriteLine
```(ocrResult.Text);

最後,提取的文字將使用 Console.WriteLine 打印到控制台上,顯示從圖像中取得的 OCR 結果。

這段代碼片段使用 IronOCR 對指定圖像進行文字識別並將提取的文字輸出到控制台。


### 輸入圖像

![發票](/static-assets/ironsoftware/white-papers/text-extraction-from-image-using-machine-learning/text-extraction-from-image-using-machine-learning-4.webp)

### 輸出

![客戶發票輸出](/static-assets/ironsoftware/white-papers/text-extraction-from-image-using-machine-learning/text-extraction-from-image-using-machine-learning-5.webp)

### 在圖像的指定區域執行 OCR

您也可以使用 IronOCR 在圖像的特定區域執行 OCR,以下是程式碼範例。

```csharp
使用 IronOcr;

使用 IronSoftware.Drawing;

使用 System;

var ocrTesseract = new IronTesseract;
```();

使用 (var ocrInput = new OcrInput())

{

    var ContentArea = new CropRectangle(x: 20, y: 20, 寬度: 400, 高度: 50);

ocrInput.AddImage(“r3.png”,ContentArea);

    var ocrResult = ocrTesseract.Read(OCR輸入); 

    Console.WriteLine(ocrResult.Text);

}

這段 C# 代碼使用 IronOCR 庫進行光學字符識別 (光學字符識別). 它首先匯入必要的庫,包括 IronOCR 和 System。創建了一個 IronTesseract 實例,即 OCR 引擎。代碼使用 CropRectangle 設置要處理的影像中的特定內容區域,重點關注定義的區域。影像 ("r3.png") 在指定區域內的內容會被加入進行 OCR 處理。OCR 引擎會讀取指定的內容區域,提取文本,然後將結果文本使用 Console.WriteLine 打印到控制台。

輸出

輸出

結論

通過機器學習(特別是採用光學字符識別)從圖像中提取文本 (光學字符識別) 像IronOCR這樣的庫,象徵著在計算機視覺和自然語言處理交叉點上一次變革性的進步。這項技術由先進的機器學習算法和神經網絡提供動力,能夠準確辨識和提取各種圖像中的文字,包括手寫體、印刷體和複雜的排版。OCR技術和深度學習技術在高效地將視覺文本轉換為可編輯和可搜索的數據方面發揮著關鍵作用,服務於文件數字化、內容索引和可訪問性增強等重要目的。

IronOCR作為一個突出的OCR庫,體現了這種融合的潛力,在多種語言和字體樣式中精確地將掃描圖像和PDF轉換為數字、可編輯的內容。它無縫集成到C#等編程語言中,允許高效實現文本從圖像中的提取,進一步加強了在多種應用和領域中的變革性影響。

了解更多有關 IronOCR 及所有相關功能,請訪問此連結 這裡. 提取圖像中文字的完整教程請參閱以下內容 連結. 您可以從這裡購買 IronOCR 授權 連結.

< 上一頁
人壽保險理賠處理軟體
下一個 >
活動票券列印軟體

取得您的 免費白皮書

謝謝,

帶有下載鏈接的電子郵件將很快發送給您。