使用機器學習軟體從圖像中提取文本
使用機器學習從捕獲或掃描的文本圖像中提取文字是一個新興領域,位於計算機視覺與自然語言處理的交叉點。 這項技術利用先進的機器學習、物件識別演算法、高級圖形軟體、深網與暗網,以及神經網絡架構,精確地識別和提取圖像中的文字資訊,以及從手寫筆記和印刷文字到各種背景下的複雜排版的掃描紙文件。 採用各種機器學習技術,例如光學字符識別(光學字符識別)透過深度學習,它能夠將視覺場景文字檢測自動且高效地轉換為可編輯和可搜索的結構化數據,並進行物體檢測。
在這個不斷變化的領域中,研究人員和實踐者不斷努力提高準確性、速度和多功能性,使得從圖像、機器可讀數據和掃描文檔中檢測和提取文本成為印刷文件數字化、內容索引、翻譯和無障礙增強等應用程序中的一個關鍵組件。
在這篇文章中,我們將討論如何使用IronOCR,一個由強大的機器學習演算法和與文字相關的功能驅動的OCR庫。 文字提取,又稱為關鍵字提取,是基於機器學習自動掃描並從非結構化資料或公司的中央數據庫中提取相關或基本單詞和短語。
如何使用機器學習從圖像中提取文字?
下載用於從圖像中提取文字的C#庫。
實例化 OcrInput 物件以載入特定圖像進行場景文字識別。
使用 ocrTesseract.Read 方法從圖像中提取數據。
使用 Console.WriteLine 方法在控制台中列印提取的文本。
- 使用 CropRectangle 物件對圖像的區域執行 OCR。
IronOCR - 一個OCR(光學字符識別)庫
IronOCR,一個著名且先進的光學字符識別(光學字符識別)軟體,位於從圖像和文件中提取文字技術的最前沿。 由Iron Software開發的這款強大的OCR引擎旨在精確且高效地將掃描圖像、PDF或甚至是文本照片轉換為可編輯和可搜索的數字內容。 憑藉其對機器學習算法和神經網絡的熟練運用,IronOCR為包括數據提取、內容索引和需要精確文字識別的自動化過程等各種應用提供了強大的解決方案。
它能夠處理多種語言和不同字體,使其成為開發者和企業尋求在其軟體和應用程式中簡化文本識別算法提取功能的多功能工具。 您可以使用IronOCR自動掃描文本,透過使用一種常見的文字識別技術,將無結構數據轉換成使用文字提取算法的完美掃描頁面。
安裝 IronOCR
IronOCR 可以透過 NuGet 套件管理員安裝,以下是安裝 IronOCR 的步驟。
首先建立一個新的 C# Visual Studio 專案或開啟現有的專案。
建立專案後,請在頂部菜單中選擇“工具”,然後選擇“NuGet 套件管理員”,再選擇解決方案的 NuGet 套件管理員。
將有一個新視窗出現在螢幕上。 前往瀏覽頁籤並在搜索欄中輸入IronOCR。
將顯示 IronOCR 套件列表,選擇最新的套件並點擊安裝。
- 幾秒鐘之後,根據您的網路速度,IronOCR即可在您的C#項目中使用。
從圖像中檢測文本以編輯和搜索數據
使用IronOCR,您可以輕鬆地利用影像處理技術和機器學習提取文本。 在本節中,我們將討論如何使用IronOCR從圖片中提取文字。
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput(@"images\image.png"))
{
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
}
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput(@"images\image.png"))
{
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
}
Imports IronOcr
Imports System
Private ocrTesseract = New IronTesseract()
Using ocrInput As New OcrInput("images\image.png")
Dim ocrResult = ocrTesseract.Read(ocrInput)
Console.WriteLine(ocrResult.Text)
End Using
這段 C# 代碼展示了 IronOCR 的使用,一個用於光學字符識別的庫(光學字符識別). 以下是逐步解釋:
- 導入庫 請提供內容以進行翻譯。
使用 IronOcr;
using System; 請提供內容以進行翻譯。
代碼首先導入必要的函式庫,包括提供 OCR 功能的 IronOcr 及用於一般功能的 System 命名空間。
- 初始化 IronTesseract 和載入圖片: 請提供內容以進行翻譯。
var ocrTesseract = new IronTesseract(); 請提供內容以進行翻譯。
這行程式碼創建了一個IronTesseract的實例,它是由IronOCR提供的OCR引擎。
using (var ocrInput = new OcrInput(@"images\image.png"))
using (var ocrInput = new OcrInput(@"images\image.png"))
Using ocrInput As New OcrInput("images\image.png")
一個 OcrInput 物件是透過要處理的圖片路徑來實例化的。 在這個案例中,圖像文件名為 "image.png",位於 "images" 目錄中。
- 執行 OCR 和提取文字: 請提供內容以進行翻譯。
var ocrResult = ocrTesseract.Read(OCR輸入); 請提供內容以進行翻譯。
此行調用IronTesseract實例的Read方法,傳入OcrInput對象。 此方法對提供的圖像執行OCR並提取文字。
- 顯示提取的文字: 請提供內容以進行翻譯。
Console.WriteLine(ocrResult.Text); 請提供內容以進行翻譯。
最後,使用 Console.WriteLine 將提取的文字列印到控制台,顯示從圖像獲得的OCR結果。
此代碼段使用 IronOCR 來對指定圖像進行文字識別的 OCR,並將提取的文字輸出到控制台。
輸入圖像
輸出
在圖片上指定區域執行OCR
您也可以使用IronOCR在圖片的特定區域執行OCR,這裡有一個程式碼範例。 請提供內容以進行翻譯。
使用 IronOcr;
使用 IronSoftware.Drawing;
using System;
var ocrTesseract = new IronTesseract();
using(var ocrInput = new OcrInput())
{
var ContentArea = 新 CropRectangle(x: 20, y: 20, 寬度: 400, 高度: 50);
ocrInput.AddImage(“r3.png”,ContentArea);
var ocrResult = ocrTesseract.Read(OCR輸入);
Console.WriteLine(ocrResult.Text);
} 請提供內容以進行翻譯。
此C#代碼利用IronOCR庫進行光學字符識別(光學字符識別). 首先導入必要的庫,包括IronOCR和System。 建立了一個 IronTesseract 實例,即 OCR 引擎。 程式碼使用 CropRectangle 設定圖像中一個特定的 ContentArea 進行處理,專注於一個定義的區域。 請提供完整的句子以供翻譯。("r3.png")在此指定區域內的內容接下來將添加進行OCR處理。 OCR 引擎讀取指定的內容區域,提取文本,然後使用 Console.WriteLine 將結果文本打印到控制台。
輸出
結論
透過機器學習從圖像中提取文字,特別是使用光學字符識別技術。(光學字符識別)像IronOCR這樣的庫在計算機視覺和自然語言處理的交叉路口標誌著一個轉型的步伐。 這項技術由先進的機器學習演算法和神經網絡驅動,能夠精確地譯解和提取來自各種圖像類型的文字,包括手寫、印刷文字和複雜的印刷體。 OCR 技術和深度學習技術在高效地將視覺文字轉換成可編輯和可檢索的數據方面扮演著關鍵角色,用於文件數位化、內容索引和提高可訪問性等重要用途。
IronOCR 作為一個突出的 OCR 函式庫,展示了這種融合的潛力,在將掃描圖像和 PDF 檔案精確轉換成多語言和多字體風格的數位可編輯內容方面表現出色。 其無縫整合到像C#這樣的程式語言中,使得實現更為流暢,進一步放大了在眾多應用和領域中從圖像中提取文字的轉變影響。
要了解更多关于IronOCR及所有相關功能,請訪問此連結這裡. 完整的從圖像中提取文字的教程可以在以下位置找到連結. IronOCR授權可以從這裡購買連結.