使用 IRONOCR

如何在C#中創建OCR軟體示範

發佈 2024年6月6日
分享:

光學字符識別 (光學字符識別) 是一種技術,可以將各種文件格式,包括掃描的紙質文件、PDF、數字文件或用數碼相機拍攝的印刷文字圖像,轉換為可編輯和可檢索的機器編碼文本數據。

IronOCR 是一個出色的OCR引擎庫,為開發人員提供強大的OCR功能。在本文中,我們將探討如何使用IronOCR進行OCR,並提供OCR軟體演示的代碼示例。

什麼是 IronOCR?

IronOCR 是一個強大的 .NET 庫,旨在促進光學字符識別 (光學字符識別) 在 C# 和 VB.NET 應用程式中。憑藉先進的算法和機器學習技術,IronOCR 能夠準確地從掃描的 PDF 文件、圖像和 PDF 中提取文字和內容,從而更容易以編程方式處理、搜索和分析這些文件。

藉由其簡單直觀的 API 和廣泛的功能,開發人員能夠無縫地將 OCR 功能整合到其應用程式中,以自動化數據抽取、文件處理、數據輸入和內容管理任務。無論您正在處理商業發票、報告、自動化數據抽取、可搜索的 PDF 或任何其他文本豐富的文件,IronOCR 都提供了可靠的解決方案,能有效地應對 OCR 需求。

開始使用 IronOCR

在深入了解代碼範例之前,您需要安裝 通過NuGet套件管理器安裝IronOCR. 您可以在套件管理器控制台中運行以下命令來安裝 IronOCR:

Install-Package IronOcr
Install-Package IronOcr
'INSTANT VB TODO TASK: The following line uses invalid syntax:
'Install-Package IronOcr
VB   C#

使用IronOCR進行光學字符識別 (光學字符識別)

基本文本識別

要使用 IronOCR 執行基本的文本識別,可以使用以下代碼片段:

using IronOcr;
using System;
IronTesseract ocrTesseract = new IronTesseract();
using (OcrInput ocrInput = new OcrInput("ocr.png"))
{
    OcrResult ocrResult = ocrTesseract.Read(ocrInput);
    string RecognizedText = ocrResult.Text;
    Console.WriteLine(RecognizedText);
}
using IronOcr;
using System;
IronTesseract ocrTesseract = new IronTesseract();
using (OcrInput ocrInput = new OcrInput("ocr.png"))
{
    OcrResult ocrResult = ocrTesseract.Read(ocrInput);
    string RecognizedText = ocrResult.Text;
    Console.WriteLine(RecognizedText);
}
Imports IronOcr
Imports System
Private ocrTesseract As New IronTesseract()
Using ocrInput As New OcrInput("ocr.png")
	Dim ocrResult As OcrResult = ocrTesseract.Read(ocrInput)
	Dim RecognizedText As String = ocrResult.Text
	Console.WriteLine(RecognizedText)
End Using
VB   C#

此代碼使用 IronOCR 執行光學字符識別 (光學字符識別) 在名為「ocr.png」的圖像檔上。它會初始化一個 IronTesseract 物件,並將圖像檔的文本層讀取到 OcrInput 物件中。

OCR 結果然後被作為 RecognizedText 檢索並打印到控制台。

輸出

    - LOGO 商店
    - 測試文本
    - 測試文本連續
    - 專注於技術
    - 1 測試文本 $3.20
    - 2 手續費 $9.50
    - 3 加工費 $5.90
    - 4 優惠 $6.00
    - 5 申請費 $9.00
    - 6 管理費 $0.50
    - 7 服務費 $7.60
    - 8 總費用 $810
    - 總金額 $49.80
    - 現金 $50.00

    - LOGO 商店
    - 測試文本
    - 測試文本連續
    - 專注於技術
    - 1 測試文本 $3.20
    - 2 手續費 $9.50
    - 3 加工費 $5.90
    - 4 優惠 $6.00
    - 5 申請費 $9.00
    - 6 管理費 $0.50
    - 7 服務費 $7.60
    - 8 總費用 $810
    - 總金額 $49.80
    - 現金 $50.00
'INSTANT VB TODO TASK: The following line uses invalid syntax:
'- LOGO 商店 - 測試文本 - 測試文本連續 - 專注於技術 - 1 測試文本 $3.20 - 2 手續費 $9.50 - 3 加工費 $5.90 - 4 優惠 $6.00 - 5 申請費 $9.00 - 6 管理費 $0.50 - 7 服務費 $7.60 - 8 總費用 $810 - 總金額 $49.80 - 現金 $50.00
VB   C#

請提供內容以進行翻譯。

進階 OCR 選項

IronOCR 提供了各種選項,使您能夠根據您的圖像文件和需求自訂 OCR 過程。例如,您可以指定 OCR 語言、調整圖像預處理設置或啟用文本清理。以下是一個展示這些進階選項的範例:

using IronOcr;
class Program
{
    static void Main()
    {
        var ocr = new IronTesseract();
        using var ocrInput = new OcrInput();
    ocrInput.LoadImage(@"images\image.png");
        // Set OCR language to English
        ocr.Language = OcrLanguage.English;
        // Enable text cleaning
        ocrInput.DeNoise();
    ocrInput.EnhanceResolution(225);
        var result = ocr.Read(ocrInput);
        if (result != null && result.Text != null)
        {
            Console.WriteLine($"Recognized Text: {result.Text}");
        }
    }
}
using IronOcr;
class Program
{
    static void Main()
    {
        var ocr = new IronTesseract();
        using var ocrInput = new OcrInput();
    ocrInput.LoadImage(@"images\image.png");
        // Set OCR language to English
        ocr.Language = OcrLanguage.English;
        // Enable text cleaning
        ocrInput.DeNoise();
    ocrInput.EnhanceResolution(225);
        var result = ocr.Read(ocrInput);
        if (result != null && result.Text != null)
        {
            Console.WriteLine($"Recognized Text: {result.Text}");
        }
    }
}
Imports IronOcr
Friend Class Program
	Shared Sub Main()
		Dim ocr = New IronTesseract()
		Dim ocrInput As New OcrInput()
	ocrInput.LoadImage("images\image.png")
		' Set OCR language to English
		ocr.Language = OcrLanguage.English
		' Enable text cleaning
		ocrInput.DeNoise()
	ocrInput.EnhanceResolution(225)
		Dim result = ocr.Read(ocrInput)
		If result IsNot Nothing AndAlso result.Text IsNot Nothing Then
			Console.WriteLine($"Recognized Text: {result.Text}")
		End If
	End Sub
End Class
VB   C#

該代碼使用IronOCR在「images」資料夾中的圖像檔「image.png」上執行OCR。它將OCR的語言設置為英文,清除圖像噪音並提高其解析度。從圖像中識別的文本被提取出來,然後打印到控制台。

如何在 C# 中創建 OCR 軟件示範:圖 1

條碼讀取

IronOCR 也支持條碼讀取,允許您製作軟體以從圖片中提取條碼信息。以下是一個展示如何使用 IronOCR 讀取條碼的代碼示例:

using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
ocrTesseract.Configuration.ReadBarCodes = true;
using var ocrInput = new OcrInput();
ocrInput.LoadImage(@"images\imageWithBarcode.png");
var ocrResult = ocrTesseract.Read(ocrInput);
foreach (var barcode in ocrResult.Barcodes)
{
    Console.WriteLine(barcode.Value);
}
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
ocrTesseract.Configuration.ReadBarCodes = true;
using var ocrInput = new OcrInput();
ocrInput.LoadImage(@"images\imageWithBarcode.png");
var ocrResult = ocrTesseract.Read(ocrInput);
foreach (var barcode in ocrResult.Barcodes)
{
    Console.WriteLine(barcode.Value);
}
Imports IronOcr
Imports System
Private ocrTesseract = New IronTesseract()
ocrTesseract.Configuration.ReadBarCodes = True
Dim ocrInput As New OcrInput()
ocrInput.LoadImage("images\imageWithBarcode.png")
Dim ocrResult = ocrTesseract.Read(ocrInput)
For Each barcode In ocrResult.Barcodes
	Console.WriteLine(barcode.Value)
Next barcode
VB   C#

代碼使用 IronOCR 檢測並從 "images" 資料夾中的圖像文件 "imageWithBarcode.png" 讀取條形碼。它通過將 ReadBarCodes 設置為 true 來配置 IronOCR 以啟用條形碼讀取。檢測到的條形碼值隨後打印到控制台。

如何在 C# 中創建 OCR 軟體示範:圖 2

PDF 文字提取

IronOCR 也可以從 PDF 和掃描文件中提取文字。以下是一個用 IronOCR 從 PDF 文件提取文字的代碼示例:

using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
// OCR entire document
ocrInput.LoadPdf("Email_Report.pdf");
int[] pages = { 1, 2, 3, 4, 5 };
// Alternatively OCR selected page numbers
ocrInput.LoadPdfPages("example.pdf", pages, Password: "password");
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
// OCR entire document
ocrInput.LoadPdf("Email_Report.pdf");
int[] pages = { 1, 2, 3, 4, 5 };
// Alternatively OCR selected page numbers
ocrInput.LoadPdfPages("example.pdf", pages, Password: "password");
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
Imports IronOcr
Imports System
Private ocrTesseract = New IronTesseract()
Private ocrInput = New OcrInput()
' OCR entire document
ocrInput.LoadPdf("Email_Report.pdf")
Dim pages() As Integer = { 1, 2, 3, 4, 5 }
' Alternatively OCR selected page numbers
ocrInput.LoadPdfPages("example.pdf", pages, Password:= "password")
Dim ocrResult = ocrTesseract.Read(ocrInput)
Console.WriteLine(ocrResult.Text)
VB   C#

該代碼使用 IronOCR 對名為 "Email_Report.pdf" 的 PDF 文件進行 OCR 處理。它可以使用 LoadPdf 對整個文件進行 OCR,或使用 LoadPdfPages 和密碼從 "example.pdf" 中獲取的特定頁面。從 OCR 操作中識別的文字將打印到控制台。

如何在C#中创建OCR软件演示:图3

結論

IronOCR 是功能強大的 .NET 庫,提供先進的OCR軟件功能,讓開發人員在應用程式中輕鬆執行OCR任務。在本文中,我們探討了如何使用IronOCR進行基本和高級的OCR軟件演示,並提供了一些代碼示例。

無論您需要識別手寫文本、各種數字格式、掃描和讀取條形碼,還是從PDF文檔中提取文本,IronOCR都能以其全面的功能滿足您的需求。

如果您正在開發 .NET 項目並需要集成OCR功能,那麼在考慮不同的OCR引擎時,IronOCR絕對值得考慮。其易用性、速度、靈活性和詳盡的文檔使其成為開發人員進行OCR自動化任務的熱門選擇。

那為什麼不試試IronOCR,看它如何簡化您的OCR項目開發過程呢?它可能是您項目中最好的OCR引擎。

IronOCR提供免費 試用授權 然後起價是 $749 美元,讓您可以在項目中繼續充分利用 IronOCR。

了解更多關於 IronOCR 的資訊,請訪問 這裡.

< 上一頁
多語言 Tesseract OCR(開發者教學)
下一個 >
如何在 C# 中執行車輛註冊 OCR

準備開始了嗎? 版本: 2024.10 剛剛發布

免費 NuGet 下載 總下載次數: 2,433,305 查看許可證 >