使用 IRONOCR

如何在C#中創建OCR收據掃描器

Name: IronOCR
Brand: Iron Software
Availability: InStock
Rating: 4.86 (101 reviews)

坎納帕特·烏頓潘

2024年2月18日

本教程旨在幫助初學者使用OCR 收據掃描器，以及C#中的IronOCR OCR API。在本指南的結尾，您將了解如何實施光學字符識別（OCR），以使用收據 OCR API 將不同類型的收據文件轉換為可編輯和可搜索的數據。這項技術可以成為希望自動化費用管理並減少手動輸入數據的企業的重大改變。讓我們開始吧！

如何在C#中創建OCR收據掃描儀 1. 在Visual Studio中創建C#控制台項目

使用 NuGet 套件管理器安裝 OCR 函式庫。 \n3. 使用 OcrInput 方法將收據載入程式中。
使用 Read 方法提取文字5。將提取的文字顯示在控制台上。

先決條件

在進入編碼部分之前，請確保您已具備以下內容：

Visual Studio：這將是我們的整合開發環境 (IDE)，在這裡我們將撰寫和運行我們的 C# 代碼。
IronOCR Library：我們將使用 IronOCR，一個先進的 OCR 庫，可以輕鬆整合到 C# 應用程式中。
1. 示例收據：一個名為 Sample_Receipt.jpg 的收據圖像文件，我們將用來測試我們的 OCR 實現。

步驟 1：設定專案

打開 Visual Studio：在桌面或應用程式選單中找到 Visual Studio 圖標，然後雙擊它以開啟程式。

建立新專案：啟動 Visual Studio 後，您將看到一個啟動視窗。按下「建立新專案」按鈕。如果您已經開啟 Visual Studio 卻未看到啟動視窗，可以透過點擊頂部選單的「檔案 > 新增 > 專案」來進入。

選擇專案類型：在“建立新專案”窗口中，您將看到各種專案範本。在搜索框中，輸入“Console App”來篩選選項，然後根據您的偏好和相容性選擇 Console App (.NET Core) 或 Console App (.NET Framework)。然後點擊下一步按鈕。

配置您的新專案：現在，您將看到標題為「配置您的新專案」的畫面。

在「專案名稱」欄位中，輸入「OCRReceiptScanner」作為您的專案名稱。
在位置欄中選擇或確認您的專案將被儲存的位置。
如果您希望解決方案名稱與專案名稱不同，您也可以選擇性地指定一個解決方案名稱。
填寫這些詳細資料後，點擊下一步按鈕。
附加資訊：您可能會被要求選擇目標 .NET Framework。選擇最新版本（除非您有特定的相容性要求），然後點擊建立。

步驟 2：整合 IronOCR

在我們使用IronOCR庫之前，我們需要將它包含在我們的專案中。請依照以下步驟操作：

在方案總管中右鍵點擊你的專案。
選擇「管理 NuGet 套件」。
在 NuGet 套件管理器窗口中，您會看到多個選項卡，如瀏覽、已安裝、更新和合併。點擊瀏覽標籤。
在搜索框中輸入IronOcr。這是我們希望添加到項目中的庫的名稱。按下 Enter 鍵以搜尋。
搜尋結果將顯示IronOCR庫包。這應該是您看到的第一個結果之一。點擊它以選擇它。
選擇 IronOCR 套件後，您會注意到右側有一個面板顯示套件的信息，包括其描述和版本。此面板中還有一個安裝按鈕。
點擊安裝按鈕。此操作可能會提示您查看更改，並可能顯示將與IronOCR一起包含的依賴項列表。檢查變更和依賴項，如果一切無誤，請確認並繼續安裝。

步驟 3：配置專案

安裝 IronOCR 後，下一步是配置您的專案。以下是方法：

添加命名空間：在您的 Program.cs 文件頂部，包含以下命名空間：

using IronOcr;
using System;

using IronOcr;
using System;

Imports IronOcr
Imports System

$vbLabelText $csharpLabel

配置設定：如果有任何配置設定，例如 API 密鑰或授權密鑰，請務必包含它們。對於 IronOCR，您需要按照提供的程式碼設定授權金鑰：

License.LicenseKey = "License-Key"; // replace 'License-Key' with your key

License.LicenseKey = "License-Key"; // replace 'License-Key' with your key

License.LicenseKey = "License-Key" ' replace 'License-Key' with your key

$vbLabelText $csharpLabel

步驟 4：讀取收據

現在，讓我們來編寫讀取收據的程式碼。

定義您的收據路徑：指定您要掃描的收據文件的路徑。

string pdfFilePath = "Sample_Receipt.jpg";

string pdfFilePath = "Sample_Receipt.jpg";

Dim pdfFilePath As String = "Sample_Receipt.jpg"

$vbLabelText $csharpLabel

Try-Catch 區塊：使用 try-catch 區塊來實現錯誤處理。這將幫助您管理在OCR過程中發生的任何例外情況。

try
{
    // OCR code will go here
}
catch (Exception ex)
{
    // Handle exceptions here
    Console.WriteLine($"An error occurred: {ex.Message}");
}

try
{
    // OCR code will go here
}
catch (Exception ex)
{
    // Handle exceptions here
    Console.WriteLine($"An error occurred: {ex.Message}");
}

Try
	' OCR code will go here
Catch ex As Exception
	' Handle exceptions here
	Console.WriteLine($"An error occurred: {ex.Message}")
End Try

$vbLabelText $csharpLabel

步驟 5：實施 OCR

在第5步，我們深入探討應用程式的核心功能：實施OCR以讀取和解釋我們收據中的資料。這涉及初始化 OCR 引擎、配置輸入、執行 OCR 操作和顯示結果。

初始化 IronTesseract

程式碼的第一部分建立了一個 IronTesseract 類別的實例：

var ocr = new IronTesseract();

var ocr = new IronTesseract();

Dim ocr = New IronTesseract()

$vbLabelText $csharpLabel

通過創建 IronTesseract 的實例，我們實質上是在設置我們的 OCR 工具，準備執行文字識別任務。就像在開車之前先啟動引擎。此物件將用於控制 OCR 過程，包括讀取輸入並從中提取文本。

配置 OCR 輸入

接下來，我們定義我們的OCR過程的輸入：

using (var input = new OcrInput(pdfFilePath))
{
    // OCR processing will go here
}

using (var input = new OcrInput(pdfFilePath))
{
    // OCR processing will go here
}

Using input = New OcrInput(pdfFilePath)
	' OCR processing will go here
End Using

$vbLabelText $csharpLabel

在這一部分，OcrInput 用於指定我們想要處理的文件。 pdfFilePath 是一個包含我們收據文件路徑的變量。通過將此變量傳遞給 OcrInput，我們告訴 OCR 引擎，「這是我想讓你閱讀的文件。」using 語句是一個特殊的 C# 結構，確保在處理完成後，OcrInput 使用的資源（如文件句柄）能夠正確釋放。這是一種有效管理資源的方法，確保您的應用程序運行順暢而不會造成不必要的記憶體使用。

執行 OCR

在using區塊內，我們調用我們的ocr實例的Read方法：

var result = ocr.Read(input);

var result = ocr.Read(input);

Dim result = ocr.Read(input)

$vbLabelText $csharpLabel

Read 方法將把輸入文件路徑作為參數。此行將開始進行收據掃描。它將對給定的輸入文件進行OCR，提取數據，並將其存儲到變量result中。我們可以使用從此方法提取的文本來執行任何文本操作。

輸出結果

最後，我們輸出由OCR過程識別的文字：

Console.WriteLine(result.Text);

Console.WriteLine(result.Text);

Console.WriteLine(result.Text)

$vbLabelText $csharpLabel

result 變數包含 OCR 處理的輸出，而 result.Text 包含實際從收據中提取的文本。 Console.WriteLine 函數然後將此文本顯示在控制台上。這讓您可以查看和驗證OCR過程的結果。以下是完整的Program.cs文件代碼：

using IronOcr;
using Microsoft.Extensions.Configuration;
using System;
class Program
{
    static void Main(string [] args)
    {
        License.LicenseKey = "Your-License-Key";
        string pdfFilePath = "Sample_Receipt.jpg";
        try
        {
            var ocr = new IronTesseract();
            using (var input = new OcrInput(pdfFilePath))
            {
                var result = ocr.Read(input);
                    Console.WriteLine(result.Text);
            }
        }
        catch (Exception ex)
        {
            // Handle exceptions (e.g., file not found, OCR errors) and log them if necessary.
            Console.WriteLine($"An error occurred: {ex.Message}");
        }
    }
}

using IronOcr;
using Microsoft.Extensions.Configuration;
using System;
class Program
{
    static void Main(string [] args)
    {
        License.LicenseKey = "Your-License-Key";
        string pdfFilePath = "Sample_Receipt.jpg";
        try
        {
            var ocr = new IronTesseract();
            using (var input = new OcrInput(pdfFilePath))
            {
                var result = ocr.Read(input);
                    Console.WriteLine(result.Text);
            }
        }
        catch (Exception ex)
        {
            // Handle exceptions (e.g., file not found, OCR errors) and log them if necessary.
            Console.WriteLine($"An error occurred: {ex.Message}");
        }
    }
}

Imports IronOcr
Imports Microsoft.Extensions.Configuration
Imports System
Friend Class Program
	Shared Sub Main(ByVal args() As String)
		License.LicenseKey = "Your-License-Key"
		Dim pdfFilePath As String = "Sample_Receipt.jpg"
		Try
			Dim ocr = New IronTesseract()
			Using input = New OcrInput(pdfFilePath)
				Dim result = ocr.Read(input)
					Console.WriteLine(result.Text)
			End Using
		Catch ex As Exception
			' Handle exceptions (e.g., file not found, OCR errors) and log them if necessary.
			Console.WriteLine($"An error occurred: {ex.Message}")
		End Try
	End Sub
End Class

$vbLabelText $csharpLabel

第 6 步：運行您的應用程式

建置專案：點選「建置」選單，然後選擇「建置方案」。
執行專案：按下 F5 或點擊「開始」按鈕來執行您的應用程式。
現在，您可以看到從收據輸出的文本顯示在控制台上。此文本代表從您的收據圖像中提取的數據。這就是我們使用IronOCR掃描收據的方式。這是一個使用 OCR 功能從紙本收據中提取數據的簡單範例。這是一個非常通用的實現。您可以修改程式碼以符合您的收據圖像的佈局。
之後，您可以使用從掃描收據後獲得的非結構化數據。我們可以從收據的特定部分獲取重要信息。或者我們可以以更有條理的方式顯示收據數據。我們可以使用 IronOCR 製作一個 OCR 收據掃描軟體應用程式。這將幫助我們提取準確的收據欄位數據。

結論

恭喜！您已成功使用C#和IronOCR建立了一個OCR收據掃描器。此掃描器能顯著提高數據提取的準確性，以滿足各種業務需求，如費用追踪、供應鏈管理等。不再需要檢查掃描的收據並手動提取數據。

IronOCR 提供免費試用，允許用戶在沒有初始成本的情況下探索和評估其功能。對於那些希望在專業環境中整合和利用全方位功能的人，許可證的價格從$749開始，提供一個全面的解決方案，以滿足強大的 OCR 收據掃描和數據提取需求。

記住，這只是個開始。您可以擴展此應用程式以支援各種檔案類型，改進資料隱私，或整合額外功能，例如針對特定欄位如稅額、日期、行項等的收據識別。利用OCR技術，可能性是無限的，為更高效和智能的商業流程開闢了道路。快樂編程！

坎納帕特·烏頓潘

立即與工程團隊聊天

軟體工程師

在成為軟體工程師之前，Kannapat 在日本北海道大學完成了環境資源博士學位。在攻讀學位期間，Kannapat 也成為了車輛機器人實驗室的成員，該實驗室隸屬於生物生產工程學系。2022 年，他利用自己的 C# 技能，加入了 Iron Software 的工程團隊，專注於 IronPDF 的開發。Kannapat 珍視這份工作，因為他可以直接向負責撰寫大部分 IronPDF 程式碼的開發人員學習。除了同儕學習外，Kannapat 還享受在 Iron Software 工作的社交方面。當他不在撰寫程式碼或文件時，Kannapat 通常會在 PS5 上玩遊戲或重看《最後生還者》。

< 上一頁
如何使用C#中的OCR讀取身份證件

下一個 >
如何創建發票 OCR 解決方案