OCR 工具

Power Automate OCR 開發者教學

Name: IronOCR
Brand: Iron Software
Availability: InStock
Rating: 4.86 (101 reviews)

已更新:2026年4月21日

光學字元識別 (OCR) 是一種技術，能夠掃描圖像、掃描文件和PDF中的文字，然後轉換成機器可讀的文字。 OCR 使計算機能夠識別各種格式——書籍、收據、表格和照片，這些格式可以被數位化並自動化加工以便PDF資料提取。它分析圖像中的字元及其模式，然後將其對應為文字。這個光學字元識別技術被應用於文件數位化、自動PDF資料提取和錄入、發票處理，並使掃描的PDF可以進行搜尋。

OCR技術已大幅提升，能夠識別和閱讀不同語言，以及在瞭解佈局上具有挑戰性的格式，例如表格和欄。先進的OCR功能軟體還使用圖像的預處理技術。這包括去除噪音和調整對比度，提高了OCR軟體在閱讀低質量圖像時的準確性。三種最受歡迎的OCR工具是Tesseract OCR引擎、Power Automate和IronOCR，它們具有高準確性和靈活性。 OCRs 已成為企業、研究人員和開發者不可或缺的工具，用於外包文件管理和文字識別。

什麼是Microsoft Power Automate OCR？

Microsoft Power Automate的光學字元識別：使用此功能，企業可以將圖像、掃描文件和PDF中的文字提取為易於編輯和機器可讀的格式。作為Microsoft Power平台的一部分，Power Automate桌面版和在線版使使用者能夠建立流程，而無需任何編碼能力。它們可以通過工作流中的OCR整合來自動化繁瑣的資料錄入、處理發票並數位化文件。

這樣可以節省時間並減少錯誤。它確實是一個強大的搜尋工具，可支持Power Automate的OCR功能中的多種格式和語言。使用AI Builder構建，支持在多個行業中使用文字識別。它與其他Microsoft服務無縫整合，包括Excel、SharePoint和OneDrive，支持從掃描文件到儲存甚至共享的端到端自動化。這有助於組織提高效率、簡化文件管理並增強其活動中的操作準確性。

在Power Automate中實現OCR的好處

在Power Automate中實現OCR的優勢如下：

節省時間和勞力：自動化文件文字提取，可以節省相當多的時間和精力，這些時間和精力本來會用於手動資料錄入。

具成本效益：使用者友好且易於存取，因此不再需要昂貴的定製化軟體解決方案。

整合性：Microsoft Power Automate與其他Microsoft 365服務如SharePoint、OneDrive及Excel無縫整合。

可擴展性：它可以同時處理成千上萬的文件，非常適合大型企業。

減少錯誤：自動化資料輸入過程可以最大程度地減少人為錯誤的可能性。

如何在Power Automate中使用OCR

Power Automate通過多種不同的連接支持OCR功能，包括AI Builder和OneDrive。以下是如何使用Power Automate在線或桌面建立具有OCR功能的工作流的分步指南：

1. 設置Power Automate

首先，登錄到您的Power Automate帳戶，如果您沒有，則註冊一個帳戶。 Power Automate是Microsoft 365的一部分，這意味著如果您在使用Office 365或Dynamics 365，您已經有存取權限。

2. 建立新流程

打開"建立"選項卡，點擊"即時流程"以建立可以手動啟動的新流程。

命名您的流程。例如，將其命名為"批准前"並選擇以下觸發器：當文件在資料夾中建立時（SharePoint或OneDrive）或手動觸發流程。

新的一個Power Automation流程被建立，類似於下面顯示的。

Power Automate OCR（開發者教程）：圖5 - 新自動化流程

3. 上傳檔案到OneDrive或SharePoint

新增一個操作，將您的文件（圖像或PDF）上傳到OneDrive for Business或SharePoint。此操作將觸發OCR過程以提取資料。在此演示中，我們使用SharePoint文件庫。

Power Automate OCR（開發者教程）：圖6 - 上傳文件

4. 利用AI Builder的OCR行動

利用AI Builder開發"從圖像提取文字"行動。 AI Builder是Power Automate的機器學習深度整合功能，擁有預訓練的OCR模型，允許使用者輕鬆識別圖像或PDF中的文字。

Power Automate OCR（開發者教程）：圖7 - AI Builder

選擇要從中提取文字的圖像檔。

Power Automate OCR（開發者教程）：圖8 - 選擇圖像

5. 處理提取的資料

一旦OCR提取了文字，便可以進一步處理。例如：

將提取的文字以Excel格式儲存：使用"新增一行"操作將提取的文字插入到Excel文件中。

通過電子郵件傳遞文字：使用"發送電子郵件"操作將提取的文字轉發給指定的收件人。

儲存到資料庫：使用連接器將資料推送到SQL Server、SharePoint列表或其他資料庫進行儲存。

什麼是IronOCR？

IronOCR 是一個強大的.NET OCR程式庫，允許您準確地從圖像、PDF和掃描中使用OCR提取文字。它在圖像質量差或噪音干擾導致其他程式庫可能遇到困難的情況下表現出色，並支持超過125種語言，適用於多語種使用場景。 IronOCR包含先進的功能，如自動語言檢測、圖像預處理、噪音去除、偏斜糾正和將文件轉換為可搜尋的PDF，同時保留原始佈局。

Power Automate OCR（開發者教程）：圖9 - IronOCR

該產品可以通過簡單的.NET專案API輕鬆整合，允許開發人員在他們開發的應用程式中實現OCR。該程式庫尤其適合文件數字化、資料輸入自動化工作流以及具有高準確性和可擴展性的文字提取任務，非常適合企業級應用。易於使用和強大的OCR功能是其優勢。

IronOCR的功能

即使在低解析度圖像和噪音干擾的掃描文件中也能提供卓越的文字提取精度。
支持超過125種語言，並在各種語言環境中自動檢測語言使用。
提供圖像預處理工具，如降噪、歪斜矯正、對比度增強和銳化，以改善對不完美圖像的性能。
建立全文可搜索的PDF，將掃描的文件或圖像轉換為完全可搜索的PDF，並保留原始佈局。
保留佈局和格式，維護來源文件的結構、字體和格式，這對於具有表格和欄的複雜文件尤為重要。
批量處理：支持在一個操作中批量處理多個圖像或文件，適合大批量文件處理。
與.NET的簡單整合：支持利用簡單API進行與.NET應用程式的簡單整合，使開發人員能夠毫不費力地實現OCR。

執行OCR的範例程式碼

using IronOcr;

class Program
{
    static void Main(string[] args)
    {
        // Initialize Iron Tesseract OCR engine
        var Ocr = new IronTesseract();

        // Set language
        Ocr.Language = OcrLanguage.English;

        // Path to the image file
        var inputFile = @"path\to\your\image.png";

        // Read the image and perform OCR
        using (var Input = new OcrInput(inputFile))
        {
            // Perform OCR
            var Result = Ocr.Read(Input);

            // Display the extracted text in the console
            Console.WriteLine("Extracted Text:");
            Console.WriteLine(Result.Text);
        }
    }
}

using IronOcr;

class Program
{
    static void Main(string[] args)
    {
        // Initialize Iron Tesseract OCR engine
        var Ocr = new IronTesseract();

        // Set language
        Ocr.Language = OcrLanguage.English;

        // Path to the image file
        var inputFile = @"path\to\your\image.png";

        // Read the image and perform OCR
        using (var Input = new OcrInput(inputFile))
        {
            // Perform OCR
            var Result = Ocr.Read(Input);

            // Display the extracted text in the console
            Console.WriteLine("Extracted Text:");
            Console.WriteLine(Result.Text);
        }
    }
}

Imports IronOcr

Friend Class Program
	Shared Sub Main(ByVal args() As String)
		' Initialize Iron Tesseract OCR engine
		Dim Ocr = New IronTesseract()

		' Set language
		Ocr.Language = OcrLanguage.English

		' Path to the image file
		Dim inputFile = "path\to\your\image.png"

		' Read the image and perform OCR
		Using Input = New OcrInput(inputFile)
			' Perform OCR
			Dim Result = Ocr.Read(Input)

			' Display the extracted text in the console
			Console.WriteLine("Extracted Text:")
			Console.WriteLine(Result.Text)
		End Using
	End Sub
End Class

$vbLabelText $csharpLabel

結論

儘管IronOCR和Power Automate OCR在文字識別方面都是非常強大的，但IronOCR在其解決方案中顯得更加強大且靈活，適合任何需要超出Power Automate OCR所支持的簡單案例的開發人員或業務。 Power Automate的OCR引擎是為簡單工作流設計的，可能需要額外的訂閱。

與此相反，IronOCR即使在處理低質量的輸入圖像時也能提供高質量的結果。它支持超過125種語言，並且格式和佈局得到了很好的保護。對於複雜文件處理和大批量操作的能力得到了先進圖像預處理選項的良好支持。它在.NET應用程式中具有高度的可定制性。

Power Automate OCR對於微小的自動化或僅限於Microsoft生態系統的整合是足夠的，而IronOCR則以最大精度和控制能力脫穎而出，支持提供多種格式的可搜尋PDF建立等功能。

對於尋求不受平台限制的強大而可自訂OCR解決方案的組織，建議使用IronOCR。 Iron Software為開發者提供了多種程式庫選擇。查看程式庫套件頁面以獲取更多詳情。

Kannapat Udonpant

立即與工程團隊聊天

軟體工程師

在成為軟體工程師之前，Kannapat在日本北海道大學完成了環境資源博士學位。在攻讀學位期間，Kannapat還成為車輛機器人實驗室的一員，該實驗室隸屬於生產工程系。在2022年，他憑藉C#技能加入了Iron Software的工程團隊，專注於IronPDF。Kannapat珍視他的工作，因為他能直接向撰寫大部分IronPDF程式碼的開發者學習。除了同儕學習，Kannapat還喜歡在Iron Software工作的社交方面。不寫程式碼或文件時，Kannapat通常在他的PS5上玩遊戲或重看The Last of Us。