跳過到頁腳內容
OCR 工具

Power Automate OCR 開發者教學

光學字元辨識 (OCR) 是一種掃描圖像、掃描文件和 PDF 中的文本,並將其轉換為機器可讀文本的技術。 OCR 技術使電腦能夠識別各種格式的文件——書籍、收據、表格和照片——這些文件可以數位化並自動提取為 PDF 資料。 它分析圖像中的字元及其模式,然後將它們與文字對應。 光學字元辨識技術應用於文件數位化、PDF 資料自動提取和輸入、發票處理以及使掃描的 PDF 可搜尋等領域。

OCR技術已經取得了巨大的進步,能夠識別和閱讀不同的語言,如今的語言在佈局理解方面非常複雜,例如表格和列。 進階 OCR 功能軟體也使用影像預處理技術。 這些功能包括降噪和對比度調整,可提高 OCR 軟體讀取低品質影像的準確性。 Tesseract OCR引擎、Power Automate和IronOCR是目前最受歡迎的三種OCR工具,它們具有很高的準確性和靈活性。 OCR 已成為企業、研究人員和開發人員外包文件管理和文字識別的不可或缺的工具。

什麼是 Microsoft Power Automate OCR?

微軟 Power Automate的光學字元辨識功能:利用此功能,企業可以自動從圖像、掃描文件和 PDF 中提取文本,並將其轉換為易於編輯和機器可讀的格式。 作為微軟 Power Platform 的一部分,Power Automate 桌面版和線上版使用戶無需任何編碼能力即可建立流程。 透過將 OCR 整合到工作流程中,它們可以自動執行繁瑣的資料輸入、處理發票和數位化文件。

這樣可以節省時間並最大限度地減少錯誤。 它確實是一款功能強大的搜尋工具,可在 Power Automate 的 OCR 功能中支援多種不同的格式和語言。 它基於 AI Builder 構建,支援在多個行業中使用文字識別。 它可與其他微軟服務(包括 Excel、SharePoint 和 OneDrive)無縫集成,實現從掃描文件到儲存甚至共用文件的端到端自動化。 這有助於組織提高效率、簡化文件管理並提高營運活動的準確性。

在 Power Automate 中實施 OCR 的好處

在 Power Automate 中實作 OCR 有以下優勢:

節省時間和人力:文件文字擷取的自動化可以節省大量原本用於手動資料輸入的時間和精力。

經濟實惠:用戶友好且易於使用,因此無需昂貴的客製化軟體解決方案。

整合: Microsoft Power Automate 可與其他 Microsoft 365 服務(如 SharePoint、OneDrive 甚至 Excel)無縫整合。

可擴展性:它可以同時處理數千份文檔,因此適合大型企業使用。

減少錯誤:資料輸入流程自動化可最大限度地減少人為錯誤的發生機率。

如何在 Power Automate 中使用 OCR

Power Automate 透過多種連接方式支援 OCR 功能,包括 AI Builder 和 OneDrive。以下是使用 Power Automate Online 或桌面版建立啟用 OCR 的工作流程的逐步指南:

1. 設定 Power Automate

首先,登入您的 Power Automate 帳戶;如果您還沒有帳戶,請註冊一個。 Power Automate 是 Microsoft 365 的一部分,這表示如果您正在使用 Office 365 或 Dynamics 365,您就已經可以存取它了。

2. 建立新流程

開啟"建立"選項卡,然後按一下"即時流程"以建立一個可以手動啟動的新流程。

為你的流程命名。 例如,將其命名為"審批前",並選擇下列觸發器:當在資料夾(SharePoint 或 OneDrive)中建立文件時,或手動觸發流程。

建立一個新的 Power Automation 流程,類似下圖所示。

Power Automate OCR(開發者教學):圖 5 - 新的自動化流程

3. 將檔案上傳到 OneDrive 或 SharePoint

新增一個操作,將您的文件(圖像或 PDF)上傳到 OneDrive for Business 或 SharePoint。 此操作將觸發 OCR 過程以提取資料。 在本次示範中,我們將使用 SharePoint 文件庫。

Power Automate OCR(開發人員教學):圖 6 - 上傳文件

4. 利用 AI Builder 的 OCR 功能

利用 AI Builder 開發"從圖像中提取文字"操作。 AI Builder 是 Power Automate 中機器學習的深度整合功能,它具有預先訓練的 OCR 模型,使用戶能夠輕鬆地從圖像或 PDF 中識別文字。

Power Automate OCR(開發者教學):圖 7 - AI 建構器

選擇要從中提取文字的圖像檔案。

Power Automate OCR(開發人員教學):圖 8 - 選擇圖片

5. 處理提取的數據

透過 OCR 擷取文字後,即可進行進一步處理。 例如:

將擷取的文字儲存為 Excel 格式:使用"新增行"動作將擷取的文字插入 Excel 檔案。

透過電子郵件傳送文字:使用"傳送電子郵件"操作將擷取的文字轉發給指定的收件者。

儲存到資料庫:使用連接器將資料推送到 SQL Server、SharePoint 清單或其他資料庫進行儲存。

IronOCR是什麼?

IronOCR是一個功能強大的.NET OCR 庫,可讓您使用 OCR 從圖像、PDF 和掃描件中準確提取文字。 在其他函式庫可能因影像品質不佳或影像雜訊大而難以進行文字辨識的情況下,它表現出色,並且支援超過 125 種語言,使其成為多語言使用場景的完美選擇。 IronOCR包含進階功能,例如自動偵測語言、影像預處理、雜訊移除、傾斜校正以及將文件轉換為可搜尋的 PDF,同時保留原始佈局。

Power Automate OCR(開發人員教學):圖 9 - IronOCR

該產品可透過簡單的.NET專案 API 輕鬆集成,使開發人員能夠在他們開發的應用程式中實現 OCR 功能。該程式庫尤其適用於文件數位化、資料輸入自動化工作流程以及高精度、高可擴展性的文字擷取任務,尤其適用於企業級應用程式。 它易於使用且擁有強大的OCR功能,這是它的優勢所在。

IronOCR的特點

即使從低解析度影像和雜訊較大的掃描文件中,也能實現出色的文字擷取精度。

  • 支援超過 125 種語言,並具有自動語言偵測功能,可在各種語言環境中使用。
  • 提供影像預處理工具,如降噪、傾斜校正、對比度增強和銳化,以提高對不完美影像的處理效能。
  • 建立全文可搜尋的 PDF,將掃描的文件或影像轉換為具有原始佈局的全文可搜尋 PDF。
  • 保留版面配置和格式,保持來源文件的結構、字型和格式,這對於包含表格和列的複雜文件至關重要。
  • 批次處理:支援一次操作批次處理多個影像或文檔,支援大批量文檔處理。
  • 輕鬆與.NET集成:支援簡單的 API,可輕鬆與.NET應用程式集成,使開發人員能夠輕鬆實現 OCR。

用於執行 OCR 的範例程式碼

using IronOcr;

class Program
{
    static void Main(string[] args)
    {
        // Initialize Iron Tesseract OCR engine
        var Ocr = new IronTesseract();

        // Set language
        Ocr.Language = OcrLanguage.English;

        // Path to the image file
        var inputFile = @"path\to\your\image.png";

        // Read the image and perform OCR
        using (var Input = new OcrInput(inputFile))
        {
            // Perform OCR
            var Result = Ocr.Read(Input);

            // Display the extracted text in the console
            Console.WriteLine("Extracted Text:");
            Console.WriteLine(Result.Text);
        }
    }
}
using IronOcr;

class Program
{
    static void Main(string[] args)
    {
        // Initialize Iron Tesseract OCR engine
        var Ocr = new IronTesseract();

        // Set language
        Ocr.Language = OcrLanguage.English;

        // Path to the image file
        var inputFile = @"path\to\your\image.png";

        // Read the image and perform OCR
        using (var Input = new OcrInput(inputFile))
        {
            // Perform OCR
            var Result = Ocr.Read(Input);

            // Display the extracted text in the console
            Console.WriteLine("Extracted Text:");
            Console.WriteLine(Result.Text);
        }
    }
}
$vbLabelText   $csharpLabel

結論

雖然IronOCR和 Power Automate OCR 在文字辨識方面都非常強大,但IronOCR對於任何需要超越 Power Automate OCR 所支援的簡單情況的嚴肅 OCR 功能的開發人員或企業來說,其解決方案要強大得多,也更加靈活。 Power Automate 的 OCR 引擎專為簡單的工作流程而設計,可能需要額外訂閱。

相較之下, IronOCR 的優勢在於,即使處理低品質的輸入影像,也能提供高品質的結果。 它支援超過 125 種語言,並能很好地保留格式和佈局。 其複雜的文件處理和大批量操作能力得到了高級影像預處理選項的良好支援。 它在.NET應用程式中具有高度可自訂性。

Power Automate OCR 足以滿足 Microsoft 生態系統內的小規模自動化或整合需求,而IronOCR則以最高的準確性和控制力脫穎而出,支援創建可搜尋的 PDF 等功能,並可適應多種格式。

對於尋求對功耗要求高、可自訂性強且不受平台限制的 OCR 解決方案的組織而言,建議使用IronOCR 。 Iron Software為開發人員提供多種函式庫選項。 請查看圖書館套件頁面以了解更多詳情。

Kannaopat Udonpant
軟體工程師
在成為軟件工程師之前,Kannapat 從日本北海道大學完成了環境資源博士學位。在追逐學位期间,Kannapat 還成為了生產工程系一部份——汽車机器人實验室的成員。2022 年,他利用他的 C# 技能加入 Iron Software 的工程團隊, 專注於 IronPDF。Kannapat 珍惜他的工作,因為他直接向编写大部分 IronPDF 使用的代碼的開發者学习。除了同行学习,Kannapat 还喜欢在 Iron Software 工作的社交十环。当他不编写代碼或文檔時,Kannapat 通常在他的 PS5 上打游戏或重看《The Last of Us》。

鋼鐵支援團隊

我們每週 5 天,每天 24 小時在線上。
聊天
電子郵件
打電話給我