OCRツール

Power Automate OCR（開発者チュートリアル）

Name: IronOCR
Brand: Iron Software
Availability: InStock
Rating: 4.86 (101 reviews)

カンナパット・ウドンパント

2024年12月15日

共有:

イントロダクション

光学文字認識は、画像、スキャンされた文書、およびPDF文書からテキストをスキャンして、機械で読み取れるテキストに変換する技術です。 OCRにより、コンピューターはさまざまな形式、つまり書籍、領収書、フォーム、写真を認識し、PDFデータ抽出のためにデジタル化および自動化することが可能です。それは画像内の文字やパターンを分析し、それらをテキストに対応させます。この光学文字認識技術は、文書のデジタル化、自動PDFデータの抽出および入力、請求書処理、スキャンしたPDFを検索可能にするアプリケーションで使用されます。

OCRは劇的に進化し、テーブルやカラムなど、現代の複雑なレイアウト理解を伴う様々な言語を認識して読み取ることができます。高度なOCR機能を持つソフトウェアは、画像の前処理技術も使用します。それにはノイズ除去とコントラスト調整が含まれており、低品質な画像を読み取る際のOCRソフトウェアの精度を向上させます。最も人気のあるOCRツールのうち3つは、Tesseract OCRエンジン、Power Automate、そして高精度かつ柔軟性を持つIronOCRです。 OCRは、企業、研究者、開発者が文書の管理やテキストの認識を外部委託するために不可欠なツールとなっています。

Microsoft Power Automate OCRとは何ですか？

Microsoft Power Automateによる光学文字認識: この機能を使用することで、企業は画像、スキャンされた文書、およびPDFからテキストを抽出し、それを簡単に編集可能で機械可読な形式に自動化する能力を備えることができます。 Microsoft Power Platformの一部であるPower Automateは、デスクトップおよびオンラインで、ユーザーが必ずしもコーディング能力を必要とせずにフローを作成する能力を提供します。彼らは、ワークフローにOCRを統合することにより、面倒なデータ入力を自動化し、請求書を処理し、文書をデジタル化することができます。

-->

これにより、彼らの時間を節約し、エラーを最小限に抑えることができます。それは確かに強力な検索ツールであり、AI Builderを使用して構築されたPower AutomateのOCR機能で多くの異なるフォーマットと言語のサポートを提供するために使用でき、複数の業界でのテキスト認識の使用をサポートしています。これはExcel、SharePoint、OneDriveを含む他のMicrosoftサービスとシームレスに統合され、ドキュメントのスキャンから、保存や共有に至るまで、エンドツーエンドの自動化を開始することができます。この点において、組織は効率を向上させ、文書管理を合理化し、業務の正確性を高めることができます。

Power AutomateでOCRを実装することの利点

Power AutomateでOCRを実装することには、次の利点があります。

時間と労力の節約: ドキュメントのテキスト抽出の自動化は、手動でデータを入力する際に費やされる時間と労力を大幅に節約します。

コスト効率: ユーザーフレンドリーでアクセスしやすいため、高価なカスタムソフトウェアソリューションの必要性はほとんどないか、全くありません。

統合: Microsoft Power Automateは、SharePoint、OneDrive、Excelなどの他のMicrosoft 365サービスとシームレスに統合します。

スケーラビリティ: 一度に数千のドキュメントを処理できる能力は、その有効性により大企業に適しています。

エラーの削減: データ入力プロセスを自動化するため、人為的なエラーの発生の可能性が最小限に抑えられます。

Power AutomateでOCRを使用する方法

Power Automateは、AI BuilderやOneDriveを含むいくつかの異なる接続を通じてOCR機能をサポートしています。ここでは、Power Automateオンラインを取得する方法のステップバイステップガイド、またはPower Automateデスクトップを使用してOCR対応のワークフローを作成する方法を紹介します。

1. Power Automate を設定する

開始するには、Power Automate アカウントにログインするか、アカウントを持っていない場合はサインアップします。 Power AutomateはMicrosoft 365の一部であり、Office 365またはDynamics 365を使用している場合は既にアクセスできます。

-->

2: 新しいフローを作成する

「作成」タブを開き、「インスタントフロー」をクリックして手動で開始できる新しいフローを作成します。

-->

フローに名前を付けてください。たとえば、それを「承認前」と名付け、次のトリガーを選択します。フォルダー（SharePointやOneDrive）にファイルが作成されたとき、またはフローを手動でトリガーします。

-->

以下のような新しいPowerオートメーションフローが作成されました。

Power Automate OCR（開発者チュートリアル）：図5 - 新しい自動化フロー

3: OneDriveまたはSharePointにファイルをアップロード

あなたのドキュメント（画像またはその他のPDFファイル）をOneDrive for BusinessまたはSharePointにアップロードするアクションを追加します。このアクションは、データを抽出するためにOCRプロセスをトリガーします。このデモでは、SharePoint ドキュメントライブラリを使用しています。

Power Automate OCR（開発者チュートリアル）：図6 - ファイルをアップロード

4. AIビルダーのOCRアクションを活用する

AI Builderを活用して、画像からテキストを抽出するアクションを開発します。 AI Builderは、Power Automateにおける機械学習の深く統合された機能であり、ユーザーが画像やPDFからテキストを簡単に識別できるようにする、事前にトレーニングされたOCRモデルを備えています。

Power Automate OCR (開発者向けチュートリアル): 図7 - AI Builder

テキストを抽出するための画像ファイルを選択します。

Power Automate OCR（開発者チュートリアル）：図8 - 画像を選択

5. 抽出したデータの処理

OCRで言語データがテキストとして抽出されると、それをさらに処理することができます。例えば：

抽出したテキストを Excel 形式で保存します: 「行の追加」アクションを使用して、抽出したテキストをExcelファイルに追加します。

テキストをメールで送信する: 抽出されたテキストを特定の受信者に転送するために、電子メールを送信するアクションを使用します。

データベースに保存: コネクタを使用してデータをSQL Server、SharePointリスト、または他のデータベースに格納します。

IronOCRとは何ですか？

IronOCRは、画像、PDF、およびスキャンからOCRを使ってテキストを正確に抽出できる強力な.NET OCRライブラリです。画質が悪い画像やノイズの多い画像で他のライブラリがテキスト認識に失敗する場合において、その効力を発揮します。また、125以上の言語をサポートしており、多様性のある多言語使用ケースに最適です。 IronOCRは、自動言語検出や画像前処理のノイズ除去、傾き補正など、多くの高度な機能をカプセル化しています。これは、すべてのスタイルや構造詳細、画像からテキストへの変換、PDFからテキストへの変換、検索可能なPDFを含む同じレイアウトのドキュメントのようです。

Power Automate OCR (開発者向けチュートリアル): 図9 - IronOCR

製品は、.NET プロジェクトの簡単な API を介して容易に組み込むことができ、開発者は開発するアプリケーションで OCR を活用できます。このライブラリは、ドキュメントのデジタル化、データ入力の自動化されたワークフロー、および高精度でスケーラブルなエンタープライズレベルのアプリケーション用のテキスト抽出タスクに便利です。そのライブラリの強みは、使いやすさを発見し、強力なOCR機能を提供するときにあります。

IronOCR の機能

低解像度の画像やノイズの多いスキャンドキュメントからでも、抽出するテキストの精度が卓越しています。
それは125以上の言語をサポートしており、自動言語検出機能により、多様な言語環境でのOCRを可能にします。
画像の前処理には、ノイズ除去、傾き補正、コントラスト強調、シャープ化などのツールが必要です。これらはすべて、不完全な画像のパフォーマンスを向上させます。
全文検索可能なPDFを作成。スキャンされた紙の文書や画像は、検索や整理を容易にするために、元のレイアウトを保持したまま、完全に検索可能なPDFに変換されます。
レイアウトとフォーマットを保持: このツールは、ソースドキュメントの構造、フォント、フォーマットを保持します。テーブルや列といったレイアウトは複雑であり、デジタル化において保持されなければなりません。
バッチ処理: これにより、複数の画像やドキュメントを一度に処理することができます。この技術は、大量の文書処理をサポートします。
.NETとの簡単な統合: シンプルなAPIをサポートしているため、.NETアプリケーションに簡単に統合できます。これにより、開発者が大規模な作業を必要とせずにOCRを簡単に実装するメカニズムが提供されます。

OCRを実行するサンプルコード

using IronOcr;
class Program
{
    static void Main(string[] args)
    {
        // Initialize Iron Tesseract OCR engine variable
        var Ocr = new IronTesseract();
        // Add multiple languages
        Ocr.Language = OcrLanguage.English;
        // Image file path
        var inputFile = @"path\to\your\image.png";
        // Read the image and perform OCR
        using (var input = new OcrInput(inputFile))
        {
            // Perform OCR
            var result = Ocr.Read(input);
            // Display the result
            Console.WriteLine("Text:");
            Console.WriteLine(result.Text);
        }
    }
}

using IronOcr;
class Program
{
    static void Main(string[] args)
    {
        // Initialize Iron Tesseract OCR engine variable
        var Ocr = new IronTesseract();
        // Add multiple languages
        Ocr.Language = OcrLanguage.English;
        // Image file path
        var inputFile = @"path\to\your\image.png";
        // Read the image and perform OCR
        using (var input = new OcrInput(inputFile))
        {
            // Perform OCR
            var result = Ocr.Read(input);
            // Display the result
            Console.WriteLine("Text:");
            Console.WriteLine(result.Text);
        }
    }
}

Imports IronOcr
Friend Class Program
	Shared Sub Main(ByVal args() As String)
		' Initialize Iron Tesseract OCR engine variable
		Dim Ocr = New IronTesseract()
		' Add multiple languages
		Ocr.Language = OcrLanguage.English
		' Image file path
		Dim inputFile = "path\to\your\image.png"
		' Read the image and perform OCR
		Using input = New OcrInput(inputFile)
			' Perform OCR
			Dim result = Ocr.Read(input)
			' Display the result
			Console.WriteLine("Text:")
			Console.WriteLine(result.Text)
		End Using
	End Sub
End Class

$vbLabelText $csharpLabel

結論

IronOCRとPower Automate OCRの両方がテキスト認識に関して非常に強力であるにもかかわらず、IronOCRは開発者や企業がPower Automate OCRによってサポートされるシンプルなケースを超える本格的なOCR機能を必要とする場合に、はるかに堅牢で柔軟なソリューションを提供します。対照的に、Power AutomateのOCRエンジンはシンプルなワークフローのために構築されており、追加のサブスクリプションが必要になる可能性があります。

対照的に、IronOCRは低品質の入力画像を扱う場合でも、非常に高品質な結果を提供する点で際立っています。 125以上の言語をサポートし、強力なフォーマットとレイアウトの保持が可能です。その複雑なドキュメント処理と大規模なバッチ操作は、高度な画像前処理機能に適しています。それでも、時には.NETアプリケーションで非常にカスタマイズ可能です。

Power Automate OCRは、より小規模なオートメーションやMicrosoftに厳密に構築された統合には十分ですが、IronOCRはユーザーが持つコントロール量、最大精度、さらには複数の形式をサポートする検索可能なPDF作成などの機能により、群を抜いて優れています。

プラットフォームの制約がなく、パワークリティカルでカスタマイズ可能なOCRソリューションを求めている組織には、IronOCR。 Iron Softwareは、さまざまな種類のライブラリを開発者に提供しています。詳細についてはライブラリスイートページをチェックしてください。

カンナパット・ウドンパント

今すぐエンジニアリングチームとチャット

ソフトウェアエンジニア

ソフトウェアエンジニアになる前に、カンナパットは日本の北海道大学から環境資源学の博士号を取得しました。学位を取得する過程で、カンナパットはバイオプロダクション工学部に所属する車両ロボティクス研究所のメンバーにもなりました。2022年には、C#のスキルを活かしてIron Softwareのエンジニアリングチームに参加し、IronPDFに注力しています。カンナパットは、IronPDFで使用されているコードの大部分を作成した開発者から直接学べることに価値を見いだしています。同僚との学び合いに加えて、Iron Softwareで働くことの社会的側面も楽しんでいます。コードやドキュメントを書いていない時には、カンナパットは通常、PS5でゲームをしたり、『The Last of Us』を再視聴したりしています。

次へ >
EasyocrとTesseractの比較（OCR機能の比較）