ライブ環境でテストする
ウォーターマークなしで本番環境でテストしてください。
必要な場所でいつでも動作します。
光学式文字認識(OCR)は、画像、スキャンした文書、およびPDF文書から印刷や手書きのテキストをスキャンし、それを機械読み取り可能なテキストに変換する技術です。 OCR (光学式文字認識)コンピュータが書籍、領収書、フォーム、写真などのさまざまな形式を識別できるようにし、PDFデータ抽出のためにデジタル化および自動化が可能になります。 それは画像内の文字やパターンを分析し、それらをテキストに対応させます。 この光学文字認識技術は、文書のデジタル化、自動PDFデータの抽出および入力、請求書処理、スキャンしたPDFを検索可能にするアプリケーションで使用されます。
OCRは劇的に進化し、テーブルやカラムなど、現代の複雑なレイアウト理解を伴う様々な言語を認識して読み取ることができます。 高度なOCR機能を持つソフトウェアは、画像の前処理技術も使用します。 それにはノイズ除去とコントラスト調整が含まれており、低品質な画像を読み取る際のOCRソフトウェアの精度を向上させます。 最も人気のあるOCRツールのうち3つは、Tesseract OCRエンジン、Power Automate、そして高精度かつ柔軟性を持つIronOCRです。 OCRは、企業、研究者、開発者が文書の管理やテキストの認識を外部委託するために不可欠なツールとなっています。
光学文字認識 byMicrosoft Power Automateこの機能を使用することで、企業は画像、スキャンした文書、およびPDFからテキストを抽出し、簡単に編集できる機械可読形式に自動化する能力を身につけることができます。 Microsoft Power Platformの一部であるPower Automateは、デスクトップおよびオンラインで、ユーザーが必ずしもコーディング能力を必要とせずにフローを作成する能力を提供します。 彼らは、ワークフローにOCRを統合することにより、面倒なデータ入力を自動化し、請求書を処理し、文書をデジタル化することができます。
壊れた画像 Pixabayから追加、ファイルから選択、またはここに画像をドラッグアンドドロップしてください。
これにより、彼らの時間を節約し、エラーを最小限に抑えることができます。 それは確かに強力な検索ツールであり、AI Builderを使用して構築されたPower AutomateのOCR機能で多くの異なるフォーマットと言語のサポートを提供するために使用でき、複数の業界でのテキスト認識の使用をサポートしています。 これはExcel、SharePoint、OneDriveを含む他のMicrosoftサービスとシームレスに統合され、ドキュメントのスキャンから、保存や共有に至るまで、エンドツーエンドの自動化を開始することができます。 この点において、組織は効率を向上させ、文書管理を合理化し、業務の正確性を高めることができます。
Power AutomateでOCRを実装することには、次の利点があります。
時間と労力の節約: ドキュメントのテキスト抽出の自動化により、手動でデータを入力する場合に消費される時間と労力を大幅に節約できます。
コスト効果: ユーザーフレンドリーでアクセスしやすいため、高価なカスタムソフトウェアソリューションの必要性はほとんど、またはまったくありません。
統合: Microsoft Power Automateは、SharePoint、OneDrive、Excelなど、他のMicrosoft 365サービスとのシームレスな統合を提供します。
スケーラビリティ: 一度に数千のドキュメントを処理できる能力により、その有用性は大規模な企業にとって適しています。
エラーの削減: データ入力プロセスを自動化することで、人為的なエラーが発生する可能性は最小限に抑えられます。
Power Automateは、AI BuilderやOneDriveを含むいくつかの異なる接続を通じてOCR機能をサポートしています。ここでは、Power Automateオンラインを取得する方法のステップバイステップガイド、またはPower Automateデスクトップを使用してOCR対応のワークフローを作成する方法を紹介します。
開始するには、Power Automate アカウントにログインするか、アカウントを持っていない場合はサインアップします。 Power AutomateはMicrosoft 365の一部であり、Office 365またはDynamics 365を使用している場合は既にアクセスできます。
壊れた画像 Pixabayから追加、ファイルから選択、またはここに画像をドラッグアンドドロップしてください。
「作成」タブを開き、「インスタント フロー」をクリックして手動で開始できる新しいフローを作成します。
壊れた画像 Pixabayから追加、ファイルから選択、またはここに画像をドラッグアンドドロップしてください。
フローに名前を付けてください。 たとえば、それを「承認前」と名付け、次のトリガーを選択します:フォルダーにファイルが作成されたとき。(SharePointまたはOneDrive)または手動でフローをトリガーします。
壊れた画像 Pixabayから追加、ファイルから選択、またはここに画像をドラッグアンドドロップしてください。
以下のような新しいPowerオートメーションフローが作成されました。
ドキュメントをアップロードするアクションを追加します(画像またはその他のPDFファイル)OneDrive for Business または SharePoint に。 このアクションは、データを抽出するためにOCRプロセスをトリガーします。 このデモでは、SharePoint ドキュメントライブラリを使用しています。
AI Builderを活用して、画像からテキストを抽出するアクションを開発します。 AI Builderは、Power Automateにおける機械学習の深く統合された機能であり、ユーザーが画像やPDFからテキストを簡単に識別できるようにする、事前にトレーニングされたOCRモデルを備えています。
テキストを抽出するための画像ファイルを選択します。
OCRで言語データがテキストとして抽出されると、それをさらに処理することができます。 例えば:
抽出したテキストを Excel形式で保存します: 行を追加する操作を使用して、抽出したテキストをExcelファイルに追加します。
テキストをメールで送信する: アクションを使用して、抽出したテキストを特定の受信者に転送するメールを送信します。
データベースに保存: コネクタを使用してデータをSQL Server、SharePointリスト、または他のデータベースにプッシュして保存します。
IronOCRは、画像、PDF、およびスキャンからOCRで正確にテキストを抽出する強力な.NET OCRライブラリです。 画質が悪い画像やノイズの多い画像で他のライブラリがテキスト認識に失敗する場合において、その効力を発揮します。また、125以上の言語をサポートしており、多様性のある多言語使用ケースに最適です。 IronOCRは、自動言語検出や画像前処理のノイズ除去、傾き補正など、多くの高度な機能をカプセル化しています。これは、すべてのスタイルや構造詳細、画像からテキストへの変換、PDFからテキストへの変換、検索可能なPDFを含む同じレイアウトのドキュメントのようです。
製品は、.NET プロジェクトの簡単な API を介して容易に組み込むことができ、開発者は開発するアプリケーションで OCR を活用できます。このライブラリは、ドキュメントのデジタル化、データ入力の自動化されたワークフロー、および高精度でスケーラブルなエンタープライズレベルのアプリケーション用のテキスト抽出タスクに便利です。 そのライブラリの強みは、使いやすさを発見し、強力なOCR機能を提供するときにあります。
.NETとの簡単な統合: シンプルなAPIをサポートしているため、.NETアプリケーションに簡単に統合でき、開発者が大規模な努力を払うことなくOCRの実装が容易になります。
OCR を実行するためのサンプルコード
using IronOcr;
class Program
{
static void Main(string[] args)
{
// Initialize Iron Tesseract OCR engine variable
var Ocr = new IronTesseract();
// Add multiple languages
Ocr.Language = OcrLanguage.English;
// Image file path
var inputFile = @"path\to\your\image.png";
// Read the image and perform OCR
using (var input = new OcrInput(inputFile))
{
// Perform OCR
var result = Ocr.Read(input);
// Display the result
Console.WriteLine("Text:");
Console.WriteLine(result.Text);
}
}
}
using IronOcr;
class Program
{
static void Main(string[] args)
{
// Initialize Iron Tesseract OCR engine variable
var Ocr = new IronTesseract();
// Add multiple languages
Ocr.Language = OcrLanguage.English;
// Image file path
var inputFile = @"path\to\your\image.png";
// Read the image and perform OCR
using (var input = new OcrInput(inputFile))
{
// Perform OCR
var result = Ocr.Read(input);
// Display the result
Console.WriteLine("Text:");
Console.WriteLine(result.Text);
}
}
}
Imports IronOcr
Friend Class Program
Shared Sub Main(ByVal args() As String)
' Initialize Iron Tesseract OCR engine variable
Dim Ocr = New IronTesseract()
' Add multiple languages
Ocr.Language = OcrLanguage.English
' Image file path
Dim inputFile = "path\to\your\image.png"
' Read the image and perform OCR
Using input = New OcrInput(inputFile)
' Perform OCR
Dim result = Ocr.Read(input)
' Display the result
Console.WriteLine("Text:")
Console.WriteLine(result.Text)
End Using
End Sub
End Class
IronOCRとPower Automate OCRの両方がテキスト認識に関して非常に強力であるにもかかわらず、IronOCRは開発者や企業がPower Automate OCRによってサポートされるシンプルなケースを超える本格的なOCR機能を必要とする場合に、はるかに堅牢で柔軟なソリューションを提供します。 対照的に、Power AutomateのOCRエンジンはシンプルなワークフローのために構築されており、追加のサブスクリプションが必要になる可能性があります。
対照的に、IronOCRは低品質の入力画像を扱う場合でも、非常に高品質な結果を提供する点で際立っています。 125以上の言語をサポートし、強力なフォーマットとレイアウトの保持が可能です。 その複雑なドキュメント処理と大規模なバッチ操作は、高度な画像前処理機能に適しています。 それでも、時には.NETアプリケーションで非常にカスタマイズ可能です。
Power Automate OCRは、より小規模なオートメーションやMicrosoftに厳密に構築された統合には十分ですが、IronOCRはユーザーが持つコントロール量、最大精度、さらには複数の形式をサポートする検索可能なPDF作成などの機能により、群を抜いて優れています。
プラットフォームの制約がなく、電力重視でカスタマイズ可能なOCRソリューションを求めている組織では、IronOCR. Iron Softwareは、開発者にさまざまな種類のライブラリを提供していますライブラリスイートページ詳細については。
10 の .NET API 製品 オフィス文書用