透かしなしで本番環境でテストしてください。
必要な場所で動作します。
30日間、完全に機能する製品をご利用いただけます。
数分で稼働させることができます。
製品トライアル期間中にサポートエンジニアリングチームへの完全アクセス
光学文字認識は、画像、スキャンされた文書、およびPDF文書からテキストをスキャンして、機械で読み取れるテキストに変換する技術です。 OCRにより、コンピューターはさまざまな形式、つまり書籍、領収書、フォーム、写真を認識し、PDFデータ抽出のためにデジタル化および自動化することが可能です。 それは画像内の文字やパターンを分析し、それらをテキストに対応させます。 この光学文字認識技術は、文書のデジタル化、自動PDFデータの抽出および入力、請求書処理、スキャンしたPDFを検索可能にするアプリケーションで使用されます。
OCRは劇的に進化し、テーブルやカラムなど、現代の複雑なレイアウト理解を伴う様々な言語を認識して読み取ることができます。 高度なOCR機能を持つソフトウェアは、画像の前処理技術も使用します。 それにはノイズ除去とコントラスト調整が含まれており、低品質な画像を読み取る際のOCRソフトウェアの精度を向上させます。 最も人気のあるOCRツールのうち3つは、Tesseract OCRエンジン、Power Automate、そして高精度かつ柔軟性を持つIronOCRです。 OCRは、企業、研究者、開発者が文書の管理やテキストの認識を外部委託するために不可欠なツールとなっています。
Microsoft Power Automateによる光学文字認識: この機能を使用することで、企業は画像、スキャンされた文書、およびPDFからテキストを抽出し、それを簡単に編集可能で機械可読な形式に自動化する能力を備えることができます。 Microsoft Power Platformの一部であるPower Automateは、デスクトップおよびオンラインで、ユーザーが必ずしもコーディング能力を必要とせずにフローを作成する能力を提供します。 彼らは、ワークフローにOCRを統合することにより、面倒なデータ入力を自動化し、請求書を処理し、文書をデジタル化することができます。
-->これにより、彼らの時間を節約し、エラーを最小限に抑えることができます。 それは確かに強力な検索ツールであり、AI Builderを使用して構築されたPower AutomateのOCR機能で多くの異なるフォーマットと言語のサポートを提供するために使用でき、複数の業界でのテキスト認識の使用をサポートしています。 これはExcel、SharePoint、OneDriveを含む他のMicrosoftサービスとシームレスに統合され、ドキュメントのスキャンから、保存や共有に至るまで、エンドツーエンドの自動化を開始することができます。 この点において、組織は効率を向上させ、文書管理を合理化し、業務の正確性を高めることができます。
Power AutomateでOCRを実装することには、次の利点があります。
時間と労力の節約: ドキュメントのテキスト抽出の自動化は、手動でデータを入力する際に費やされる時間と労力を大幅に節約します。
コスト効率: ユーザーフレンドリーでアクセスしやすいため、高価なカスタムソフトウェアソリューションの必要性はほとんどないか、全くありません。
統合: Microsoft Power Automateは、SharePoint、OneDrive、Excelなどの他のMicrosoft 365サービスとシームレスに統合します。
スケーラビリティ: 一度に数千のドキュメントを処理できる能力は、その有効性により大企業に適しています。
エラーの削減: データ入力プロセスを自動化するため、人為的なエラーの発生の可能性が最小限に抑えられます。
Power Automateは、AI BuilderやOneDriveを含むいくつかの異なる接続を通じてOCR機能をサポートしています。ここでは、Power Automateオンラインを取得する方法のステップバイステップガイド、またはPower Automateデスクトップを使用してOCR対応のワークフローを作成する方法を紹介します。
開始するには、Power Automate アカウントにログインするか、アカウントを持っていない場合はサインアップします。 Power AutomateはMicrosoft 365の一部であり、Office 365またはDynamics 365を使用している場合は既にアクセスできます。
-->「作成」タブを開き、「インスタント フロー」をクリックして手動で開始できる新しいフローを作成します。
-->フローに名前を付けてください。 たとえば、それを「承認前」と名付け、次のトリガーを選択します。フォルダー(SharePointやOneDrive)にファイルが作成されたとき、またはフローを手動でトリガーします。
-->以下のような新しいPowerオートメーションフローが作成されました。
あなたのドキュメント(画像またはその他のPDFファイル)をOneDrive for BusinessまたはSharePointにアップロードするアクションを追加します。 このアクションは、データを抽出するためにOCRプロセスをトリガーします。 このデモでは、SharePoint ドキュメントライブラリを使用しています。
AI Builderを活用して、画像からテキストを抽出するアクションを開発します。 AI Builderは、Power Automateにおける機械学習の深く統合された機能であり、ユーザーが画像やPDFからテキストを簡単に識別できるようにする、事前にトレーニングされたOCRモデルを備えています。
テキストを抽出するための画像ファイルを選択します。
OCRで言語データがテキストとして抽出されると、それをさらに処理することができます。 例えば:
抽出したテキストを Excel 形式で保存します: 「行の追加」アクションを使用して、抽出したテキストをExcelファイルに追加します。
テキストをメールで送信する: 抽出されたテキストを特定の受信者に転送するために、電子メールを送信するアクションを使用します。
データベースに保存: コネクタを使用してデータをSQL Server、SharePointリスト、または他のデータベースに格納します。
IronOCRは、画像、PDF、およびスキャンからOCRを使ってテキストを正確に抽出できる強力な.NET OCRライブラリです。 画質が悪い画像やノイズの多い画像で他のライブラリがテキスト認識に失敗する場合において、その効力を発揮します。また、125以上の言語をサポートしており、多様性のある多言語使用ケースに最適です。 IronOCRは、自動言語検出や画像前処理のノイズ除去、傾き補正など、多くの高度な機能をカプセル化しています。これは、すべてのスタイルや構造詳細、画像からテキストへの変換、PDFからテキストへの変換、検索可能なPDFを含む同じレイアウトのドキュメントのようです。
製品は、.NET プロジェクトの簡単な API を介して容易に組み込むことができ、開発者は開発するアプリケーションで OCR を活用できます。このライブラリは、ドキュメントのデジタル化、データ入力の自動化されたワークフロー、および高精度でスケーラブルなエンタープライズレベルのアプリケーション用のテキスト抽出タスクに便利です。 そのライブラリの強みは、使いやすさを発見し、強力なOCR機能を提供するときにあります。
.NETとの簡単な統合: シンプルなAPIをサポートしているため、.NETアプリケーションに簡単に統合できます。これにより、開発者が大規模な作業を必要とせずにOCRを簡単に実装するメカニズムが提供されます。
OCRを実行するサンプルコード
using IronOcr;
class Program
{
static void Main(string[] args)
{
// Initialize Iron Tesseract OCR engine variable
var Ocr = new IronTesseract();
// Add multiple languages
Ocr.Language = OcrLanguage.English;
// Image file path
var inputFile = @"path\to\your\image.png";
// Read the image and perform OCR
using (var input = new OcrInput(inputFile))
{
// Perform OCR
var result = Ocr.Read(input);
// Display the result
Console.WriteLine("Text:");
Console.WriteLine(result.Text);
}
}
}
using IronOcr;
class Program
{
static void Main(string[] args)
{
// Initialize Iron Tesseract OCR engine variable
var Ocr = new IronTesseract();
// Add multiple languages
Ocr.Language = OcrLanguage.English;
// Image file path
var inputFile = @"path\to\your\image.png";
// Read the image and perform OCR
using (var input = new OcrInput(inputFile))
{
// Perform OCR
var result = Ocr.Read(input);
// Display the result
Console.WriteLine("Text:");
Console.WriteLine(result.Text);
}
}
}
Imports IronOcr
Friend Class Program
Shared Sub Main(ByVal args() As String)
' Initialize Iron Tesseract OCR engine variable
Dim Ocr = New IronTesseract()
' Add multiple languages
Ocr.Language = OcrLanguage.English
' Image file path
Dim inputFile = "path\to\your\image.png"
' Read the image and perform OCR
Using input = New OcrInput(inputFile)
' Perform OCR
Dim result = Ocr.Read(input)
' Display the result
Console.WriteLine("Text:")
Console.WriteLine(result.Text)
End Using
End Sub
End Class
IronOCRとPower Automate OCRの両方がテキスト認識に関して非常に強力であるにもかかわらず、IronOCRは開発者や企業がPower Automate OCRによってサポートされるシンプルなケースを超える本格的なOCR機能を必要とする場合に、はるかに堅牢で柔軟なソリューションを提供します。 対照的に、Power AutomateのOCRエンジンはシンプルなワークフローのために構築されており、追加のサブスクリプションが必要になる可能性があります。
対照的に、IronOCRは低品質の入力画像を扱う場合でも、非常に高品質な結果を提供する点で際立っています。 125以上の言語をサポートし、強力なフォーマットとレイアウトの保持が可能です。 その複雑なドキュメント処理と大規模なバッチ操作は、高度な画像前処理機能に適しています。 それでも、時には.NETアプリケーションで非常にカスタマイズ可能です。
Power Automate OCRは、より小規模なオートメーションやMicrosoftに厳密に構築された統合には十分ですが、IronOCRはユーザーが持つコントロール量、最大精度、さらには複数の形式をサポートする検索可能なPDF作成などの機能により、群を抜いて優れています。
プラットフォームの制約がなく、パワークリティカルでカスタマイズ可能なOCRソリューションを求めている組織には、IronOCR。 Iron Softwareは、さまざまな種類のライブラリを開発者に提供しています。詳細についてはライブラリスイートページをチェックしてください。