ライブ環境でテストする
ウォーターマークなしで本番環境でテストしてください。
必要な場所でいつでも動作します。
光学文字認識 (OCR)(OCR (光学式文字認識))ソフトウェアはC#開発者や大企業にとって不可欠なツールとなっており、スキャンされたドキュメント、画像、またはPDFを迅速かつ正確に編集可能で検索可能なテキストに変換することを可能にします。 Windows 10には、多種多様なOCRソフトウェアオプションがあり、それぞれのオプションには独自の機能、長所、短所があります。 この記事では、Windows 10向けの最良のOCRソフトウェアソリューションを探り、C#開発者向けの強力なOCRライブラリであるIronOCRを紹介します。
ABBYY ファインリーダーは、さまざまなドキュメント形式からテキストを認識する際の卓越した精度で広く認識されている強力な無料のOCRソフトウェアです。 このソフトウェアは、ドキュメントスキャン、画像処理、およびテキスト認識など、幅広い機能を提供しており、C#開発者や大手企業がドキュメント管理プロセスを効率化するための理想的な選択肢となります。
ABBYY FineReaderを使用すると、ユーザーはスキャンされたドキュメント、PDF、およびデジタル画像をWord、Excel、PDFなどの検索可能で編集可能なファイルに簡単に変換できます。 ソフトウェアは高度なOCR技術を使用して、低品質のスキャンや複雑なレイアウトのドキュメントでも、テキスト、表、グラフィックスを正確に認識します。
ABBYY FineReaderの使用を開始するには、ソフトウェアをダウンロードしてインストールしてください。 アプリケーションを開き、スキャンしたいドキュメント形式を選択します。 ファイルをインポートし、言語を選択して、『認識』ボタンをクリックします。 OCRプロセスが完了したら、必要に応じて出力を編集して保存します。
Adobe Acrobat Pro DC(アドビ アクロバット プロ DC)人気のあるPDF管理ツールであり、組み込みのOCRを含む幅広い機能を提供しています。(光学文字認識)関数 このソフトウェアは、PDFドキュメントの作成、編集、および管理のオールインワンソリューションを求める個人および大企業の両方を対象に設計されています。
Acrobat Pro DCは、Adobe Document Cloudソフトウェアスイートの一部です。 PDFの作成および編集、さまざまなファイル形式をPDFに変換、さらには複数のPDFを1つのドキュメントに結合するための高度なツールを提供します。 このソフトウェアは、直感的なユーザーインターフェースと包括的なPDF編集ツールも提供しており、ユーザーは文書のテキスト、画像、その他の要素を追加、削除、修正することができます。
Adobe Acrobat Pro DCに搭載されているOCR機能により、ユーザーはスキャンしたドキュメントや画像からテキストを認識し、それを編集可能で検索可能なPDFに変換できます。 Adobe Acrobat Pro DCで使用されているOCR技術は非常に高精度であり、英語、フランス語、スペイン語などのさまざまな言語のテキストを認識できます。
リーダーアイリスは強力で多用途なOCRソフトウェアであり、高品質なテキスト認識を提供し、広範なファイル形式をサポートします。 これは個人ユーザーと大企業の両方に対応しており、さまざまなドキュメントタイプを処理し、効果的にスケールできるOCRソリューションを探しているC#開発者にとって最適な選択肢です。
Readirisの主要な機能の一つは、高精度でスキャンされたドキュメント、画像、およびPDFファイルからテキストを認識する能力です。 ソフトウェアは、中国語、日本語、および韓国語などの複数の言語をサポートし、複雑なレイアウトやフォントを扱うことができます。 したがって、OCRスキャナーとして機能することができます。
Readirisは、PDF、DOCX、XLSX、およびHTMLを含む複数のファイル形式を出力形式としてサポートしており、ユーザーは自分のニーズに最適な出力形式を選択することができます。 このソフトウェアは、ナビゲートしやすくカスタマイズが簡単なユーザーフレンドリーなインターフェースも提供しており、すべてのレベルの専門知識を持つユーザーにとって理想的な選択肢です。
IronOCR強力なOCRです(光学文字認識)C#開発者向けに特別に設計されたライブラリ。 高性能のOCR機能を提供し、.NETアプリケーションとのシームレスな統合を実現するため、大企業がアプリケーションやワークフローにカスタムOCRソリューションを組み込む場合に最適な選択です。
それには高度なOCRエンジンが搭載されており、紙の書類、PDF、画像などさまざまなドキュメントタイプからのテキスト認識において高い精度と速度を提供します。 には以上のサポートがあります120言語以下の内容を日本語に翻訳してください:
Asian 言語、中国語、日本語、韓国語などを含む。
IronOCRは.NETアプリケーションと簡単に統合できるように設計されており、開発者が迅速に開始できるように包括的なドキュメントとサンプルコードを提供しています。 また、様々なカスタマイズオプションを提供しており、開発者は特定のニーズに応じてカスタムOCRプロセスを設定し、OCR設定を構成し、カスタムワークフローを作成することができます。 IronOCRは、複数のフォーマットおよび複数の言語に対応した入力をサポートしています。
IronOCRは、さらに高度な機能も提供します。バーコード読み取り画像処理、およびテキスト抽出, 開発者がより堅牢で効率的なアプリケーションを作成するのに役立ちます。 IronOCRは、プレーンテキスト、検索可能なPDF、およびMicrosoft Wordドキュメントを含むさまざまな出力形式にエクスポートできます。
C# プロジェクトで IronOCR を使用するには、まず IronOCR NuGet パッケージをインストールします:
Install-Package IronOcr
パッケージをインストールした後、以下のサンプルコードを使用して、画像やスキャンされたドキュメントに対してOCRを実行することができます:
using IronOcr;
var ocr = new IronTesseract();
using (var input = new OcrInput()) {
input.AddImage("attachment.png");
input.AddPdf("report.pdf");
OcrResult result = ocr.Read(input);
string text = result.Text;
}
using IronOcr;
var ocr = new IronTesseract();
using (var input = new OcrInput()) {
input.AddImage("attachment.png");
input.AddPdf("report.pdf");
OcrResult result = ocr.Read(input);
string text = result.Text;
}
Imports IronOcr
Private ocr = New IronTesseract()
Using input = New OcrInput()
input.AddImage("attachment.png")
input.AddPdf("report.pdf")
Dim result As OcrResult = ocr.Read(input)
Dim text As String = result.Text
End Using
コードの最初の行は、OCRに必要なクラスおよびメソッドが含まれているIronOcr
名前空間をインポートします。
次に、IronTesseractクラスの新しいインスタンスが作成され、変数 ocr
に格納されます。 IronTesseract
は、高度なOCR機能を提供するクラスであり、マルチスレッドのサポートと自動画像補正が含まれています。
その後、using
ステートメントを使用してOcrInput
クラスの新しいインスタンスを作成します。これは、OCRプロセスの入力を定義するために使用されます。 using ブロック内で、2 つのファイルが AddImage
メソッドと AddPdf
メソッドを使用して入力オブジェクトに追加されます。 これらのファイルは、それぞれ「attachment.png」と「report.pdf」です。
ファイルを追加した後、IronTesseract
オブジェクトのRead
メソッドが呼び出され、引数としてOcrInput
オブジェクトが渡されます。 このメソッドは入力ファイルに対してOCRプロセスを実行し、OCR出力を含むOcrResult
オブジェクトを返します。
最後に、OCR出力は OcrResult
オブジェクトから抽出され、「text」変数に格納されます。この変数は入力ファイルから抽出されたテキストを含む文字列です。 IronOCRライブラリが提供する豊富な機能を使用して、OCRプロセスをさらにカスタマイズし、結果を操作することができます。
Windows 10向けの最適なOCRソフトウェアを選択するには、特定の要件、予算、および技術的な専門知識に依存します。ABBYY FineReader、Adobe Acrobat Pro DCおよびReadirisは、スタンドアロンのOCRアプリケーションを求めている大企業にとってすべて優れた選択肢です。 ただし、C#および.NETプロジェクトにシームレスに統合できる強力なOCRライブラリが必要な場合、IronOCRは最適な選択です。
9つの .NET API製品 オフィス文書用