透かしなしで本番環境でテストしてください。
必要な場所で動作します。
30日間、完全に機能する製品をご利用いただけます。
数分で稼働させることができます。
製品トライアル期間中にサポートエンジニアリングチームへの完全アクセス
光学文字認識(OCR)は、テキストの画像を機械が読み取れる形式に変換するプロセスです。 画像や文書をコンピューターにスキャンすると、画像ファイルとして保存されます。これにより、テキストエディターで画像ファイル内の単語を編集、検索、またはカウントすることが不可能になります。OCRは、システムが画像からテキストを抽出し、その内容を編集可能なテキストデータとして保存できるようにします。
ほとんどのビジネスワークフローは、印刷メディアを使用して情報を伝達することを含んでいます。 ドキュメントや画像をスキャンすることは、課題を生むことがあります。 OCR技術は、この問題を解決します。画像内のテキストをテキストデータに変換し、その後、他のビジネスソフトウェアで分析できるようにします。 このデータは、分析を実施し、業務を合理化し、プロセスを自動化し、生産性を向上させるために使用できます。
この記事では、ファイルを効率的に管理するために役立ついくつかの無料OCRプログラムを紹介します。
OneNoteは、すべてのメモ、リサーチ、計画、および情報を一箇所に保存するためのデジタルノートアプリです。 OneNoteは、画像やファイルの印刷 (PDFドキュメントやWordファイル) からテキストを抽出してノートに貼り付け、単語を変更できるようにするツールである光学式文字認識 (OCR) をサポートしています。 名刺をスキャンしてOneNoteに情報をコピーするなどの操作を行うには素晴らしい方法です。 テキストを抽出した後、OneNoteやOutlook、Wordなどの他のプログラムに貼り付けることができます。 最新バージョンはMicrosoftストアからダウンロード可能であり、多くの場合、Windowsシステムにはすでにインストールされています。 これは、テキスト認識のための最高の無料OCRソフトウェアオプションの一つです。
画像を右クリックし、画像からテキストをコピーをクリックします。
Ctrl+V
を押します。画像ファイルのいずれかを右クリックし、次のいずれかの操作を行ってください:
印刷物のこのページからテキストをコピーをクリックすると、現在選択されている画像(ページ)からのみテキストをコピーします。
Ctrl+V
を押します。私たちは先ほど、ローカルマシン上でMicrosoft OneNoteを使用して、OCR技術で画像ファイルからテキストを抽出する方法を見ました。次に、現在オンラインで利用可能なOCRソフトウェアを見てみましょう。
[OnlineOCR](https://www.onlineocr.net/" target="_blank" rel="nofollow noopener noreferrer) は、クリーンでシンプルなデザインを持つプロフェッショナルなオンラインOCRサービスです。 このウェブサイトの外観は2009年に作成されたため、やや古いかもしれませんが、それによりOCR操作がユーザーにとって非常に簡単になります。
OnlineOCR は、スキャンされたPDFドキュメント、写真、およびデジタルカメラで撮影された画像を認識し、Word、TXT、Excelなどの編集可能なファイルに変換できます。 英語、スペイン語、日本語、中国語、韓国語など、46の異なる言語を認識できます。
OnlineOCRでOCR作業を完了するには、わずか3つの簡単なステップがあります。
ステップ 1. 「ファイルを選択」ボタンをクリックして、PDFファイルまたはJPG、BMP、GIF、TIFF形式のスキャン済みドキュメントをアップロードします。 複数のファイルを一度にアップロードすることもできます。 注意: アップロード可能なファイルの最大サイズは15 MBです。
ステップ 2. アップロードするファイルの言語を選択し、Word、Excel、TXTから出力形式を選択します。
ステップ 3. 「変換」をクリックして、ファイルの認識と変換を開始します。
もう一つの無料オンラインOCRツールは[](https://www.newocr.com/" target="_blank" rel="nofollow noopener noreferrer)NewOCRです。これはアップロードした画像ファイルまたはPDFドキュメント内のテキストを解析し、その後コンピュータで簡単に編集できるテキストドキュメントに変換します。 すべてのユーザーは、登録の必要なく無制限のアップロードを楽しむことができます。 アップロードされたすべてのファイルはサーバーから削除されますので、ファイルのセキュリティについて心配する必要はありません。
まず、「ファイルを選択」をクリックして、デバイスから画像やスキャンした文書を追加し、「プレビュー」をクリックします。
次に、言語ボックスで一つまたは複数の認識言語を選択し、必要に応じて画像を回転させてください。 アップロードしたファイルに複数の列のテキストが含まれている場合、「ページレイアウト解析」タブにチェックを入れてテキストを列に分割してください。 最後に、「OCR」ボタンをクリックします。
認識されたテキストは、以下のテキストボックスに表示されます。 テキストをTXT、Word、またはPDF形式でダウンロードできます。
[Convertio](https://convertio.co/ocr/" target="_blank" rel="nofollow noopener noreferrer) は、モダンで魅力的なデザインの無料オンライン OCR サービスです。 無料の未登録ユーザーは最大10ページまで処理できます。 これらはPDFまたはWordファイルである場合があります。 スキャンしたPDFファイルも使用できます。もっと多くのページを認識する必要がある場合は、サービスを向上させるためにサインアップするだけです。
ConvertioでオンラインOCRを実行するには、次の3つの手順に従ってください。
ステップ 1. 「ファイルを選択」をクリックして、ローカルデバイス、Google ドライブ、Dropbox またはウェブページからファイルを選択してアップロードします。 また、ファイルをページにドラッグして追加することもできます。
コンバーティオ
ステップ2 アップロードされたファイルで使用されている言語の中から1つまたは2つを選択します。次に、出力形式をWordドキュメント、Excelワークブック、PDFドキュメント、テキストファイルなど必要なものに設定します。「ページ番号」ボックスにページ範囲を入力することで、すべてのページを認識するか、特定のページのみを認識するかを選択できます。
Convertio OCR 設定
ステップ 3. 認識と変換が完了すると、変換されたドキュメントに抽出されたテキストのダウンロードリンクが上部に表示されます。お好みの場所に保存してください。
コンバーティオからファイルをダウンロードする
Convertioは、OCRオンラインサービスとして最も多くのオプションを提供しており、最良の無料オンラインOCRソフトウェアです。
IronOCR は、スキャンされたドキュメントやPDFファイルからテキストを抽出する必要がある .NET 開発者向けの人気のあるOCR技術ライブラリです。 画像処理、デジタル化、認識において高精度、迅速な処理、およびリアルタイムでの堅実なパフォーマンスを提供します。 このライブラリは、書類のスキャンを自動化することによって、書類のデジタル化を簡素化するソフトウェアコンポーネントです。 また、ドキュメントの索引作成や画像処理などの他のプロセスもサポートしています。
IronOCRは、不完全にスキャンされた画像や文書からデータを自動的に検出し、抽出する優れた能力を持っています。 IronTesseract
クラスは、どのプラットフォームでも他に類を見ない最先端のTesseractのビルドを提供し、速度と精度が向上しています。
スキャンされた画像ファイルからテキストを抽出するコードサンプルを見てみましょう。
var Ocr = new IronTesseract();
using (var Input = new OcrInput()){
Input.AddImage("test-files/redacted-employmentapp.png")
//... you can add any number of images
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
var Ocr = new IronTesseract();
using (var Input = new OcrInput()){
Input.AddImage("test-files/redacted-employmentapp.png")
//... you can add any number of images
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Dim Ocr = New IronTesseract()
Using Input = New OcrInput()
Input.AddImage("test-files/redacted-employmentapp.png") var Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
修正済みの従業員データ
出力はクリーンで、わずか数行のコードで元の画像と一致し、完璧な出力が得られ、技術的な問題は発生しません。
画像出力
IronOCRは開発目的で完全に無料です。 また、商用ライセンスには独自の価格設定が用意されています。 Liteバンドルは隠れた料金なしで$749から始まります。 ユーザーはIronOCRを試用する際に、購入前に無料トライアルで試すことができます。 事業の規模に合ったパッケージを選択し、1人の開発者、10人の開発者、または無制限の開発者向けのライセンスをお選びください。