OCRツール

Windows 10でのOCR(無料オンラインツール)

Kannaopat Udonpant
カンナパット・ウドンパント
2022年10月30日
共有:

光学文字認識(OCR)は、テキストの画像を機械が読み取れる形式に変換するプロセスです。 画像や文書をコンピューターにスキャンすると、画像ファイルとして保存されます。これにより、テキストエディターで画像ファイル内の単語を編集、検索、またはカウントすることが不可能になります。OCRは、システムが画像からテキストを抽出し、その内容を編集可能なテキストデータとして保存できるようにします。

ほとんどのビジネスワークフローは、印刷メディアを使用して情報を伝達することを含んでいます。 ドキュメントや画像をスキャンすることは、課題を生むことがあります。 OCR技術は、この問題を解決します。画像内のテキストをテキストデータに変換し、その後、他のビジネスソフトウェアで分析できるようにします。 このデータは、分析を実施し、業務を合理化し、プロセスを自動化し、生産性を向上させるために使用できます。

この記事では、ファイルを効率的に管理するために役立ついくつかの無料OCRプログラムを紹介します。

マイクロソフト OneNote: 最高の無料OCRソフトウェア

OneNoteは、すべてのメモ、リサーチ、計画、および情報を一箇所に保存するためのデジタルノートアプリです。 OneNoteは、画像やファイルの印刷 (PDFドキュメントやWordファイル) からテキストを抽出してノートに貼り付け、単語を変更できるようにするツールである光学式文字認識 (OCR) をサポートしています。 名刺をスキャンしてOneNoteに情報をコピーするなどの操作を行うには素晴らしい方法です。 テキストを抽出した後、OneNoteやOutlook、Wordなどの他のプログラムに貼り付けることができます。 最新バージョンはMicrosoftストアからダウンロード可能であり、多くの場合、Windowsシステムにはすでにインストールされています。 これは、テキスト認識のための最高の無料OCRソフトウェアオプションの一つです。

Windows 10でのOCR、図1:OneNote OCR

単一の画像からテキストを抽出

  1. 画像を右クリックし、画像からテキストをコピーをクリックします。

  2. コピーしたテキストを貼り付けたい場所をクリックし、次にCtrl+Vを押します。

複数ページのファイル印刷物の画像からテキストを抽出する

  1. 画像ファイルのいずれかを右クリックし、次のいずれかの操作を行ってください:

    • 印刷物のこのページからテキストをコピーをクリックすると、現在選択されている画像(ページ)からのみテキストをコピーします。

    • プリントアウトのすべてのページからテキストをコピーをクリックして、すべての画像(ページ)からテキストをコピーします。
  2. コピーしたテキストを貼り付けたい場所をクリックし、次にCtrl+Vを押します。

オンラインOCRツール

私たちは先ほど、ローカルマシン上でMicrosoft OneNoteを使用して、OCR技術で画像ファイルからテキストを抽出する方法を見ました。次に、現在オンラインで利用可能なOCRソフトウェアを見てみましょう。

オンラインOCR

[OnlineOCR](https://www.onlineocr.net/" target="_blank" rel="nofollow noopener noreferrer) は、クリーンでシンプルなデザインを持つプロフェッショナルなオンラインOCRサービスです。 このウェブサイトの外観は2009年に作成されたため、やや古いかもしれませんが、それによりOCR操作がユーザーにとって非常に簡単になります。

OnlineOCR は、スキャンされたPDFドキュメント、写真、およびデジタルカメラで撮影された画像を認識し、Word、TXT、Excelなどの編集可能なファイルに変換できます。 英語、スペイン語、日本語、中国語、韓国語など、46の異なる言語を認識できます。

Windows 10でのOCR、図2:OnlineOCR

OnlineOCRでOCR作業を完了するには、わずか3つの簡単なステップがあります。

ステップ 1. 「ファイルを選択」ボタンをクリックして、PDFファイルまたはJPG、BMP、GIF、TIFF形式のスキャン済みドキュメントをアップロードします。 複数のファイルを一度にアップロードすることもできます。 注意: アップロード可能なファイルの最大サイズは15 MBです。

ステップ 2. アップロードするファイルの言語を選択し、Word、Excel、TXTから出力形式を選択します。

ステップ 3. 「変換」をクリックして、ファイルの認識と変換を開始します。

新しい OCR

もう一つの無料オンラインOCRツールは[](https://www.newocr.com/" target="_blank" rel="nofollow noopener noreferrer)NewOCRです。これはアップロードした画像ファイルまたはPDFドキュメント内のテキストを解析し、その後コンピュータで簡単に編集できるテキストドキュメントに変換します。 すべてのユーザーは、登録の必要なく無制限のアップロードを楽しむことができます。 アップロードされたすべてのファイルはサーバーから削除されますので、ファイルのセキュリティについて心配する必要はありません。

Windows 10でのOCR、図3: NewOCR

まず、「ファイルを選択」をクリックして、デバイスから画像やスキャンした文書を追加し、「プレビュー」をクリックします。

次に、言語ボックスで一つまたは複数の認識言語を選択し、必要に応じて画像を回転させてください。 アップロードしたファイルに複数の列のテキストが含まれている場合、「ページレイアウト解析」タブにチェックを入れてテキストを列に分割してください。 最後に、「OCR」ボタンをクリックします。

Windows 10でのOCR、図4:NewOCR

認識されたテキストは、以下のテキストボックスに表示されます。 テキストをTXT、Word、またはPDF形式でダウンロードできます。

Windows 10におけるOCR、図5:NewOCR

コンバーティオ

[Convertio](https://convertio.co/ocr/" target="_blank" rel="nofollow noopener noreferrer) は、モダンで魅力的なデザインの無料オンライン OCR サービスです。 無料の未登録ユーザーは最大10ページまで処理できます。 これらはPDFまたはWordファイルである場合があります。 スキャンしたPDFファイルも使用できます。もっと多くのページを認識する必要がある場合は、サービスを向上させるためにサインアップするだけです。

ConvertioでオンラインOCRを実行するには、次の3つの手順に従ってください。

ステップ 1. 「ファイルを選択」をクリックして、ローカルデバイス、Google ドライブ、Dropbox またはウェブページからファイルを選択してアップロードします。 また、ファイルをページにドラッグして追加することもできます。

Windows 10でのOCR、図6:Convertio

コンバーティオ

ステップ2 アップロードされたファイルで使用されている言語の中から1つまたは2つを選択します。次に、出力形式をWordドキュメント、Excelワークブック、PDFドキュメント、テキストファイルなど必要なものに設定します。「ページ番号」ボックスにページ範囲を入力することで、すべてのページを認識するか、特定のページのみを認識するかを選択できます。

Windows 10でのOCR、図7: Convertio OCR設定

Convertio OCR 設定

ステップ 3. 認識と変換が完了すると、変換されたドキュメントに抽出されたテキストのダウンロードリンクが上部に表示されます。お好みの場所に保存してください。

Windows 10でのOCR、図8:ファイルをダウンロード中のConvertio

コンバーティオからファイルをダウンロードする

Convertioは、OCRオンラインサービスとして最も多くのオプションを提供しており、最良の無料オンラインOCRソフトウェアです。

IronOCR

IronOCR は、スキャンされたドキュメントやPDFファイルからテキストを抽出する必要がある .NET 開発者向けの人気のあるOCR技術ライブラリです。 画像処理、デジタル化、認識において高精度、迅速な処理、およびリアルタイムでの堅実なパフォーマンスを提供します。 このライブラリは、書類のスキャンを自動化することによって、書類のデジタル化を簡素化するソフトウェアコンポーネントです。 また、ドキュメントの索引作成や画像処理などの他のプロセスもサポートしています。

IronOCRは、不完全にスキャンされた画像や文書からデータを自動的に検出し、抽出する優れた能力を持っています。 IronTesseractクラスは、どのプラットフォームでも他に類を見ない最先端のTesseractのビルドを提供し、速度と精度が向上しています。

スキャンされた画像ファイルからテキストを抽出するコードサンプルを見てみましょう。

var Ocr = new IronTesseract();
using (var Input = new OcrInput()){
    Input.AddImage("test-files/redacted-employmentapp.png")
    //... you can add any number of images
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
var Ocr = new IronTesseract();
using (var Input = new OcrInput()){
    Input.AddImage("test-files/redacted-employmentapp.png")
    //... you can add any number of images
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
Dim Ocr = New IronTesseract()
Using Input = New OcrInput()
	Input.AddImage("test-files/redacted-employmentapp.png") var Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

画像を入力してテキストを抽出

Windows 10でのOCR、図9:IronOCR、削除された従業員データ

修正済みの従業員データ

抽出されたテキスト出力

出力はクリーンで、わずか数行のコードで元の画像と一致し、完璧な出力が得られ、技術的な問題は発生しません。

Windows 10でのOCR、図10: IronOCR、画像出力

画像出力

ライセンス

IronOCRは開発目的で完全に無料です。 また、商用ライセンスには独自の価格設定が用意されています。 Liteバンドルは隠れた料金なしで$749から始まります。 ユーザーはIronOCRを試用する際に、購入前に無料トライアルで試すことができます。 事業の規模に合ったパッケージを選択し、1人の開発者、10人の開発者、または無制限の開発者向けのライセンスをお選びください。

Iron Softwareは、その製品スイート全体を大幅割引で提供しています。 詳細はこのページをご覧ください

Kannaopat Udonpant
カンナパット・ウドンパント
ソフトウェアエンジニア
ソフトウェアエンジニアになる前に、カンナパットは日本の北海道大学から環境資源学の博士号を取得しました。学位を取得する過程で、カンナパットはバイオプロダクション工学部に所属する車両ロボティクス研究所のメンバーにもなりました。2022年には、C#のスキルを活かしてIron Softwareのエンジニアリングチームに参加し、IronPDFに注力しています。カンナパットは、IronPDFで使用されているコードの大部分を作成した開発者から直接学べることに価値を見いだしています。同僚との学び合いに加えて、Iron Softwareで働くことの社会的側面も楽しんでいます。コードやドキュメントを書いていない時には、カンナパットは通常、PS5でゲームをしたり、『The Last of Us』を再視聴したりしています。
< 以前
中国語に最適なOCR(無料およびオンラインツール)
次へ >
エンタープライズOCRソフトウェア比較