OCRツール

Windows 10でのOCR(無料オンラインツール)

公開済み 2022年10月30日
共有:

光学文字認識 (OCR)(OCR (光学式文字認識))テキストを機械可読形式に変換するプロセスです。 画像や文書をコンピューターにスキャンすると、画像ファイルとして保存されます。これにより、テキストエディターで画像ファイル内の単語を編集、検索、またはカウントすることが不可能になります。OCRは、システムが画像からテキストを抽出し、その内容を編集可能なテキストデータとして保存できるようにします。

ほとんどのビジネスワークフローは、印刷メディアを使用して情報を伝達することを含んでいます。 ドキュメントや画像をスキャンすることは、課題を生むことがあります。 OCR技術は、この問題を解決します。画像内のテキストをテキストデータに変換し、その後、他のビジネスソフトウェアで分析できるようにします。 このデータは、分析を実施し、業務を合理化し、プロセスを自動化し、生産性を向上させるために使用できます。

この記事では、ファイルを効率的に管理するために役立ついくつかの無料OCRプログラムを紹介します。

マイクロソフト OneNote: 最高の無料OCRソフトウェア

OneNoteは、すべてのメモ、リサーチ、計画、および情報を一箇所に保存するためのデジタルノートアプリです。 OneNoteはOptical Character Recognition(光学文字認識)をサポートしています。(OCR (光学式文字認識))、画像やファイルの印刷物からテキストを抽出するツール(PDF ドキュメントまたは Word ファイル)そして、単語を変更できるように、メモに貼り付けます。 名刺をスキャンしてOneNoteに情報をコピーするなどの操作を行うには素晴らしい方法です。 テキストを抽出した後、OneNoteやOutlook、Wordなどの他のプログラムに貼り付けることができます。 最新バージョンはMicrosoftストアからダウンロード可能であり、多くの場合、Windowsシステムにはすでにインストールされています。 これは、テキスト認識のための最高の無料OCRソフトウェアオプションの一つです。

Windows 10でのOCR、図1:OneNote OCR

単一の画像からテキストを抽出

  1. 画像を右クリックして、「画像からテキストをコピー」をクリックします。

  2. コピーしたテキストを貼り付けたい場所をクリックし、次に Ctrl+V を押してください。

複数ページのファイル印刷物の画像からテキストを抽出する

  1. 画像ファイルのいずれかを右クリックし、次のいずれかの操作を行ってください:

    • この印刷物のページからテキストをコピーをクリックして、現在選択されている画像からのみテキストをコピーします。(ページ).

    • すべての画像からテキストをコピーするには、全ページの印刷物からテキストをコピーをクリックしてください。(ページ).
  2. コピーしたテキストを貼り付けたい場所をクリックし、次に Ctrl+V を押してください。

オンラインOCRツール

私たちは先ほど、ローカルマシン上でMicrosoft OneNoteを使用して、OCR技術で画像ファイルからテキストを抽出する方法を見ました。次に、現在オンラインで利用可能なOCRソフトウェアを見てみましょう。

オンラインOCR

オンラインOCR は、クリーンでシンプルなデザインのプロフェッショナルなオンラインOCRサービスです。 このウェブサイトの外観は2009年に作成されたため、やや古いかもしれませんが、それによりOCR操作がユーザーにとって非常に簡単になります。

OnlineOCR は、スキャンされたPDFドキュメント、写真、およびデジタルカメラで撮影された画像を認識し、Word、TXT、Excelなどの編集可能なファイルに変換できます。 英語、スペイン語、日本語、中国語、韓国語など、46の異なる言語を認識できます。

Windows 10でのOCR、図2:OnlineOCR

OnlineOCRでOCR作業を完了するには、わずか3つの簡単なステップがあります。

ステップ 1. 「ファイル選択」ボタンをクリックして、PDFファイルまたはJPG、BMP、GIF、TIFF形式のスキャンドキュメントをアップロードします。 複数のファイルを一度にアップロードすることもできます。 注意: アップロード可能なファイルの最大サイズは15 MBです。

ステップ2. アップロードするファイルの言語を選択し、Word、Excel、TXTから出力フォーマットを選びます。

ステップ 3. ファイルの認識と変換を開始するには、「変換」をクリックします。

新しい OCR

もう一つの無料オンラインOCRツールは 新しい OCR、アップロードした画像ファイルやPDFドキュメントのテキストを解析し、コンピュータ上で簡単に編集できるテキストドキュメントに変換します。 すべてのユーザーは、登録の必要なく無制限のアップロードを楽しむことができます。 アップロードされたすべてのファイルはサーバーから削除されますので、ファイルのセキュリティについて心配する必要はありません。

Windows 10でのOCR、図3: NewOCR

まず、「ファイルを選択」をクリックして、デバイスから画像やスキャンした文書を追加し、「プレビュー」をクリックします。

次に、言語ボックスで一つまたは複数の認識言語を選択し、必要に応じて画像を回転させてください。 アップロードしたファイルに複数の列のテキストが含まれている場合、「ページレイアウト解析」タブにチェックを入れてテキストを列に分割してください。 最後に、「OCR」ボタンをクリックします。

Windows 10でのOCR、図4:NewOCR

認識されたテキストは、以下のテキストボックスに表示されます。 テキストをTXT、Word、またはPDF形式でダウンロードできます。

Windows 10におけるOCR、図5:NewOCR

コンバーティオ

コンバーティオ 現代的で魅力的なデザインの無料オンラインOCRサービスです。 無料の未登録ユーザーは最大10ページまで処理できます。 これらはPDFまたはWordファイルである場合があります。 スキャンしたPDFファイルも使用できます。もっと多くのページを認識する必要がある場合は、サービスを向上させるためにサインアップするだけです。

ConvertioでオンラインOCRを実行するには、次の3つの手順に従ってください。

ステップ 1. 「ファイルを選択」をクリックして、ローカルデバイス、Googleドライブ、Dropbox、またはウェブページからファイルを選択してアップロードしてください。 また、ファイルをページにドラッグして追加することもできます。

Windows 10でのOCR、図6:Convertio

コンバーティオ

ステップ 2 アップロードされたファイルで使用されている言語の中から1つまたは2つを選択します。次に、出力形式をWordドキュメント、Excelワークブック、PDFドキュメント、テキストファイルなど必要なものに設定します。「ページ番号」ボックスにページ範囲を入力することで、すべてのページを認識するか、特定のページのみを認識するかを選択できます。

Windows 10でのOCR、図7: Convertio OCR設定

Convertio OCR 設定

ステップ3. 認識と変換が完了すると、変換されたドキュメント内の抽出されたテキストのダウンロードリンクが上部に表示されます。希望する場所に保存するだけです。

Windows 10でのOCR、図8:ファイルをダウンロード中のConvertio

コンバーティオからファイルをダウンロードする

Convertioは、OCRオンラインサービスとして最も多くのオプションを提供しており、最良の無料オンラインOCRソフトウェアです。

IronOCR

IronOCR(IronOCR) は、高精度の光学文字認識 (Optical Character Recognition, OCR) ライブラリです。以下はその主な機能と利点です。

  • 高精度: IronOCR は、画像やPDFから文字情報を高精度で抽出します。複雑なフォントや手書き文字にも対応しています。
  • 多言語対応: IronOCR は、多数の言語に対応しており、グローバルなプロジェクトに最適です。
  • 簡単な統合: .NET アプリケーションに簡単に統合できるため、開発者の手間を大幅に削減します。
  • 豊富なフォーマットサポート: PDF、TIFF、JPG、PNG など、さまざまなファイル形式をサポートしています。
  • カスタマイズ可能な OCR 設定: パフォーマンスや精度を最適化するために、様々な設定を調整できます。

サポートされている開発プラットフォームには、.NET Framework、.NET Core、Xamarin などがあります。 IronOCR(IronOCR) は、開発者が迅速かつ効率的にOCR機能を統合するための強力なツールです。

さらに詳しい情報やデモ版のダウンロードは、公式ウェブサイト https://ironsoftware.com からご覧いただけます。

IronOCRは、スキャンされたドキュメントやPDFファイルからテキストを抽出する必要がある.NET開発者向けの人気のあるOCR技術ライブラリです。 画像処理、デジタル化、認識において高精度、迅速な処理、およびリアルタイムでの堅実なパフォーマンスを提供します。 このライブラリは、書類のスキャンを自動化することによって、書類のデジタル化を簡素化するソフトウェアコンポーネントです。 また、ドキュメントの索引作成や画像処理などの他のプロセスもサポートしています。

IronOCRは、不完全にスキャンされた画像や文書からデータを自動的に検出し、抽出する優れた能力を持っています。 IronTesseract クラスは、あらゆるプラットフォームにおいても、最も高度なTesseractのビルドを提供し、速度と精度が向上しています。

スキャンされた画像ファイルからテキストを抽出するコードサンプルを見てみましょう。

var Ocr = new IronTesseract();
using (var Input = new OcrInput()){
    Input.AddImage("test-files/redacted-employmentapp.png")
    //... you can add any number of images
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
var Ocr = new IronTesseract();
using (var Input = new OcrInput()){
    Input.AddImage("test-files/redacted-employmentapp.png")
    //... you can add any number of images
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
Dim Ocr = New IronTesseract()
Using Input = New OcrInput()
	Input.AddImage("test-files/redacted-employmentapp.png") var Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using
VB   C#

画像を入力してテキストを抽出

Windows 10でのOCR、図9:IronOCR、削除された従業員データ

修正済みの従業員データ

抽出されたテキスト出力

出力はクリーンで、わずか数行のコードで元の画像と一致し、完璧な出力が得られ、技術的な問題は発生しません。

Windows 10でのOCR、図10: IronOCR、画像出力

画像出力

ライセンス

IronOCRは開発目的で完全に無料です。 次に、この製品には独自の価格体系があります商用ライセンス. Liteライセンスバンドルは隠れた費用なしで $749 から始まります。 ユーザーはIronOCRを試用する際に、購入前に無料トライアルで試すことができます。 事業の規模に合ったパッケージを選択し、1人の開発者、10人の開発者、または無制限の開発者向けのライセンスをお選びください。

Iron Softwareは、全製品スイートを提供しています大幅割引. 詳細については、このページ

< 以前
中国語に最適なOCR(無料およびオンラインツール)
次へ >
エンタープライズOCRソフトウェア比較