フッターコンテンツにスキップ
OCRツール

Windows 10でのOCR(無料のオンラインツール)

光学式文字認識 (OCR) は、テキストの画像を機械が読み取り可能な形式に変換するプロセスです。 画像や文書をコンピュータにスキャンすると、画像ファイルとして保存されます。そのため、テキストエディタでは画像ファイル内の文字数を編集、検索、カウントすることはできません。OCRを使用すると、システムは画像からテキストを抽出し、その内容を編集可能なテキストデータとして保存できます。

ほとんどのビジネス ワークフローでは、印刷メディアを使用して情報を伝達します。 文書や画像をスキャンすると、問題が発生する可能性があります。 OCR テクノロジーは、テキスト画像を他のビジネス ソフトウェアで分析できるテキスト データに変換することでこの問題を解決します。 このデータは、分析の実行、業務の合理化、プロセスの自動化、生産性の向上に使用できます。

この記事では、ユーザーがファイルを効率的に管理するのに役立つ無料の OCR プログラムをいくつか紹介します。

Microsoft OneNote: 最高の無料OCRソフトウェア

OneNote は、すべてのメモ、調査、計画、情報を 1 か所に保存できるデジタル メモ作成アプリです。 OneNote は光学式文字認識(OCR) をサポートしています。これは、画像またはファイルの印刷物 (PDF ドキュメントまたは Word ファイル) からテキストを抽出し、それをノートに貼り付けて、単語を変更できるようにするツールです。 これは、スキャンした名刺から OneNote に情報をコピーするなどの操作を行うのに最適な方法です。 テキストを抽出した後、OneNote または Outlook や Word などの別のプログラムの別の場所に貼り付けることができます。 最新バージョンは Microsoft ストアからダウンロードでき、多くの場合 Windows システムに既にインストールされています。 これは、テキスト認識のための最高の無料 OCR ソフトウェア オプションの 1 つです。

OCR in Windows 10, Figure 1: OneNote OCR

一枚の写真からテキストを抽出する

  1. 画像を右クリックし、 [画像からテキストをコピー]をクリックします。
  2. コピーしたテキストを貼り付けたい場所をクリックし、Ctrl+V を押します。

複数ページのファイル印刷物の画像からテキストを抽出する

  1. いずれかの画像ファイルを右クリックし、次のいずれかを実行します。
    • 現在選択されている画像 (ページ) からのみテキストをコピーするには、[印刷物のこのページからテキストをコピー] をクリックします。
    • すべての画像 (ページ)からテキストをコピーするには、"印刷物のすべてのページからテキストをコピー"をクリックします。
  2. コピーしたテキストを貼り付けたい場所をクリックし、Ctrl+V を押します。

オンラインOCRツール

ローカルマシン上のMicrosoft OneNoteを使って、OCR技術を用いて画像ファイルからテキストを抽出する方法を見てきました。次に、現在オンラインで利用可能なOCRソフトウェアを見てみましょう。

オンラインOCR

OnlineOCR is a professional online OCR service with a clean and simple design. この Web サイトは 2009 年に作成されたため、外観は少し古く見えるかもしれませんが、これにより、ユーザーにとって OCR 操作が非常にシンプルになります。

OnlineOCR を使用すると、スキャンした PDF 文書、写真、デジタルカメラで撮影した画像を認識し、Word、TXT、Excel などの編集可能なファイルに変換できます。 認識できる言語は、英語、スペイン語、日本語、中国語、韓国語など 46 種類あります。

OCR in Windows 10, Figure 2: OnlineOCR

OnlineOCR で OCR ジョブを実行するには、3 つの簡単な手順を実行するだけです。

ステップ 1. "ファイルを選択"ボタンを押して、PDF ファイルまたは JPG、BMP、GIF、または TIFF 形式のスキャンされたドキュメントをアップロードします。 複数のファイルを一度にアップロードすることもできます。 注意: アップロードできるファイルの最大サイズは 15 MB です。

ステップ 2.アップロードするファイルの言語を選択し、Word、Excel、TXT から出力形式を選択します。

ステップ 3. "変換"をクリックして、ファイルの認識と変換を開始します。

新しいOCR

Another free online OCR tool is NewOCR, which can analyze the text in an image file or PDF document that you upload, and then convert it to a text document that can be edited easily on your computer. すべてのユーザーは登録を必要とせず、無制限にアップロードを楽しむことができます。 アップロードしたファイルはすべてサーバーから削除されるため、ファイルのセキュリティを心配する必要はありません。

OCR in Windows 10, Figure 3: NewOCR

まず、"ファイルを選択"をクリックしてデバイスから画像またはスキャンした文書を追加し、"プレビュー"をクリックします。

次に、言語ボックスで 1 つまたは複数の認識言語を選択し、必要に応じて画像を回転します。 アップロードしたファイルに複数列のテキストが含まれている場合は、"ページ レイアウト分析"タブにチェックを入れて、テキストを列に分割します。 最後に、"OCR"ボタンをクリックします。

OCR in Windows 10, Figure 4: NewOCR

認識されたテキストは下のテキスト ボックスに表示されます。 テキストはTXT、Word、またはPDF形式でダウンロードできます。

OCR in Windows 10, Figure 5: NewOCR

コンバーティオ

Convertio is a free online OCR service with a modern and attractive design. 無料の非登録ユーザーは最大 10 ページまで処理できます。 これらは PDF または Word ファイルになります。 スキャンしたPDFファイルもご利用いただけます。より多くのページを認識する必要がある場合は、サインアップしてより優れたサービスをご利用ください。

Convertio を使用してオンラインで OCR を実行するには、次の 3 つの手順に従います。

ステップ 1. "ファイルを選択"をクリックし、ローカル デバイス、Google ドライブ、Dropbox、または Web ページからファイルを選択してアップロードします。 ページにファイルをドラッグして追加することもできます。

OCR in Windows 10, Figure 6: Convertio

Convertio

ステップ 2 。 アップロードしたファイルで使用されている言語を1つまたは2つ選択します。次に、出力形式をWord文書、Excelワークブック、PDF文書、テキストファイルなど、ご希望の形式に設定します。"ページ番号"ボックスにページ範囲を入力することで、全ページを認識するか、特定のページのみを認識するかを選択できます。

OCR in Windows 10, Figure 7: Convertio OCR設定

Convertio OCR設定

ステップ3.認識と変換が完了すると、変換された文書内の抽出テキストのダウンロードリンクが上部に表示されます。ご希望の場所に保存してください。

OCR in Windows 10, Figure 8: Convertio Downloading Files

Convertioからファイルをダウンロードする

Convertio は OCR オンライン サービスとして最も多くのオプションを提供しており、最高の無料オンライン OCR ソフトウェアです。

IronOCR

IronOCR は、スキャンされたドキュメントや PDF ファイルからテキストを抽出する必要がある .NET 開発者向けの人気の OCR テクノロジ ライブラリです。 イメージング、デジタル化、認識において、高精度、高速処理、安定したリアルタイムパフォーマンスを実現します。 ライブラリは、ドキュメントのスキャンを自動化することでドキュメントのデジタル化を簡素化するソフトウェア コンポーネントです。 また、ドキュメントのインデックス作成や画像処理などの他のプロセスもサポートします。

IronOCRは、不完全にスキャンされた画像や文書からデータを自動的に検出し抽出するユニークな能力を持っています。 IronTesseract クラスは、あらゆるプラットフォーム上で知られている中で最も高度な Tesseract ビルドを提供し、速度と精度が向上しています。

スキャンした画像ファイルからテキストを抽出するコードサンプルを見てみましょう。

// Import the necessary IronOCR namespace
using IronOcr;

// Create an instance of the IronTesseract class
var Ocr = new IronTesseract();

using (var Input = new OcrInput())
{
    // Load the image file to perform OCR
    Input.AddImage("test-files/redacted-employmentapp.png");

    // Perform OCR to extract text from the image(s)
    var Result = Ocr.Read(Input);

    // Output the extracted text to the console
    Console.WriteLine(Result.Text);
}
// Import the necessary IronOCR namespace
using IronOcr;

// Create an instance of the IronTesseract class
var Ocr = new IronTesseract();

using (var Input = new OcrInput())
{
    // Load the image file to perform OCR
    Input.AddImage("test-files/redacted-employmentapp.png");

    // Perform OCR to extract text from the image(s)
    var Result = Ocr.Read(Input);

    // Output the extracted text to the console
    Console.WriteLine(Result.Text);
}
$vbLabelText   $csharpLabel

テキストを抽出するための入力画像

OCR in Windows 10, Figure 9: IronOCR, 編集された従業員データ

編集された従業員データ

抽出されたテキスト出力

出力はきれいで、わずか数行のコードで元の画像と一致し、完璧な出力に変換され、技術的な問題は発生しません。

OCR in Windows 10, Figure 10: IronOCR, 画像出力

画像出力

ライセンス

IronOCR は開発目的では完全に無料です。 また、商用ライセンスには独自の価格体系があります。 Liteバンドルは $799 から始まり、隠れた料金は一切ありません。 ユーザーは、無料トライアルを利用して、購入する前に IronOCR を本番環境で試すことができます。 開発者 1 名、開発者 10 名、または開発者無制限のライセンスを選択して、ビジネスの規模に合ったパッケージを選択してください。

Iron Software は、全製品を大幅割引価格で提供しています。 詳細はこのページをご覧ください

Kannaopat Udonpant
ソフトウェアエンジニア
ソフトウェアエンジニアになる前に、Kannapatは北海道大学で環境資源の博士号を修了しました。博士号を追求する間に、彼はバイオプロダクションエンジニアリング学科の一部である車両ロボティクスラボラトリーのメンバーになりました。2022年には、C#のスキルを活用してIron Softwareのエンジニアリングチームに参加し、IronPDFに注力しています。Kannapatは、IronPDFの多くのコードを執筆している開発者から直接学んでいるため、この仕事を大切にしています。同僚から学びながら、Iron Softwareでの働く社会的側面も楽しんでいます。コードやドキュメントを書いていない時は、KannapatはPS5でゲームをしたり、『The Last of Us』を再視聴したりしていることが多いです。

アイアンサポートチーム

私たちは週5日、24時間オンラインで対応しています。
チャット
メール
電話してね