Windows 11でのOCR(無料のオンラインツール)
光学文字認識(OCR)はスキャンされたテキスト画像を標準テキストに変換し、文書分析で編集可能にします。 プログラムは形状、サイズ、および分布によって文字を認識します。 これを既知の文字の形状と分布と比較して文字を特定します。 OCRソフトウェアはあるファイル形式から異なるOCR技術を持たない形式に文書を変換できます。 OCRは任意の文書からテキストを機械読み取り可能なテキスト形式に変換し、編集可能なファイルで出力を提供します。
日常のOCRの使用例には、紙の文書をPDFや検索可能なテキストファイルに変換することが含まれ、例えばアーカイブ目的や電子書籍リーダーのようなモバイルデバイスでの閲覧に使用されます。 応用範囲は広大で、紙の文書をデジタルで読めるようにスキャンすることなどが含まれます。 アーカイブからの記録のデジタル化; 印刷された本や雑誌を電子書籍に変換すること; 時が経って読めなくなった古い証拠を解決することすらあります。この記事では、Windows 11でOCRを行う方法を説明します。
フォトスキャン:無料のOCRソフトウェア
フォトスキャンはWindows 11で利用できる無料のOCRソフトウェアです。Microsoftストアから無料でダウンロードできます。サードパーティのソース統合なしで、画像ファイルからテキストを抽出するのに役立つ光学文字認識技術が内蔵されています。
ファイルを選択したり、ドラッグ&ドロップでファイルを入れたり、クリップボードから画像を選択することで、コンピュータから写真を利用できます。 ワンクリックでテキストを抽出できます。 Microsoft Storeから簡単にダウンロードできます。

フォトスキャンアプリケーションを使ってOCRを実行する方法は次のとおりです:
- Windows 11でフォトスキャンアプリケーションを開きます。
- ソフトウェアを開くと、画像を取得するための3つのオプションが表示されます:
- 写真を参照する
- カメラを使用する
- クリップボードからの
- 上記のいずれかの方法を使用して、フォトスキャンアプリケーションに画像をアップロードします。
- 画像がアップロードされると、アプリケーションの右側に抽出されたテキストが表示されます。
PDF文書のOCRには、Adobe Acrobat Readerのオンライン版も使用できます。
オンラインOCRツール
光学文字認識ソフトウェアを使用して、Windowsのマシン上でローカルに実行する方法を確認しました。 オンラインでの実行方法を探ってみましょう。利用可能な最高の無料OCRソフトウェアをいくつか探求します。
DocSumo OCRツール
DocSumo オンラインOCRスキャナーは、スキャンされた文書をPDF、テキスト、Microsoft Wordなどのさまざまな形式に変換する必要があるユーザーに便利なツールです。 印刷された古い文書や手書きの文書を読みたい個人にも役立ちます。 DocSumo OCRツールを使用して画像ファイルやPDFファイルからテキストを抽出する方法を見てみましょう。
サポートされているブラウザでDocSumo OCRツールのウェブサイトを開きます。
"ファイルをアップロード"をクリックして、サポートされているファイル形式でファイルを選択します。 それはEPUB形式や任意のPDFファイルで可能です。DocSumoはほぼすべての形式をサポートしており、視覚的なデータを含むものです。

ファイルをアップロードすると、スキャンされた文書からテキストの処理を開始します。

処理が完了すると、抽出されたテキストファイルをダウンロードできます。編集可能なテキストファイルを取得します。

このようにして、DocSumo OCRツールを使用してテキストを抽出できます。
OCRConvert
OCRConvertは、物理的な文書をデジタル形式に変換するオンラインOCRツールです。 すべてのニーズに合ったプロフェッショナルかつ手頃なサービスを提供します。 OCRConvertは、古い資料をデジタル化し、ユーザーが世界中でアクセスし、検索し、共有できるワンストップショップです。
ソフトウェアは、紙文書のスキャン画像からテキストを抽出するために光学文字認識(OCR)技術を使用し、ユーザーにテキストのフォーマットを詳細に制御するオプションを提供します。 OCR変換は人為的なミスを解消し、正確性を向上させ、企業の情報管理戦略により価値と透明性をもたらします。
OCRConvertを使用してスキャンされた文書からテキストを抽出する方法を見てみましょう。
OCRConvertウェブサイトにアクセスします。

"ファイルを選択"をクリックし、希望するファイルを選択します。出力タイプを選択し、"変換"ボタンをクリックします。

クリックすると、アップロードしたファイルからテキストを抽出し始めます。
抽出されたテキストをダウンロードボタンをクリックしてダウンロードできます。

To-text.net
To-text.netは、PDFや画像をリアルタイムで編集可能なテキストに変換するのに役立つツールです。コンテンツの編集と変換を迅速かつ簡単にします。
To-text.netは、AIを使用してスキャンされた文書上のテキストを検出し、画面上にフォーマットされたテキストに変換する自動OCR(光学文字認識)技術を使用しています。 このツールは、PDFファイルを編集可能な文書に迅速に変換するためのもので、ダウンロードや他の場所への送信を必要としません。 大規模なデータを扱いたいと考える方にとっては、高性能のスキャナーやソフトウェアが不要で、このアプリを使用するのに最適な選択肢です。
OCRを実行する手順は次のとおりです:
- To-text.netのウェブサイトを開きます。
- デバイスから望ましいファイルをアップロードします。画像ファイルやPDFファイルで可能です。
- その後、出力言語を選択し、"変換"ボタンをクリックします。 スキャンされたPDFファイルの画像からデータを抽出し始めます。

変換後、テキストエディタに出力テキストが表示され、テキストファイルをダウンロードできます。
IronOCR: C#ライブラリ
IronOCR は、.NET開発者に人気のあるOCRライブラリです。 それは、画像化、デジタル化、および認識のためにリアルタイムで高い精度、迅速な処理、およびパフォーマンスを提供します。 IronOCRは2006年から画像データを処理する簡単な方法を提供してきました。ライブラリは、文書のスキャンを自動化することで文書のデジタル化を簡素化するソフトウェアコンポーネントです。 スキャン画像のOCR、文書の索引化、光学文字認識(OCR)など他のプロセスもサポートしています。
IronOCRライブラリは、C#APIでさまざまな業界で使用でき、マーケティングオートメーション、デジタル広告、ヘルスケアIT、公共事務、安全保障などに対応しています。 IronOCRライブラリを使用したコード例を見てみましょう:
コード例
using IronOCR;
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
// Add an image from which you want to extract text
Input.AddImage("Image.jpg");
// You can add any number of images
var Result = Ocr.Read(Input);
// Print extracted text to the console
Console.WriteLine(Result.Text);
}using IronOCR;
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
// Add an image from which you want to extract text
Input.AddImage("Image.jpg");
// You can add any number of images
var Result = Ocr.Read(Input);
// Print extracted text to the console
Console.WriteLine(Result.Text);
}修正済み社員データ

出力

ライセンス
IronOCRは開発目的で完全に無料です。 無料の試用版を利用することができます。 IronOCRは、さまざまなビジネスサイズに対応する3種類のライセンスオプションを提供しています。 1人の開発者、10人の開発者、または無制限の開発者向けのライセンスを選択できます。 Iron Softwareはまた、2つの価格で5つの製品を提供しています。 詳細はこのリンクで確認できます。







