Windows 11でのOCR(無料のオンラインツール)
光学式文字認識 (OCR) は、スキャンされたテキスト画像を、ドキュメント分析での編集用に標準テキストに変換します。 プログラムは文字の形状、サイズ、分布によって文字を認識します。 これらを既知の文字の形状や分布と比較して、文字を識別します。 OCR ソフトウェアは、基礎となる OCR テクノロジが同じでない可能性のあるファイル形式のドキュメントを別のファイル形式に変換できます。 OCR は、あらゆるドキュメントのテキストを機械が読み取り可能なテキスト形式に変換し、編集可能なファイルで出力します。
OCR の日常的な使用には、たとえばアーカイブ目的や電子書籍リーダーなどのモバイル デバイスでの表示のために、紙の文書を PDF または検索可能なテキスト ファイルに変換することが含まれます。 潜在的な用途は広範です。紙の文書をスキャンしてデジタルで読めるようにしたり、 アーカイブからの記録のデジタル化。 印刷された書籍や雑誌を電子書籍に変換すること。 時間の経過により判読不能となった古い証拠の犯罪解決にも役立ちます。この記事では、Windows 11でOCRを実行する方法について説明します。
写真スキャン:無料のOCRソフトウェア
Photo Scanは、Windows 11で利用できる無料のOCRソフトウェアです。Microsoft Storeから無料でダウンロードできます。光学式文字認識技術が組み込まれており、サードパーティのソースを統合することなく、画像ファイルからテキストを抽出できます。
ファイルを選択したり、ファイルをドラッグ アンド ドロップしたり、クリップボードから画像を選択したりすることで、コンピューターから写真を使用することができます。 マウスを 1 回クリックするだけでテキストを抽出できるようになります。 Microsoft Store から簡単にダウンロードできます。
Photo Scan アプリケーションを使用して OCR を実行する方法は次のとおりです。
- Windows 11 でフォトスキャン アプリケーションを開きます。
- ソフトウェアを開くと、画像を取得するための 3 つのオプションが表示されます。
- 写真を閲覧
- カメラを使用する
- クリップボードから
- 上記のいずれかの方法を使用して、写真をフォトスキャン アプリケーションにアップロードします。
- 写真をアップロードするとすぐに、抽出されたテキストがアプリケーションの右側に表示されます。
PDF ドキュメントの OCR にはオンラインの Adobe Acrobat Reader を使用することもできます。
オンラインOCRツール
光学式文字認識ソフトウェアを使用して Windows マシン上でローカルにこれを実行する方法について説明しました。 オンラインでどのように実行できるか見ていきましょう。利用可能な最高の無料OCRソフトウェアをいくつか紹介します。
DocSumo OCRツール
DocSumo オンライン OCR スキャナーは、スキャンしたドキュメントを PDF、テキスト、Microsoft Word などのさまざまな形式に変換する必要があるユーザーにとって便利なツールです。 また、古い印刷文書や手書き文書を読みたい人にとっても有益です。 DocSumo OCR ツールを使用して画像ファイルや PDF ファイルからテキストを抽出する方法を見てみましょう。
サポートされているブラウザで DocSumo OCR ツールの Web サイトを開きます。
"ファイルのアップロード"をクリックし、サポートされているファイル形式のファイルを選択します。 EPUB形式または任意のPDFファイルに対応しています。DocSumoは、視覚的な形式でデータを含むほぼすべての形式をサポートしています。
ファイルをアップロードすると、スキャンされたドキュメントからテキストの処理と抽出が開始されます。
処理が完了すると、抽出されたテキストファイルをダウンロードできるようになります。編集可能なテキストファイルが得られます。
このように、DocSumo OCR ツールを使用してテキストを抽出できます。
OCRConvert
OCRConvertは、物理的な文書をデジタル文書に変換するオンライン OCR ツールです。 あらゆるニーズに応えるプロフェッショナルで手頃なサービスを提供します。 OCRConvert は、古い資料をデジタル化し、世界中のユーザーが単語単位でアクセス、検索、共有できるようにしたいと考えているすべての人にとってワンストップショップです。
このソフトウェアは光学文字認識 (OCR) 技術を使用して、紙の文書のスキャンされた画像からテキストを抽出し、ユーザーにテキストの書式設定の側面に対する広範な制御を提供します。 OCR 変換は、人的エラーを排除し、精度を高め、企業の情報管理戦略にさらなる価値と透明性をもたらします。
OCRConvert を使用してスキャンした文書からテキストを抽出する方法を見てみましょう。
OCRConvert Web サイトにアクセスします。
"ファイルを選択"をクリックし、目的のファイルを選択します。出力形式を選択し、"変換"ボタンをクリックします。
クリックすると、アップロードされたファイルからテキストの抽出が開始されます。
ダウンロードボタンをクリックすると、抽出されたテキストをダウンロードできます。
To-text.net
To-text.netは、PDFや画像をリアルタイムで編集可能なテキストに変換できるツールです。コンテンツの編集と変換のプロセスを迅速かつ簡単にします。
To-text.net は、スキャンされた文書上のテキストを検出し、画面上でフォーマットされたテキストに変換する自動 OCR (光学文字認識) テクノロジーを使用して AI でテキストを認識します。 このツールは、PDF ファイルをダウンロードしたり、変換のために他の場所に送信したりすることなく、編集可能なドキュメントにすばやく変換するのに役立ちます。 このアプリを使用するのに高性能のスキャナーやソフトウェアは必要ないので、大量のデータを扱いたい人にとっても最適なオプションです。
OCR を実行するには、以下の手順に従います。
- To-text.net Web サイトを開きます。
- デバイスから必要なファイルをアップロードします。画像ファイルまたはPDFファイルです。
- その後、出力言語を選択し、"変換"ボタンをクリックします。 スキャンされた PDF ファイルの画像からデータの抽出を開始します。
変換後、テキスト エディターに出力テキストが表示され、テキスト ファイルをダウンロードできます。
IronOCR: C# ライブラリ
IronOCRは、.NET 開発者向けの人気の OCR ライブラリです。 イメージング、デジタル化、認識において、高精度、高速処理、リアルタイムのパフォーマンスを実現します。 IronOCR は 2006 年から画像データを簡単に処理する方法を提供してきました。このライブラリは、ドキュメントのスキャンを自動化することでドキュメントのデジタル化を簡素化するソフトウェア コンポーネントです。 また、スキャンした画像の OCR、ドキュメントのインデックス作成、光学文字認識 (OCR) などの他のプロセスもサポートしています。
IronOCR ライブラリは、マーケティング自動化、デジタル広告、ヘルスケア IT、広報、セキュリティなど、さまざまな業界で使用できる C# API です。 IronOCR ライブラリを使用するコード例を見てみましょう。
コード例
using IronOCR;
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
// Add an image from which you want to extract text
Input.AddImage("Image.jpg");
// You can add any number of images
var Result = Ocr.Read(Input);
// Print extracted text to the console
Console.WriteLine(Result.Text);
}
using IronOCR;
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
// Add an image from which you want to extract text
Input.AddImage("Image.jpg");
// You can add any number of images
var Result = Ocr.Read(Input);
// Print extracted text to the console
Console.WriteLine(Result.Text);
}
Imports IronOCR
Private Ocr = New IronTesseract()
Using Input = New OcrInput()
' Add an image from which you want to extract text
Input.AddImage("Image.jpg")
' You can add any number of images
Dim Result = Ocr.Read(Input)
' Print extracted text to the console
Console.WriteLine(Result.Text)
End Using
入力画像
出力
ライセンス
IronOCR は開発目的では完全に無料です。 無料トライアルをご利用いただけます。 IronOCR は、さまざまなビジネス規模に対応するために 3 種類のライセンス オプションを提供しています。 開発者 1 名、開発者 10 名、または開発者無制限のライセンスを選択できます。 Iron Software では、わずか 2 つの価格で 5 つの製品スイートも提供しています。 詳しい情報は、こちらのリンクからご覧いただけます。




