OCRツール

Windows 11でのOCR(無料オンラインツール)

公開済み 2022年6月9日
共有:

光学文字認識 (OCR)(OCR (光学式文字認識))文書分析において、スキャンされたテキスト画像を編集可能な標準テキストに変換します。 プログラムは、文字の形、大きさ、および配置によって文字を識別します。 既知の文字形状および分布とこれらを比較して、文字を識別します。 OCRソフトウェアは、異なるOCR技術を持たない可能性があるファイル形式から別の形式に文書を変換できます。 OCRは、任意のドキュメントからテキストを機械可読形式に変換し、編集可能なファイルとして出力します。

OCRの毎日の利用例として、紙のドキュメントをPDFや検索可能なテキストファイルに変換することが挙げられます。例えば、アーカイブのためや、電子書籍リーダーのようなモバイルデバイスで閲覧するために使用されます。 潜在的な応用は幅広いです。紙の書類をスキャンしてデジタルで読むことができるようにするなどの用途があります。 アーカイブから記録をデジタル化する 印刷された書籍や雑誌を電子書籍に変換すること; 時間の経過によって読み取れなくなった古い証拠を解決する犯罪捜査も含めて。この記事では、Windows 11でOCRを行う方法について説明します。

Photo Scan: 無料OCRソフトウェア

Photo Scanは、Windows 11向けの無料OCRソフトウェアです。Microsoftストアで無料で入手できます。 それには、サードパーティのソースの統合なしに画像ファイルからテキストを抽出するのに役立つ、すでに組み込まれた光学式文字認識技術が備わっています。

コンピューターからファイルを選択する、ファイルをドラッグ&ドロップする、クリップボードから画像を選択することで、写真を使用することができます。 ワンクリックするだけでテキストを抽出することができます。 簡単にMicrosoft ストアからダウンロードできます。

Ocr In Windows 11 1 related to Photo Scan: 無料OCRソフトウェア

Photo Scanアプリケーションを使用してOCRを行う方法を見てみましょう。

  • Windows 11でフォトスキャンアプリケーションを開きます。
  • ソフトウェアを開いた後、画像を取得するための3つのオプションが表示されます。

    • 写真を閲覧

    • カメラを使用
  • クリップボードから
  • 上記のいずれかの方法を使用して、写真スキャンアプリケーションに写真をアップロードしてください。
  • 画像がアップロードされると、アプリケーションの右側に抽出されたテキストが表示されます。

    PDFドキュメントのOCRには、オンラインのAdobe Acrobat Readerも使用できます。

オンラインOCRツール

私たちは、光学文字認識ソフトウェアを使用して、Windowsマシン上でローカルにそれを実行する方法を見てきました。 オンラインでどうやるか見てみましょう。利用可能な最高の無料OCRソフトウェアのいくつかを探索します。

DocSumo OCRツール

ドコモオンラインOCR スキャナーは、スキャンしたドキュメントをPDF、テキスト、Microsoft Wordなどの異なる形式に変換する必要があるユーザーにとって便利なツールです。 古い印刷物や手書きの文書を読みたい方にも有益です。 画像ファイルやPDFファイルからテキストを抽出するために、DocSumo OCRツールをどのように使用できるかを見てみましょう。

対応するブラウザでDocSumo OCRツールのウェブサイトを開きます。

「ファイルをアップロード」をクリックし、サポートされている任意のファイル形式のファイルを選択してください。 それはepub形式または任意のPDFファイルであることができます。DocSumoは、視覚的な形でデータを含むほとんどすべての形式をサポートします。

Ocr In Windows 11 2 related to DocSumo OCRツール

ファイルをアップロードするとすぐに、処理が開始され、スキャンされた編集可能なドキュメントからテキストが抽出されます。

Ocr In Windows 11 3 related to DocSumo OCRツール

プロセス完了後、抽出したテキストファイルをダウンロードできるようになります。編集可能なテキストファイルが手に入ります。

Ocr In Windows 11 4 related to DocSumo OCRツール

では、DocSumo OCR ツールを使用してテキストを抽出する方法は次の通りです。

OCRConvert

オーシーアールコンバート

OCRConvert 物理文書をデジタル文書に変換するオンラインのOCRツールです。 それは、すべてのニーズに対応するプロフェッショナルで手頃なサービスを提供します。 OCRConvertは、古い資料をデジタル化し、単語ごとに読み取り可能、検索可能、共有可能にしたい全てのユーザーにとって一元的なソリューションです。

ソフトウェアは光学文字認識を使用します(OCR (光学式文字認識))スキャンされた紙文書の画像からテキストを抽出し、テキストのフォーマット面を完全に制御する技術。 OCR変換のプロセスは、人為的なエラーを排除し、精度を向上させることで、企業の情報管理戦略により多くの価値と透明性をもたらします。

スキャンしたドキュメントからテキストを抽出する方法をOCRConvertを使用して見てみましょう。

OCRConvertのウェブサイトにアクセスしてください。

Ocr In Windows 11 5 related to OCRConvert

ファイルを選択をクリックして、希望のファイルを選択します。出力タイプを選択し、変換ボタンをクリックします。

Ocr In Windows 11 6 related to OCRConvert

アップロードされたファイルからテキストの抽出を開始します。

抽出されたテキストをダウンロードボタンをクリックしてダウンロードすることができます。

Ocr In Windows 11 7 related to OCRConvert

To-text.net

To-text.net

To-text.netは、PDFや画像をリアルタイムで編集可能なテキストに変換するツールです。このツールを使用すると、コンテンツの編集と変換のプロセスが迅速かつ容易に行えます。

To-text.netは、AIを使用して自動OCRでテキストを認識します。(光学文字認識)スキャンされたドキュメントのテキストを検出し、画面上にフォーマットされたテキストに変換する技術。 このツールは、PDFファイルをダウンロードしたり、他の場所に送信して変換する必要なく、迅速に編集可能なドキュメントに変換したい方にとって有益です。 大量のデータを扱いたい方にも最適なオプションです。このアプリを使用するのに、高性能スキャナーや特別なソフトウェアは必要ありません。OCRを実行するには、以下の手順に従ってください:

To-text.netのウェブサイトを開いてください。

デバイスから目的のファイルをアップロードしてください。それは画像ファイルでもPDFファイルでも構いません。

その後、出力言語を選択して、変換ボタンをクリックします。 スキャンしたPDFファイルの画像からデータの抽出を開始します。

Ocr In Windows 11 8 related to OCRConvert

変換後、テキストエディタで出力テキストを確認し、テキストファイルをダウンロードできます。

IronOCR: C#ライブラリ

IronOCR は、.NET開発者に人気のOCRライブラリです。 それは、高精度、高速処理、リアルタイムでのパフォーマンスを提供し、イメージング、デジタル化、および認識を行います。 IronOCRは2006年から画像データを簡単に処理する手段を提供しています。このライブラリは、ドキュメントスキャンを自動化することにより、ドキュメントのデジタル化を簡素化するソフトウェアコンポーネントです。 また、スキャンされた画像のOCR、ドキュメントのインデックス作成、および光学文字認識などの他のプロセスもサポートしています。(OCR (光学式文字認識)).

IronOCRライブラリは、マーケティングオートメーション、デジタル広告、ヘルスケアIT、公共関係およびセキュリティなど、さまざまな業界で使用できるC# APIです。 IronOCRライブラリを使用したコード例を見てみましょう:

コード例

var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    Input.AddImage(" Image.jpg");
    //... you can add any number of images
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    Input.AddImage(" Image.jpg");
    //... you can add any number of images
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}
Dim Ocr = New IronTesseract()
Using Input = New OcrInput()
	Input.AddImage(" Image.jpg")
	'... you can add any number of images
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using
VB   C#

入力画像

Ocr In Windows 11 9 related to 入力画像

出力

Ocr In Windows 11 10 related to 出力

ライセンス

IronOCRは開発目的で完全に無料です。 無料試用版を利用できます。 IronOCRは3種類のライセンスを提供しています。 お客様の事業規模に応じて購入することができます。1人の開発者、10人の開発者、または無制限の開発者を選択することができます。 Iron Softwareは、2つの価格で5つのIron Software製品を提供するスイートも提供しています。 このお得な情報を手に入れましょう! 詳細についてはこちらをご覧ください リンク.

< 以前
Tesseract Ocr を Windows で使用する (コード例チュートリアル)