OCRツール

Windows 11でのOCR（無料オンラインツール）

Name: IronOCR
Brand: Iron Software
Availability: InStock
Rating: 4.86 (101 reviews)

カンナパット・ウドンパント

2022年6月9日

共有:

光学文字認識（OCR）は、スキャンされたテキスト画像をドキュメント分析で編集するための標準的なテキストに変換します。プログラムは、文字の形、大きさ、および配置によって文字を識別します。既知の文字形状および分布とこれらを比較して、文字を識別します。 OCRソフトウェアは、異なるOCR技術を持たない可能性があるファイル形式から別の形式に文書を変換できます。 OCRは、任意のドキュメントからテキストを機械可読形式に変換し、編集可能なファイルとして出力します。

OCRの毎日の利用例として、紙のドキュメントをPDFや検索可能なテキストファイルに変換することが挙げられます。例えば、アーカイブのためや、電子書籍リーダーのようなモバイルデバイスで閲覧するために使用されます。潜在的な応用は幅広いです。紙の書類をスキャンしてデジタルで読むことができるようにするなどの用途があります。アーカイブから記録をデジタル化する印刷された書籍や雑誌を電子書籍に変換すること; 時間の経過によって読み取れなくなった古い証拠を解決する犯罪捜査も含めて。この記事では、Windows 11でOCRを行う方法について説明します。

Photo Scan: 無料OCRソフトウェア

Photo Scanは、Windows 11向けの無料OCRソフトウェアです。Microsoftストアで無料で入手できます。それには、サードパーティのソースの統合なしに画像ファイルからテキストを抽出するのに役立つ、すでに組み込まれた光学式文字認識技術が備わっています。

コンピューターからファイルを選択する、ファイルをドラッグ＆ドロップする、クリップボードから画像を選択することで、写真を使用することができます。ワンクリックするだけでテキストを抽出することができます。簡単にMicrosoft ストアからダウンロードできます。

Photo Scanアプリケーションを使用してOCRを行う方法を見てみましょう。

Windows 11でフォトスキャンアプリケーションを開きます。
ソフトウェアを開いた後、画像を取得するための3つのオプションが表示されます。
- 写真を閲覧
- カメラを使用
クリップボードから
上記のいずれかの方法を使用して、写真スキャンアプリケーションに写真をアップロードしてください。
画像がアップロードされると、アプリケーションの右側に抽出されたテキストが表示されます。

PDFドキュメントのOCRには、オンラインのAdobe Acrobat Readerも使用できます。

オンラインOCRツール

私たちは、光学文字認識ソフトウェアを使用して、Windowsマシン上でローカルにそれを実行する方法を見てきました。オンラインでどうやるか見てみましょう。利用可能な最高の無料OCRソフトウェアのいくつかを探索します。

DocSumo OCRツール

[Docomo Online OCR](https://docsumo.com/free-tools/online-ocr-scanner" target="_blank" rel="nofollow noopener noreferrer) スキャナーは、スキャンした文書をPDF、テキスト、Microsoft Wordなどの異なる形式に変換する必要があるユーザーにとって便利なツールです。古い印刷物や手書きの文書を読みたい方にも有益です。画像ファイルやPDFファイルからテキストを抽出するために、DocSumo OCRツールをどのように使用できるかを見てみましょう。

対応するブラウザでDocSumo OCRツールのウェブサイトを開きます。

「ファイルをアップロード」をクリックし、サポートされている任意のファイル形式のファイルを選択してください。それはepub形式または任意のPDFファイルであることができます。DocSumoは、視覚的な形でデータを含むほとんどすべての形式をサポートします。

ファイルをアップロードするとすぐに、処理が開始され、スキャンされた編集可能なドキュメントからテキストが抽出されます。

プロセス完了後、抽出したテキストファイルをダウンロードできるようになります。編集可能なテキストファイルが手に入ります。

では、DocSumo OCR ツールを使用してテキストを抽出する方法は次の通りです。

OCRConvert

[OCRConvert](https://www.ocrconvert.com/" target="_blank" rel="nofollow noopener noreferrer)は、物理的な文書をデジタル文書に変換するオンラインOCRツールです。それは、すべてのニーズに対応するプロフェッショナルで手頃なサービスを提供します。 OCRConvertは、古い資料をデジタル化し、単語ごとに読み取り可能、検索可能、共有可能にしたい全てのユーザーにとって一元的なソリューションです。

このソフトウェアは、光学文字認識（OCR）技術を使用して紙の文書のスキャン画像からテキストを抽出し、テキストの書式設定の側面をユーザーが完全に制御できるようにします。 OCR変換のプロセスは、人為的なエラーを排除し、精度を向上させることで、企業の情報管理戦略により多くの価値と透明性をもたらします。

スキャンしたドキュメントからテキストを抽出する方法をOCRConvertを使用して見てみましょう。

OCRConvertのウェブサイトにアクセスしてください。

ファイルを選択をクリックして、希望のファイルを選択します。出力タイプを選択し、変換ボタンをクリックします。

アップロードされたファイルからテキストの抽出を開始します。

抽出されたテキストをダウンロードボタンをクリックしてダウンロードすることができます。

To-text.net

To-text.netは、PDFや画像をリアルタイムで編集可能なテキストに変換するツールです。このツールを使用すると、コンテンツの編集と変換のプロセスが迅速かつ容易に行えます。

To-text.netは、AIを使用して自動OCR（光学文字認識）技術でテキストを認識し、スキャンされたドキュメントのテキストを検出して画面上のフォーマットされたテキストに変換します。このツールは、PDFファイルをダウンロードしたり、他の場所に送信して変換する必要なく、迅速に編集可能なドキュメントに変換したい方にとって有益です。大量のデータを扱いたい方にも最適なオプションです。このアプリを使用するのに、高性能スキャナーや特別なソフトウェアは必要ありません。OCRを実行するには、以下の手順に従ってください:

To-text.netのウェブサイトを開いてください。

デバイスから目的のファイルをアップロードしてください。それは画像ファイルでもPDFファイルでも構いません。

その後、出力言語を選択して、変換ボタンをクリックします。スキャンしたPDFファイルの画像からデータの抽出を開始します。

変換後、テキストエディタで出力テキストを確認し、テキストファイルをダウンロードできます。

IronOCR: C#ライブラリ

IronOCR は、.NET 開発者に人気のある OCR ライブラリです。それは、高精度、高速処理、リアルタイムでのパフォーマンスを提供し、イメージング、デジタル化、および認識を行います。 IronOCRは2006年から画像データを簡単に処理する手段を提供しています。このライブラリは、ドキュメントスキャンを自動化することにより、ドキュメントのデジタル化を簡素化するソフトウェアコンポーネントです。また、スキャンされた画像のOCR、ドキュメントのインデックス作成、光学式文字認識（OCR）などの他のプロセスもサポートしています。

IronOCRライブラリは、マーケティングオートメーション、デジタル広告、ヘルスケアIT、公共関係およびセキュリティなど、さまざまな業界で使用できるC# APIです。 IronOCRライブラリを使用したコード例を見てみましょう：

コード例

var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    Input.AddImage(" Image.jpg");
    //... you can add any number of images
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}

var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
    Input.AddImage(" Image.jpg");
    //... you can add any number of images
    var Result = Ocr.Read(Input);
    Console.WriteLine(Result.Text);
}

Dim Ocr = New IronTesseract()
Using Input = New OcrInput()
	Input.AddImage(" Image.jpg")
	'... you can add any number of images
	Dim Result = Ocr.Read(Input)
	Console.WriteLine(Result.Text)
End Using

$vbLabelText $csharpLabel

入力画像

出力

ライセンス

IronOCRは開発目的で完全に無料です。無料試用版を利用できます。 IronOCRは3種類のライセンスを提供しています。お客様の事業規模に応じて購入することができます。1人の開発者、10人の開発者、または無制限の開発者を選択することができます。 Iron Softwareは、2つの価格で5つのIron Software製品を提供するスイートも提供しています。このお得情報を手に入れよう！詳細情報は、このリンクをご覧ください。

カンナパット・ウドンパント

今すぐエンジニアリングチームとチャット

ソフトウェアエンジニア

ソフトウェアエンジニアになる前に、カンナパットは日本の北海道大学から環境資源学の博士号を取得しました。学位を取得する過程で、カンナパットはバイオプロダクション工学部に所属する車両ロボティクス研究所のメンバーにもなりました。2022年には、C#のスキルを活かしてIron Softwareのエンジニアリングチームに参加し、IronPDFに注力しています。カンナパットは、IronPDFで使用されているコードの大部分を作成した開発者から直接学べることに価値を見いだしています。同僚との学び合いに加えて、Iron Softwareで働くことの社会的側面も楽しんでいます。コードやドキュメントを書いていない時には、カンナパットは通常、PS5でゲームをしたり、『The Last of Us』を再視聴したりしています。

< 以前
Tesseract Ocr を Windows で使用する (コード例チュートリアル)