透かしなしで本番環境でテストしてください。
必要な場所で動作します。
30日間、完全に機能する製品をご利用いただけます。
数分で稼働させることができます。
製品トライアル期間中にサポートエンジニアリングチームへの完全アクセス
多くの人々は「OCRスクリーンショットとは何か?」と疑問に思うかもしれません。他の人々は、テキストのスクリーンショットをデジタルテキスト編集可能な形式、または.txtや.doc形式に変換する方法について疑問に思うかもしれません。 以下のような方であれば、これ以上心配する必要はありません。私たちがそのための完璧なソリューションを提供します。
この記事では、スクリーンショットに対してOCR(光学文字認識)を行うための様々なツールについて説明します。
多くのOCRツールがありますが、今日はIronOCRを使用してスクリーンショットからテキストを抽出します。
IronOCRは、C#およびVB.NETプログラミング言語向けのソフトウェアライブラリであり、開発者がアプリケーションにOCR(光学文字認識)機能を追加できるように設計されています。 このライブラリを使用して画像内のテキストを認識し、それを機械可読テキストに変換することができます。 ライブラリは、最も正確なOCRエンジンの一つとされるTesseract OCRエンジンに基づいて構築されています。
IronOCRは、PNG、JPG、TIFF、PDFを含むさまざまなファイル形式の画像からテキストを読み取るために使用できます。 また、IronOCRは複数の言語を認識する機能や、回転や歪んだ画像からのテキスト認識機能など、テキスト認識に関する高度な機能の幅広い提供も行っています。 さらに、開発者はIronOCRを使用して、OCR機能を迅速にアプリケーションに統合できます。IronOCRは、C#やVB.NETコードから呼び出すことができるシンプルで使いやすいAPIを提供しています。 IronOCRを使用すると、OCR言語を選択し、画像、デジタルPDFファイル、スキャンされたPDFファイルに対してOCRを実行できます。
IronOCRは、アプリケーションにOCR機能を追加したい開発者にとって良いオプションと見なされています。 オープンソースで、使いやすく統合しやすく、高速で正確、最新のOCR技術に対応しています。
IronOCRは、開発者が自分のアプリケーションにOCR機能を統合するのを支援する幅広い機能を提供します。 IronOCRの主な機能には以下が含まれます:
多言語サポート: IronOCRは、英語、スペイン語、ドイツ語、フランス語、イタリア語、中国語を含む60以上の言語でテキストを認識できます。
テキストの向きの自動検出: IronOCRは、画像が回転または傾斜している場合でも、画像内のテキストの向きを自動的に検出できます。
幅広い画像フォーマットのサポート: IronOCRは、PNG、JPG、TIFF、およびPDFなど、多くの異なるファイルフォーマットの画像からテキストを読み取ることができます。
カスタマイズ可能な認識設定:開発者は、特定のタイプの画像や使用ケースに対して認識精度を向上させるために、認識設定をカスタマイズできます。
複数ページのスキャン文書やPDFからテキストを認識する機能。
高速認識と高精度: IronOCRは、最も正確で広く使用されているOCRエンジンの1つであるTesseract OCRエンジンを使用しています。
使いやすいAPI: IronOCRは、C#やVB.NETコードから呼び出すことができるシンプルで使いやすいAPIを提供しており、OCR機能をあらゆるアプリケーションに簡単に統合できます。
全体として、IronOCRは、開発者が自分のアプリケーションにOCR機能を追加するのを助ける幅広い機能を提供する強力なツールです。
Visual Studioを開き、ファイルメニューに移動します。 「新しいプロジェクト」を選択し、その後に「コンソールアプリケーション」を選択します。
プロジェクト名を入力し、適切なテキストボックスにパスを選択してください。 次に、「Create」ボタンをクリックします。 以下のスクリーンショットのように、必要な .NET フレームワークを選択してください。
Visual Studioで新しいプロジェクトを作成
Visual Studioプロジェクトは、これからコンソールアプリケーションの構造を生成します。 完了すると、program.cs
ファイルが開かれ、その中でソースコードの記述と実行が可能になります。
Visual Studioの新しいプロジェクトウィザードから生成されたprogram.csファイル
これで、IronOCRライブラリを追加してプログラムをテストすることができます。
Visual Studioでは、C#プロジェクトにIronOCRを簡単に統合することができます。
IronOCRは、C# .NETプロジェクトに統合するための複数のプロセスを提供します。 ここでは、そのうちの1つを取り上げます:NuGetパッケージマネージャーを使用してIronOCRをインストールする方法について。
Visual Studioで、ツール > NuGet パッケージ マネージャー > パッケージ マネージャー コンソールに移動します。
NuGet パッケージ マネージャー UI
クリックすると、Visual Studioのウィンドウの下に新しいコンソールが表示されます。 コンソールに以下のコマンドを入力し、Enterキーを押してください。
Install-Package IronOcr
IronOCRは数秒でインストールされます。
IronOCRは、スクリーンショットからテキストを認識するために使用できる強力なOCRライブラリです。 IronOCRを使用すると、テキストのスクリーンショットを撮り、その後ライブラリのOCR機能を使用してスクリーンショット内のテキストをデジタルで編集可能な形式に変換することができます。 以下は、C#でIronOCRを使用してスクリーンショットに対してOCRを実行する方法の例です。 スクリーンショット OCR を実行するには、スクリーンショットをキャプチャし、以下のコードを実行して任意の出力形式にテキストを抽出するだけです。
using IronOcr;
using System;
string imageText = new IronTesseract().Read("ocr.png").Text;
Console.WriteLine(imageText);
using IronOcr;
using System;
string imageText = new IronTesseract().Read("ocr.png").Text;
Console.WriteLine(imageText);
Imports IronOcr
Imports System
Private imageText As String = (New IronTesseract()).Read("ocr.png").Text
Console.WriteLine(imageText)
入力に使用されるサンプルスクリーンショット
- IRONOCR for NET
- The C# OCR Library
- OCR for C# to scan and read images & PDFs
- NET OCR library with 127+ global language packs
- Output as text, structured data, or searchable PDFs
- Supports NET 6, 5, Core, Standard, Framework
IronOCRを使用すると、画像内の特定のゾーンでOCRを実行できます。 画像に複数のテキスト領域が含まれている場合、特定の領域内のテキストのみを認識したいときに役立ちます。 以下にその例のコードを示します。
using IronOcr;
using IronSoftware.Drawing;
using System;
var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput())
{
var contentArea = new CropRectangle(x: 0, y: 0, width: 350, height: 150);
ocrInput.AddImage("ocr.png", contentArea);
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
}
using IronOcr;
using IronSoftware.Drawing;
using System;
var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput())
{
var contentArea = new CropRectangle(x: 0, y: 0, width: 350, height: 150);
ocrInput.AddImage("ocr.png", contentArea);
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
}
Imports IronOcr
Imports IronSoftware.Drawing
Imports System
Private ocrTesseract = New IronTesseract()
Using ocrInput As New OcrInput()
Dim contentArea = New CropRectangle(x:= 0, y:= 0, width:= 350, height:= 150)
ocrInput.AddImage("ocr.png", contentArea)
Dim ocrResult = ocrTesseract.Read(ocrInput)
Console.WriteLine(ocrResult.Text)
End Using
画像にOCRを実行し、認識されたテキストを.txtファイルに保存するには、次のコードを使用できます。
using IronOcr;
using System;
var ocr = new IronTesseract();
using (var input = new OcrInput("ocr.png"))
{
var result = ocr.Read(input);
result.SaveAsTextFile("output.txt");
}
using IronOcr;
using System;
var ocr = new IronTesseract();
using (var input = new OcrInput("ocr.png"))
{
var result = ocr.Read(input);
result.SaveAsTextFile("output.txt");
}
Imports IronOcr
Imports System
Private ocr = New IronTesseract()
Using input = New OcrInput("ocr.png")
Dim result = ocr.Read(input)
result.SaveAsTextFile("output.txt")
End Using
出力ファイルの内容は以下の通りです:
生成された output.txt ファイルの内容
画像のOCRを実行する方法についての詳細は、画像テキスト抽出チュートリアルをお読みください。
IronOCRは、さまざまなタイプのドキュメントで動作するように設計された5つの.NETライブラリのスイートの一部です。 5つのライブラリすべてを、わずか2つのライセンスの価格で購入できます。