IronOCRを使用してスクリーンショットを読み取る方法
スクリーンショットは、情報を共有し、同僚や仲間に重要な情報を迅速にキャプチャして送信するための迅速で簡単な方法です。 しかし、スクリーンショットからテキストを抽出することは、その寸法や取得時のノイズが原因でしばしば困難であることが証明されています。 これにより、スクリーンショットはOCRのリリースにおいて効果的でない媒体となります。
しかし、IronOCR はこの問題を解決するために、「ReadScreenShot」などの専門的なメソッドを提供しています。 ReadScreenshotは、スクリーンショットを読み取り、それらから情報を抽出するために最適化されています。 また、一般的なファイル形式にも対応しています。
このガイドでは、IronOCRを使用したスクリーンショットのテキスト認識の方法を迅速に示し、例と結果オブジェクトのプロパティを説明します。
IronOCRを使用してスクリーンショットを読み取る方法
- スクリーンショットを読み取るためのC#ライブラリをダウンロード
- スクリーンショット画像を処理のためにインポートする
ReadScreenShot
メソッドを使用して画像からテキストを抽出します- 抽出されたデータをさらに処理するためにOcrPhotoResultプロパティを使用して取得します。
- 抽出したテキストを必要に応じて保存またはエクスポートする
今日から無料トライアルでIronOCRをあなたのプロジェクトで使い始めましょう。
この機能を使用するには、IronOcr.Extension.AdvancedScan パッケージもインストールする必要があります。
スクリーンショットを読む例
IronOCRでスクリーンショットを読み取るには、次の手順を適用する必要があります。ReadScreenShot
メソッドを利用し、入力のパラメーターとしてOcrInput
を取ります。 このメソッドは、ライブラリの標準的なRead
に比べて、スクリーンショット用に最適化されています。
次の内容にご注意ください。
- このメソッドは現在、英語、中国語、日本語、韓国語、ラテンアルファベットにのみ対応しています。
-
高度なスキャンを .NET Framework で使用するには、プロジェクトを x64アーキテクチャで実行する必要があります。
入力
以下はコード例の入力です。 異なるテキストフォントやサイズを混在させることで、この方法の多様性を示します。
コード
:path=/static-assets/ocr/content-code-examples/how-to/read-screenshot-read-screenshot.cs
using IronOcr;
using System;
using System.Linq;
// Instantiate OCR engine
var ocr = new IronTesseract();
using var inputScreenshot = new OcrInput();
inputScreenshot.LoadImage("screenshotOCR.png");
// Perform OCR
OcrPhotoResult result = ocr.ReadScreenShot(inputScreenshot);
// Output screenshot information
Console.WriteLine(result.Text);
Console.WriteLine(result.TextRegions.First().Region.X);
Console.WriteLine(result.TextRegions.Last().Region.Width);
Console.WriteLine(result.Confidence);
Imports IronOcr
Imports System
Imports System.Linq
' Instantiate OCR engine
Private ocr = New IronTesseract()
Private inputScreenshot = New OcrInput()
inputScreenshot.LoadImage("screenshotOCR.png")
' Perform OCR
Dim result As OcrPhotoResult = ocr.ReadScreenShot(inputScreenshot)
' Output screenshot information
Console.WriteLine(result.Text)
Console.WriteLine(result.TextRegions.First().Region.X)
Console.WriteLine(result.TextRegions.Last().Region.Width)
Console.WriteLine(result.Confidence)
出力
上記のコンソール出力からわかるように、スクリーンショットからすべてのテキストのインスタンスが抽出されました。 では、OcrPhotoResult
のプロパティをさらに詳しく見ていきましょう。
テキスト: OCR入力から抽出されたテキスト。
精度: すべての文字の平均に対する統計的精度の信頼性を示す「double」プロパティで、1が最高、0が最低です。
TextRegion: スクリーンショット上でテキストが見つかる領域を返すプロパティを持つ「TextRegion」の配列。 デフォルトでは、すべてのTextRegion
は、IronOCRモデルから派生したRectangle
クラスです。 それは、長方形のx座標とy座標および高さと幅を返します。