IronOCRを使用してスクリーンショットを読み取る方法
スクリーンショットは、情報を共有し、同僚や仲間に重要な情報を迅速にキャプチャして送信するための迅速で簡単な方法です。 しかし、スクリーンショットからテキストを抽出することは、その寸法や取得時のノイズが原因でしばしば困難であることが証明されています。 これにより、スクリーンショットはOCRのリリースにおいて効果的でない媒体となります。
しかし、IronOCR はこの問題を解決するために、「ReadScreenShot」などの専門的なメソッドを提供しています。 ReadScreenshotは、スクリーンショットを読み取り、それらから情報を抽出するために最適化されています。 また、一般的なファイル形式にも対応しています。
このガイドでは、IronOCRを使用したスクリーンショットのテキスト認識の方法を迅速に示し、例と結果オブジェクトのプロパティを説明します。
IronOCRを使用してスクリーンショットを読み取る方法
- スクリーンショットを読み取るためのC#ライブラリをダウンロード
- スクリーンショット画像を処理のためにインポートする
- 以下を使用
スクリーンショットを読み取る
画像からテキストを抽出する方法 - 抽出されたデータを取得するには、OcrPhotoResultさらなる処理のためのプロパティ
- 抽出したテキストを必要に応じて保存またはエクスポートする
申し訳ありませんが、翻訳するコンテンツのテキストを提供してください。その後、英語から日本語に翻訳いたします。!-- RENDER.PHP -- NUGET LIBRARY DOWNLOAD DIRECTIVE TAG :: START -->
今日から無料トライアルでIronOCRをあなたのプロジェクトで使い始めましょう。
申し訳ありませんが、翻訳するコンテンツのテキストを提供してください。その後、英語から日本語に翻訳いたします。!-- RENDER.PHP -- NUGET ライブラリ ダウンロード ディレクティブ タグ :: 終了 -->
この機能を使用するには、もインストールする必要があります。IronOcr.Extension.AdvancedScanパッケージ。
スクリーンショットを読む例
IronOCRでスクリーンショットを読み取るには、以下のステップを適用する必要があります。入力パラメーターとしてOcrInput
を取るReadScreenShot
メソッドを利用します。 このメソッドは、ライブラリの標準的なRead
メソッドよりもスクリーンショットに最適化されています。
次の内容にご注意ください。
- このメソッドは現在、英語、中国語、日本語、韓国語、ラテンアルファベットにのみ対応しています。
-
高度なスキャンを .NET Framework で使用するには、プロジェクトを x64アーキテクチャで実行する必要があります。
入力
以下はコード例の入力です。 異なるテキストフォントやサイズを混在させることで、この方法の多様性を示します。
コード
:path=/static-assets/ocr/content-code-examples/how-to/read-screenshot-read-screenshot.cs
using IronOcr;
using System;
using System.Linq;
// Instantiate OCR engine
var ocr = new IronTesseract();
using var inputScreenshot = new OcrInput();
inputScreenshot.LoadImage("screenshotOCR.png");
// Perform OCR
OcrPhotoResult result = ocr.ReadScreenShot(inputScreenshot);
// Output screenshot information
Console.WriteLine(result.Text);
Console.WriteLine(result.TextRegions.First().Region.X);
Console.WriteLine(result.TextRegions.Last().Region.Width);
Console.WriteLine(result.Confidence);
Imports IronOcr
Imports System
Imports System.Linq
' Instantiate OCR engine
Private ocr = New IronTesseract()
Private inputScreenshot = New OcrInput()
inputScreenshot.LoadImage("screenshotOCR.png")
' Perform OCR
Dim result As OcrPhotoResult = ocr.ReadScreenShot(inputScreenshot)
' Output screenshot information
Console.WriteLine(result.Text)
Console.WriteLine(result.TextRegions.First().Region.X)
Console.WriteLine(result.TextRegions.Last().Region.Width)
Console.WriteLine(result.Confidence)
出力
上記のコンソール出力からわかるように、スクリーンショットからすべてのテキストのインスタンスが抽出されました。 OcrPhotoResult
のプロパティについてさらに詳しく見ていきましょう。
OCR入力から抽出されたテキスト。
信頼度: すべての文字の平均における統計的な精度信頼度を示す「double」プロパティで、1が最も高く、0が最も低い値です。
TextRegion: スクリーンショット上でテキストが見つかる領域を返すプロパティを持つ「TextRegion」の配列。 デフォルトでは、すべての TextRegion
は IronOCR モデルから派生した Rectangle
クラスです。 それは、長方形のx座標とy座標および高さと幅を返します。