更新済み 2025年2月16日
共有:

IronOCRを使用してスクリーンショットを読み取る方法

This article was translated from English: Does it need improvement?
Translated
View the article in English

カーティス・チャウによる

スクリーンショットは、情報を共有し、同僚や仲間に重要な情報を迅速にキャプチャして送信するための迅速で簡単な方法です。 しかし、スクリーンショットからテキストを抽出することは、その寸法や取得時のノイズが原因でしばしば困難であることが証明されています。 これにより、スクリーンショットはOCRのリリースにおいて効果的でない媒体となります。

しかし、IronOCR はこの問題を解決するために、「ReadScreenShot」などの専門的なメソッドを提供しています。 ReadScreenshotは、スクリーンショットを読み取り、それらから情報を抽出するために最適化されています。 また、一般的なファイル形式にも対応しています。

このガイドでは、IronOCRを使用したスクリーンショットのテキスト認識の方法を迅速に示し、例と結果オブジェクトのプロパティを説明します。

申し訳ありませんが、翻訳するコンテンツのテキストを提供してください。その後、英語から日本語に翻訳いたします。!-- RENDER.PHP -- NUGET LIBRARY DOWNLOAD DIRECTIVE TAG :: START -->

今日から無料トライアルでIronOCRをあなたのプロジェクトで使い始めましょう。

最初のステップ:
green arrow pointer

申し訳ありませんが、翻訳するコンテンツのテキストを提供してください。その後、英語から日本語に翻訳いたします。!-- RENDER.PHP -- NUGET ライブラリ ダウンロード ディレクティブ タグ :: 終了 -->

この機能を使用するには、もインストールする必要があります。IronOcr.Extension.AdvancedScanパッケージ。

スクリーンショットを読む例

IronOCRでスクリーンショットを読み取るには、以下のステップを適用する必要があります。入力パラメーターとしてOcrInputを取るReadScreenShotメソッドを利用します。 このメソッドは、ライブラリの標準的なReadメソッドよりもスクリーンショットに最適化されています。

次の内容にご注意ください。

  • このメソッドは現在、英語、中国語、日本語、韓国語、ラテンアルファベットにのみ対応しています。
  • 高度なスキャンを .NET Framework で使用するには、プロジェクトを x64アーキテクチャで実行する必要があります。

入力

以下はコード例の入力です。 異なるテキストフォントやサイズを混在させることで、この方法の多様性を示します。

入力

コード

:path=/static-assets/ocr/content-code-examples/how-to/read-screenshot-read-screenshot.cs
using IronOcr;
using System;
using System.Linq;

// Instantiate OCR engine
var ocr = new IronTesseract();

using var inputScreenshot = new OcrInput();
inputScreenshot.LoadImage("screenshotOCR.png");

// Perform OCR
OcrPhotoResult result = ocr.ReadScreenShot(inputScreenshot);

// Output screenshot information
Console.WriteLine(result.Text);
Console.WriteLine(result.TextRegions.First().Region.X);
Console.WriteLine(result.TextRegions.Last().Region.Width);
Console.WriteLine(result.Confidence);
Imports IronOcr
Imports System
Imports System.Linq

' Instantiate OCR engine
Private ocr = New IronTesseract()

Private inputScreenshot = New OcrInput()
inputScreenshot.LoadImage("screenshotOCR.png")

' Perform OCR
Dim result As OcrPhotoResult = ocr.ReadScreenShot(inputScreenshot)

' Output screenshot information
Console.WriteLine(result.Text)
Console.WriteLine(result.TextRegions.First().Region.X)
Console.WriteLine(result.TextRegions.Last().Region.Width)
Console.WriteLine(result.Confidence)
VB   C#

出力

出力

上記のコンソール出力からわかるように、スクリーンショットからすべてのテキストのインスタンスが抽出されました。 OcrPhotoResult のプロパティについてさらに詳しく見ていきましょう。

OCR入力から抽出されたテキスト。

信頼度: すべての文字の平均における統計的な精度信頼度を示す「double」プロパティで、1が最も高く、0が最も低い値です。

TextRegion: スクリーンショット上でテキストが見つかる領域を返すプロパティを持つ「TextRegion」の配列。 デフォルトでは、すべての TextRegion は IronOCR モデルから派生した Rectangle クラスです。 それは、長方形のx座標とy座標および高さと幅を返します。