C#で写真を読む方法 with IronOCR

This article was translated from English: Does it need improvement?
Translated
View the article in English

IronOCRのReadPhotoメソッドは、TIFFやGIFのような複雑な写真フォーマットからテキストを抽出し、テキスト領域と信頼度スコアを持つ構造化された結果を提供します。

大量のドキュメント、特にTIFFファイルのようなスキャン画像を扱う場合、手作業でテキストを抽出するのは時間がかかり、エラーが発生しやすくなります。 光学式文字認識(OCR)は、このプロセスを自動化し、テキストを画像からデジタルデータに変換します。 OCRテクノロジーは、スキャンした文書や写真のような複雑な画像を処理し、検索可能で編集可能なテキストに変換します。 これにより、文書処理がスピードアップし、正確なデータ抽出が可能になります。

TIFFやGIFのようなフォーマットでOCRを使用すると、サイズや色深度、圧縮の問題にもかかわらず、膨大な量のデータをすばやくデジタル化できます。 IronOCRのReadPhoto機能により、開発者は画像からテキストを抽出し、キーワード検索やスキャンデータを検索可能なPDFに変換するような高度な操作を行うことができます。 この技術は、効率的なデータ検索が重要な法的文書、アーカイブ、領収書を扱う業界に有益です。

このチュートリアルでは、ReadPhotoの使用とresultsオブジェクトの操作について説明します。 IronOCRの標準的なReadの代わりにReadPhotoを使う場合について説明します。 一般的な画像処理については、さまざまな画像フォーマットを読むを参照してください。

この機能を使用するには、IronOcr.Extension.AdvancedScanパッケージをインストールしてください。

クイックスタート: ReadPhoto を使用して複雑な画像からテキストを抽出する

すぐに始められます: IronOCRのReadPhotoメソッドを画像フレームを読み込んだOcrInput上で使用し、すべてのテキストと領域を抽出します。 TIFF、GIF、および類似の写真フォーマットに最適化されています。

Nuget Icon今すぐ NuGet で PDF を作成してみましょう:

  1. NuGet パッケージ マネージャーを使用して IronOCR をインストールします

    PM > Install-Package IronOcr

  2. このコード スニペットをコピーして実行します。

    var result = new IronTesseract().ReadPhoto(new OcrInput().LoadImageFrame("photo.tiff", 0));
  3. 実際の環境でテストするためにデプロイする

    今すぐ無料トライアルでプロジェクトに IronOCR を使い始めましょう
    arrow pointer

ReadPhotoを使用してTIFF画像からテキストを抽出するには?

TIFFやGIFのような高品質な写真フォーマットの読み込みはIronOCRを使えば簡単です。 まず、OcrInput変数を作成し、LoadImageFrameを使って画像をロードします。 次に、ReadPhotoメソッドを使用して結果を取得します。 multi-page TIFF OCR tutorial では、さらに複数ページのドキュメント例を提供しています。

ブラケットオープン

  • TIFFには複数のフレームが含まれています; PageNumberパラメータは、ゼロベースのインデックスでは必須です。
  • 現在、英語、中国語、日本語、韓国語、ラテンアルファベットに対応しています。
  • .NET Frameworkで高度なスキャンを使用するには、x64アーキテクチャが必要です。

ブラケットを閉じる

どのような入力形式を使用すればよいですか?

ブラウザはネイティブでTIFF形式をサポートしていないため、TIFF入力こちらをダウンロードしてください。 以下の表示バージョンはWEBPに変換されています。

入力

どのように ReadPhoto メソッドを実装しますか?

この実装では、TIFF画像からテキストと領域情報を抽出することを示します。 その他の例については、フォトリーディングコード例をご覧ください。

:path=/static-assets/ocr/content-code-examples/how-to/read-photo-read-photo.cs
using IronOcr;
using IronSoftware.Drawing;
using System;

// Instantiate OCR engine
var ocr = new IronTesseract();

using var inputPhoto = new OcrInput();
inputPhoto.LoadImageFrame("ocr.tiff", 0);

// Read photo
OcrPhotoResult result = ocr.ReadPhoto(inputPhoto);

// Index number refer to region order in the page
int number = result.TextRegions[0].PageNumber;

// Extract the text in the first region
string textinregion = result.TextRegions[0].TextInRegion;

//Extract the co_ordinates of the first text region
Rectangle region = result.TextRegions[0].Region;

var output = $"Text in First Region: {textinregion}\n"
             + $"Text Region:\n"
             + $"Starting X: {region.X}\n"
             + $"Starting Y: {region.Y}\n"
             + $"Region Width: {region.Width}\n"
             + $"Region Height: {region.Height}\n"
             + $"Result Confidence: {result.Confidence}\n\n"
             + $"Full Scnned Photo Text: {result.Text}";

Console.WriteLine(output);
$vbLabelText   $csharpLabel

OcrPhotoResultはどのようなプロパティを提供しますか?

Debug output showing OCR text extraction with phone number, coordinates, and confidence score from processed image.

OcrPhotoResultクラスは、抽出されたテキストを分析するための主要なプロパティを提供します。 OCR結果の操作に関する詳細情報は、データ出力と結果の操作のガイドを参照してください。

Text : OCR 入力から抽出されたテキスト。
信頼度:統計的な正確さの信頼度(0~1スケール、1が最高)。 結果の信頼性スコアについては、こちらをご覧ください。
TextRegions:位置データを持つテキスト領域のリスト。 ターゲット抽出のための OCR 領域の定義に似ています。


どのような場合にReadの代わりにReadPhotoを使用すべきですか?