C#でコンピュータ ビジョンを使用してテキストを検索する方法
IronOCRはOpenCVコンピュータ・ビジョンを使って、OCR処理の前に画像中のテキスト領域を自動的に検出します。 これは、Tesseractの認識を識別されたテキスト領域のみに集中させることで、ノイズの多いテキスト、複数の領域、ゆがんだテキストに対する精度を向上させ、画像全体を処理する場合と比較して抽出結果を大幅に向上させます。
クイックスタート: 主要なテキスト領域の検出とOCR
この例では、画像を読み込み、IronOCRのコンピュータ・ビジョンを使ってFindTextRegion()で主要なテキスト領域を自動検出し、.Read(...)を実行して1行でテキストを抽出します。
今すぐ NuGet で PDF を作成してみましょう:
NuGet パッケージ マネージャーを使用して IronOCR をインストールします
このコード スニペットをコピーして実行します。
using var result = new IronTesseract().Read(new OcrInput().LoadImage("image.png").FindTextRegion());実際の環境でテストするためにデプロイする
- C#でナンバープレートをOCRする方法(チュートリアル)
- C#で請求書からテキストを取得する方法チュートリアル
- C#でスクリーンショットからテキストをOCRで取得する方法
- C#で字幕をOCR処理する方法(チュートリアル)
最小限のワークフロー(5ステップ)
- コンピューター ビジョンで OCR を使用するための C# ライブラリをダウンロードする
FindTextRegionメソッドを利用してテキスト領域を自動検出するStampCropRectangleAndSaveAsメソッドで検出されたテキスト領域を確認します- コンピュータービジョンを使用して、
FindMultipleTextRegionsメソッドで元の画像をテキスト領域に基づいて画像に分割します。 GetTextRegionsメソッドを使用して、テキストが検出されたトリミング領域のリストを取得します。
NuGetパッケージを使ってIronOCR.ComputerVisionをインストールするには? IronOCR でコンピューター ビジョンを実行する OpenCV メソッドは、通常の IronOCR NuGet パッケージで表示されます。 詳細なインストールガイドについては、[NuGetインストールガイド](https://ironsoftware.com/csharp/ocr/get-started/advanced-installation-nuget/)を参照してください。なぜIronOCRは別のコンピュータ・ビジョン・パッケージを必要とするのですか? これらの方法を使用するには、ソリューションに`IronOcr.ComputerVision`をNuGetインストールする必要があります。 インストールされていない場合はダウンロードするように求められます。 コンピュータ ビジョン機能は、[ナンバープレート認識](https://ironsoftware.com/csharp/ocr/how-to/read-license-plate/)や[パスポート スキャン](https://ironsoftware.com/csharp/ocr/how-to/read-passport/)機能で使用されている技術と同様に、テキスト検出精度を大幅に向上させる OpenCV アルゴリズムを活用しています。 ### どのプラットフォーム固有のパッケージをインストールすべきですか? - Windows:`IronOcr.ComputerVision.Windows` - [Windowsセットアップガイド](https://ironsoftware.com/csharp/ocr/get-started/windows/)をご覧ください。 - Linux:`IronOcr.ComputerVision.Linux` - [Linuxインストールチュートリアル](https://ironsoftware.com/csharp/ocr/get-started/linux/)をご覧ください。 - macOS:`IronOcr.ComputerVision.MacOS` - [macOSセットアップ手順](https://ironsoftware.com/csharp/ocr/get-started/mac/)をご覧ください。 - macOS ARM: `IronOcr.ComputerVision.MacOS.ARM` ### パッケージマネージャーコンソールを使ってインストールするには? NuGet パッケージ マネージャーを使用してインストールするか、パッケージ マネージャー コンソールに次の内容を貼り付けます。 ```shell :InstallCmd Install-Package IronOcr.ComputerVision.Windows ``` これはIronOCR Computer Visionを我々のモデルファイルと共に使用するために必要なアセンブリを提供します。 ## IronOCRではどのようなコンピュータビジョンメソッドが利用できますか? コード例は、このチュートリアルのさらに下に含まれています。 以下は、現在利用可能な方法の一般的な概要です:
| 方法 | 説明 |
|---|---|
| テキスト領域の検索 | テキスト要素を含む領域を検出し、テキストが検出された領域内のテキストのみを検索するように Tesseract に指示します。 |
| 複数のテキスト領域を検索 | テキスト要素を含む領域を検出し、テキスト領域に基づいてページを個別の画像に分割します。 |
| テキスト領域を取得 | Scans the image and returns a list of text regions as `List |
.よくある質問
OCRにおけるコンピュータ・ビジョンとは何ですか?
IronOCRのコンピュータ・ビジョンは、OpenCVアルゴリズムを使用して、OCR処理の前に画像内のテキスト領域を自動的に検出します。これにより、画像全体を処理するのではなく、特定されたテキスト領域のみにTesseract認識を集中させることで、ノイズの多いテキスト、複数の領域、ゆがんだテキストに対する精度を大幅に向上させます。
C#でComputer Vision OCRを素早く実装するには?
FindTextRegion()メソッドでIronTesseractを使用し、主要なテキスト領域を自動検出し、.Read()を実行してテキストを即座に抽出します。
なぜComputer Visionパッケージを別にインストールする必要があるのですか?
IronOCRは、コンピュータ・ビジョン機能がOpenCVアルゴリズムを活用しているため、個別のIronOcr.ComputerVision NuGetパッケージが必要です。これらのアルゴリズムはテキスト検出精度を大幅に向上させ、ナンバープレート認識やパスポートスキャニングのような機能に不可欠です。
どのプラットフォーム固有のComputer Visionパッケージをインストールすべきですか?
IronOCRはプラットフォーム別のパッケージを提供しています:IronOcr.ComputerVision.WindowsはWindowsシステム用、IronOcr.ComputerVision.LinuxはLinuxディストリビューション用、IronOcr.ComputerVision.MacOSはmacOS環境用です。
画像内の複数のテキスト領域を検出する方法を教えてください。
IronOCRはFindMultipleTextRegionsメソッドを提供し、検出されたテキスト領域に基づいて元の画像を複数の画像に分割します。また、GetTextRegionsを使ってテキストが検出されたクロップ領域のリストを取得することもできます。
処理前にどのテキスト領域が検出されたかを確認できますか。
はい、IronOCRにはStampCropRectangleAndSaveAsメソッドがあり、実際のOCR処理を実行する前に、どのテキスト領域がコンピューター・ビジョン・アルゴリズムによって検出されたかを確認することができます。






