画像を読み取る方法
OCR (光学文字認識)とは、画像からテキストを認識して抽出するために使用される技術です。 この技術は、印刷された文書をデジタル化する際に特に有用です。スキャンしたページ、写真、その他の画像ファイルからテキストの内容を抽出して操作することができます。
IronOCRは、jpg、png、gif、tiff、およびbmpなど、さまざまな画像形式をサポートしています。読み取り能力を向上させるための画像フィルターも利用可能です。
IronOCRを始めましょう
今日から無料トライアルでIronOCRをあなたのプロジェクトで使い始めましょう。
画像を読み取る方法
- 画像を読み取るためのC#ライブラリをダウンロードする
- jpg、png、gif、tiff、およびbmpなど、さまざまな形式の画像をサポートします
- インスタンス化する OcrImageInput 画像を入力するためのクラス
- 以下を使用
読み取り
入力画像に対してOCRを実行するメソッド - 読み取り領域を定義するためにクロップ領域を指定してください。
画像を読み取る例
まず、OCRを有効にするためにIronTesseractクラスをインスタンス化します。 次のコードのように 'using' 文を利用して、画像ファイルパスを指定し、OcrImageInput オブジェクトを作成します。 これは、リソースが不要になったときに適切に処分されることを保証します。 IronOCRは、jpg、png、gif、tiff、およびbmpを含むさまざまな形式の入力画像をサポートしています。最後に、 Read
メソッドを使用してOCRを実行します。
:path=/static-assets/ocr/content-code-examples/how-to/input-images-read.cs
using IronOcr;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Add image
using var imageInput = new OcrImageInput("Potter.png");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
Imports IronOcr
' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()
' Add image
Private imageInput = New OcrImageInput("Potter.png")
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)

ウェブサイトに訪問してくださいマルチフレーム/ページのGIFおよびTIFFを読み取る方法TIFFおよびGIF画像の読み取りに関する詳細については、記事をご覧ください。
バイトとして画像をインポート
通常のファイルパス以外にも、OcrImageInput クラスはバイト配列、AnyBitmap、ストリーム、および Image 形式の画像情報も受け付けます。 AnyBitmapは、IronSoftware製品におけるビットマップオブジェクトです。IronSoftware.Drawing.AnyBitmap.
:path=/static-assets/ocr/content-code-examples/how-to/input-images-import-byte.cs
using IronOcr;
using System.IO;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Read byte from file
byte[] data = File.ReadAllBytes("Potter.tiff");
// Import image byte
using var imageInput = new OcrImageInput(data);
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
Imports IronOcr
Imports System.IO
' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()
' Read byte from file
Private data() As Byte = File.ReadAllBytes("Potter.tiff")
' Import image byte
Private imageInput = New OcrImageInput(data)
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)
スキャン領域の指定
OcrImageInput クラスをインスタンス化する際に、CropRectangle も受け入れられます。 これは、画像ドキュメントのどの領域をOCRするかを指定することを可能にします。 画像ドキュメントに応じて、スキャンする領域を指定すると、パフォーマンスが大幅に向上することがあります。 コード例では、読み取るのは章番号とタイトルのみであることを指定しています。
:path=/static-assets/ocr/content-code-examples/how-to/input-images-read-specific-region.cs
using IronOcr;
using IronSoftware.Drawing;
using System;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Specify crop region
Rectangle scanRegion = new Rectangle(800, 200, 900, 400);
// Add image
using var imageInput = new OcrImageInput("Potter.tiff", ContentArea: scanRegion);
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
// Output the result to console
Console.WriteLine(ocrResult.Text);
Imports IronOcr
Imports IronSoftware.Drawing
Imports System
' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()
' Specify crop region
Private scanRegion As New Rectangle(800, 200, 900, 400)
' Add image
Private imageInput = New OcrImageInput("Potter.tiff", ContentArea:= scanRegion)
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)
' Output the result to console
Console.WriteLine(ocrResult.Text)
OCR結果
