画像を読み取る方法

This article was translated from English: Does it need improvement?
Translated
View the article in English

によって チャクニット・ビン

OCR (光学文字認識)とは、画像からテキストを認識して抽出するために使用される技術です。 この技術は、印刷された文書をデジタル化する際に特に有用です。スキャンしたページ、写真、その他の画像ファイルからテキストの内容を抽出して操作することができます。

IronOCRは、jpg、png、gif、tiff、およびbmpなど、さまざまな画像形式をサポートしています。読み取り能力を向上させるための画像フィルターも利用可能です。

IronOCRを始めましょう

今日から無料トライアルでIronOCRをあなたのプロジェクトで使い始めましょう。

最初のステップ:
green arrow pointer



画像を読み取る例

まず、OCRを有効にするためにIronTesseractクラスをインスタンス化します。 次のコードのように 'using' 文を利用して、画像ファイルパスを指定し、OcrImageInput オブジェクトを作成します。 これは、リソースが不要になったときに適切に処分されることを保証します。 IronOCRは、jpg、png、gif、tiff、およびbmpを含むさまざまな形式の入力画像をサポートしています。最後に、 Read メソッドを使用してOCRを実行します。

:path=/static-assets/ocr/content-code-examples/how-to/input-images-read.cs
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("Potter.png");

// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
Imports IronOcr

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Add image
Private imageInput = New OcrImageInput("Potter.png")

' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)
VB   C#
PNG画像を読み取る

ウェブサイトに訪問してくださいマルチフレーム/ページのGIFおよびTIFFを読み取る方法TIFFおよびGIF画像の読み取りに関する詳細については、記事をご覧ください。

バイトとして画像をインポート

通常のファイルパス以外にも、OcrImageInput クラスはバイト配列、AnyBitmap、ストリーム、および Image 形式の画像情報も受け付けます。 AnyBitmapは、IronSoftware製品におけるビットマップオブジェクトです。IronSoftware.Drawing.AnyBitmap.

:path=/static-assets/ocr/content-code-examples/how-to/input-images-import-byte.cs
using IronOcr;
using System.IO;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Read byte from file
byte[] data = File.ReadAllBytes("Potter.tiff");

// Import image byte
using var imageInput = new OcrImageInput(data);
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
Imports IronOcr
Imports System.IO

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Read byte from file
Private data() As Byte = File.ReadAllBytes("Potter.tiff")

' Import image byte
Private imageInput = New OcrImageInput(data)
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)
VB   C#

スキャン領域の指定

OcrImageInput クラスをインスタンス化する際に、CropRectangle も受け入れられます。 これは、画像ドキュメントのどの領域をOCRするかを指定することを可能にします。 画像ドキュメントに応じて、スキャンする領域を指定すると、パフォーマンスが大幅に向上することがあります。 コード例では、読み取るのは章番号とタイトルのみであることを指定しています。

:path=/static-assets/ocr/content-code-examples/how-to/input-images-read-specific-region.cs
using IronOcr;
using IronSoftware.Drawing;
using System;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Specify crop region
Rectangle scanRegion = new Rectangle(800, 200, 900, 400);

// Add image
using var imageInput = new OcrImageInput("Potter.tiff", ContentArea: scanRegion);
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Output the result to console
Console.WriteLine(ocrResult.Text);
Imports IronOcr
Imports IronSoftware.Drawing
Imports System

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Specify crop region
Private scanRegion As New Rectangle(800, 200, 900, 400)

' Add image
Private imageInput = New OcrImageInput("Potter.tiff", ContentArea:= scanRegion)
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)

' Output the result to console
Console.WriteLine(ocrResult.Text)
VB   C#

OCR結果

特定の領域を読み取る
Chaknith related to OCR結果

チャクニット・ビン

ソフトウェアエンジニア

チャクニットは開発者のシャーロック・ホームズです。彼がソフトウェアエンジニアリングの将来性に気付いたのは、楽しみでコーディングチャレンジをしていたときでした。彼のフォーカスはIronXLとIronBarcodeにありますが、すべての製品でお客様を助けることに誇りを持っています。チャクニットは顧客と直接話すことで得た知識を活用して、製品自体のさらなる改善に貢献しています。彼の逸話的なフィードバックは、単なるJiraチケットを超えて、製品開発、ドキュメントおよびマーケティングをサポートし、顧客の全体的な体験を向上させます。オフィスにいないときは、機械学習やコーディングについて学んだり、ハイキングを楽しんだりしています。