ライブ環境でテストする
ウォーターマークなしで本番環境でテストしてください。
必要な場所でいつでも動作します。
今日のデジタル環境において、光学文字認識 (OCR)(OCR (光学式文字認識))技術は、画像、PDF、その他の文書から効率的にテキストを抽出したい企業にとって欠かせないものとなっています。 以下のOCRソリューションの中で、Microsoft Azure OCRとGoogle OCRがありますが、IronOCRそれぞれがユニークな機能と能力を提供し、際立った存在となっています。 この記事では、これらのOCRサービス、その機能、およびどれを選択するべきかについて説明します。
OCRサービスは、画像や文書からテキストを抽出するために高度な機械学習アルゴリズムを活用したクラウドベースのプラットフォームです。 彼らは、多言語サポート、レイアウト検出、および手書き認識を含むさまざまな機能を提供しています。 Azure OCR、Google OCR、およびIronOCRは、それぞれの強みと用途を持つ広く使用されているOCRサービスです。
についてAzure OCR(アジュールOCR)ツールは、Microsoft Azure Cognitive Servicesスイートの一部として、テキスト認識タスクに信頼性が高くスケーラブルなソリューションを提供します。 さまざまな言語とドキュメント形式に対応しており、多様な利用ケースに適しています。 Microsoft Azure OCRは、深層学習モデルを活用してテキスト抽出における高精度を実現し、企業がドキュメント処理ワークフローを効率的に合理化することを可能にします。Azureはよりコンピュータビジョンサービスに似ています。
using Microsoft.Azure.CognitiveServices.Vision.ComputerVision;
using Microsoft.Azure.CognitiveServices.Vision.ComputerVision.Models;
using System;
class Program
{
static async Task Main(string [] args)
{
// Create an instance of the ComputerVisionClient
ComputerVisionClient client = new ComputerVisionClient(new ApiKeyServiceClientCredentials("YOUR_API_KEY"))
{
Endpoint = "https://YOUR_REGION.api.cognitive.microsoft.com/"
};
// Specify the image URL
string imageUrl = "https://example.com/image.jpg";
// Perform OCR on the image
OcrResult result = await client.RecognizePrintedTextAsync(true, imageUrl);
// Display the extracted text
foreach (var region in result.Regions)
{
foreach (var line in region.Lines)
{
foreach (var word in line.Words)
{
Console.Write(word.Text + " ");
}
Console.WriteLine();
}
}
}
}
using Microsoft.Azure.CognitiveServices.Vision.ComputerVision;
using Microsoft.Azure.CognitiveServices.Vision.ComputerVision.Models;
using System;
class Program
{
static async Task Main(string [] args)
{
// Create an instance of the ComputerVisionClient
ComputerVisionClient client = new ComputerVisionClient(new ApiKeyServiceClientCredentials("YOUR_API_KEY"))
{
Endpoint = "https://YOUR_REGION.api.cognitive.microsoft.com/"
};
// Specify the image URL
string imageUrl = "https://example.com/image.jpg";
// Perform OCR on the image
OcrResult result = await client.RecognizePrintedTextAsync(true, imageUrl);
// Display the extracted text
foreach (var region in result.Regions)
{
foreach (var line in region.Lines)
{
foreach (var word in line.Words)
{
Console.Write(word.Text + " ");
}
Console.WriteLine();
}
}
}
}
Imports Microsoft.Azure.CognitiveServices.Vision.ComputerVision
Imports Microsoft.Azure.CognitiveServices.Vision.ComputerVision.Models
Imports System
Friend Class Program
Shared Async Function Main(ByVal args() As String) As Task
' Create an instance of the ComputerVisionClient
Dim client As New ComputerVisionClient(New ApiKeyServiceClientCredentials("YOUR_API_KEY")) With {.Endpoint = "https://YOUR_REGION.api.cognitive.microsoft.com/"}
' Specify the image URL
Dim imageUrl As String = "https://example.com/image.jpg"
' Perform OCR on the image
Dim result As OcrResult = Await client.RecognizePrintedTextAsync(True, imageUrl)
' Display the extracted text
For Each region In result.Regions
For Each line In region.Lines
For Each word In line.Words
Console.Write(word.Text & " ")
Next word
Console.WriteLine()
Next line
Next region
End Function
End Class
Google OCR (グーグル OCR)Google Cloud サービスプロバイダーの一部として、強力なテキスト認識とドキュメント解析プラットフォームを提供します。 Googleの高度な機械学習アルゴリズムを活用し、クラウドコンピューティングを通じて画像ラベリングやオブジェクト検出などの追加機能とともに、正確なテキスト抽出機能を提供します。 Google Cloud Platform OCRは、請求書処理、フォーム認識、コンテンツのデジタル化など、さまざまな業界で広く使用されています。
using Google.Cloud.Vision.V1;
using Google.Protobuf;
using System.IO;
using Google.Apis.Auth.OAuth2;
var clientBuilder = new ImageAnnotatorClientBuilder { CredentialsPath = "path-to-credentials.json" };
var client = clientBuilder.Build();
var image = Image.FromFile("path-to-your-image.jpg");
var response = client.DetectText(image);
foreach (var annotation in response)
{
Console.WriteLine(annotation.Description);
}
using Google.Cloud.Vision.V1;
using Google.Protobuf;
using System.IO;
using Google.Apis.Auth.OAuth2;
var clientBuilder = new ImageAnnotatorClientBuilder { CredentialsPath = "path-to-credentials.json" };
var client = clientBuilder.Build();
var image = Image.FromFile("path-to-your-image.jpg");
var response = client.DetectText(image);
foreach (var annotation in response)
{
Console.WriteLine(annotation.Description);
}
Imports Google.Cloud.Vision.V1
Imports Google.Protobuf
Imports System.IO
Imports Google.Apis.Auth.OAuth2
Private clientBuilder = New ImageAnnotatorClientBuilder With {.CredentialsPath = "path-to-credentials.json"}
Private client = clientBuilder.Build()
Private image = System.Drawing.Image.FromFile("path-to-your-image.jpg")
Private response = client.DetectText(image)
For Each annotation In response
Console.WriteLine(annotation.Description)
Next annotation
IronOCRは、開発者が.NETアプリケーションでOCR(光学文字認識)機能を組み込むための強力で使いやすいライブラリです。このツールは、画像やPDFドキュメントからテキスト情報を抽出する際の精度とスピードを高めるために設計されています。IronOCRはさまざまな言語とフォーマットをサポートし、カスタマイズ可能なオプションを提供します。
主な特徴:
IronOCR for .NETは、企業の様々なニーズに応えるために開発されており、デプロイも簡単です。このツールを活用することで、あなたのアプリケーションに高性能なOCR機能を迅速に組み込むことができます。
IronOCRIron Softwareによって開発されたIronOCR for .NETは、業界をリードするOCR精度とパフォーマンスを提供する、.NETアプリケーション向けの多用途なOCRライブラリです。 クラウドベースのOCRサービスとは異なり、IronOCRはオンプレミスのテキスト抽出機能を提供し、データのプライバシーとセキュリティを必要とするアプリケーションに適しています。 IronOCRは、複雑なレイアウト、手書きのテキスト、およびノイズの多い画像を含むシナリオにおいても高い精度を発揮し、信頼性の高いOCR機能を求める企業に好まれる選択肢です。
IronOCRは、NuGetパッケージマネージャーを使用してインストールすることができます。以下のコマンドを実行してください。
Visual Studioを開き、新しいプロジェクトを作成するか、既存のプロジェクトを開きます。
次に、表示されたリストからパッケージ マネージャー コンソールを選択します。
Install-Package IronOcr
IronOCRのインストールには少し時間がかかりますが、完了したらコーディングの例に進むことができます。
using IronOcr;
using System;
class Program
{
static void Main(string [] args)
{
// Specify the path to the image file
string imagePath = "path-to-your-image.jpg";
// Instantiate the IronTesseract OCR engine
var ocr = new IronTesseract();
// Set the language for text recognition
ocr.Language = OcrLanguage.English;
// Perform text recognition on the image
var result = ocr.Read(imagePath);
// Display the extracted text
Console.WriteLine("Extracted Text:");
Console.WriteLine(result.Text);
}
}
using IronOcr;
using System;
class Program
{
static void Main(string [] args)
{
// Specify the path to the image file
string imagePath = "path-to-your-image.jpg";
// Instantiate the IronTesseract OCR engine
var ocr = new IronTesseract();
// Set the language for text recognition
ocr.Language = OcrLanguage.English;
// Perform text recognition on the image
var result = ocr.Read(imagePath);
// Display the extracted text
Console.WriteLine("Extracted Text:");
Console.WriteLine(result.Text);
}
}
Imports IronOcr
Imports System
Friend Class Program
Shared Sub Main(ByVal args() As String)
' Specify the path to the image file
Dim imagePath As String = "path-to-your-image.jpg"
' Instantiate the IronTesseract OCR engine
Dim ocr = New IronTesseract()
' Set the language for text recognition
ocr.Language = OcrLanguage.English
' Perform text recognition on the image
Dim result = ocr.Read(imagePath)
' Display the extracted text
Console.WriteLine("Extracted Text:")
Console.WriteLine(result.Text)
End Sub
End Class
以下のOCRツールの中で、Azure OCR、Google Vision API、およびIronOCRは、高精度かつ高性能なテキスト抽出タスクに対応する強力なOCRソリューションとして知られています。 Azure OCRとGoogle OCRはスケーラブルなインフラストラクチャと幅広い言語サポートを提供するクラウドベースのOCRサービスを提供していますが、IronOCRは最も正確なソリューションとして際立っています。
IronOCRは、特にオンプレミスのテキスト抽出と高精度を必要とするアプリケーションにおいて際立っています。 IronOCRを活用することで、企業はドキュメント処理のワークフローを効率化し、データ抽出の精度を向上させ、スキャンされたドキュメントや画像から貴重な洞察を引き出すことができるため、優先的に選ばれています。
IronOCRおよびそのサービスの詳細については、以下のリンクをご覧ください: IronOCRドキュメントページライセンス、画像の取り扱い方法を変革するためのスタートを切るために。
9つの .NET API製品 オフィス文書用