OCRツール

Azure OCR 対 Google OCR (OCR機能の比較)

公開済み 2024年4月3日
共有:

今日のデジタル環境において、光学文字認識 (OCR)(OCR (光学式文字認識))技術は、画像、PDF、その他の文書から効率的にテキストを抽出したい企業にとって欠かせないものとなっています。 以下のOCRソリューションの中で、Microsoft Azure OCRとGoogle OCRがありますが、IronOCRそれぞれがユニークな機能と能力を提供し、際立った存在となっています。 この記事では、これらのOCRサービス、その機能、およびどれを選択するべきかについて説明します。

OCRサービスの紹介

OCRサービスは、画像や文書からテキストを抽出するために高度な機械学習アルゴリズムを活用したクラウドベースのプラットフォームです。 彼らは、多言語サポート、レイアウト検出、および手書き認識を含むさまざまな機能を提供しています。 Azure OCR、Google OCR、およびIronOCRは、それぞれの強みと用途を持つ広く使用されているOCRサービスです。

2. Azure OCR (アジュール OCR)

についてAzure OCR(アジュールOCR)ツールは、Microsoft Azure Cognitive Servicesスイートの一部として、テキスト認識タスクに信頼性が高くスケーラブルなソリューションを提供します。 さまざまな言語とドキュメント形式に対応しており、多様な利用ケースに適しています。 Microsoft Azure OCRは、深層学習モデルを活用してテキスト抽出における高精度を実現し、企業がドキュメント処理ワークフローを効率的に合理化することを可能にします。Azureはよりコンピュータビジョンサービスに似ています。

Azure OCRの主な機能

  • 言語サポート: Microsoft Azure OCRはアラビア語や中国語などの複雑な文字を含む70以上の言語をサポートしています。
  • ドキュメントフォーマット: 画像、PDF、スキャンされたドキュメントなど、さまざまなドキュメントフォーマットを処理できます。
  • スケーラビリティ: Azure OCR はシームレスにスケーリングして、大量のテキスト抽出リクエストを処理するため、エンタープライズレベルのアプリケーションに適しています。

2.2 コード例 (C#)

using Microsoft.Azure.CognitiveServices.Vision.ComputerVision;
using Microsoft.Azure.CognitiveServices.Vision.ComputerVision.Models;
using System;
class Program
{
    static async Task Main(string [] args)
    {
        // Create an instance of the ComputerVisionClient
        ComputerVisionClient client = new ComputerVisionClient(new ApiKeyServiceClientCredentials("YOUR_API_KEY"))
        {
            Endpoint = "https://YOUR_REGION.api.cognitive.microsoft.com/"
        };
        // Specify the image URL
        string imageUrl = "https://example.com/image.jpg";
        // Perform OCR on the image
        OcrResult result = await client.RecognizePrintedTextAsync(true, imageUrl);
        // Display the extracted text
        foreach (var region in result.Regions)
        {
            foreach (var line in region.Lines)
            {
                foreach (var word in line.Words)
                {
                    Console.Write(word.Text + " ");
                }
                Console.WriteLine();
            }
        }
    }
}
using Microsoft.Azure.CognitiveServices.Vision.ComputerVision;
using Microsoft.Azure.CognitiveServices.Vision.ComputerVision.Models;
using System;
class Program
{
    static async Task Main(string [] args)
    {
        // Create an instance of the ComputerVisionClient
        ComputerVisionClient client = new ComputerVisionClient(new ApiKeyServiceClientCredentials("YOUR_API_KEY"))
        {
            Endpoint = "https://YOUR_REGION.api.cognitive.microsoft.com/"
        };
        // Specify the image URL
        string imageUrl = "https://example.com/image.jpg";
        // Perform OCR on the image
        OcrResult result = await client.RecognizePrintedTextAsync(true, imageUrl);
        // Display the extracted text
        foreach (var region in result.Regions)
        {
            foreach (var line in region.Lines)
            {
                foreach (var word in line.Words)
                {
                    Console.Write(word.Text + " ");
                }
                Console.WriteLine();
            }
        }
    }
}
Imports Microsoft.Azure.CognitiveServices.Vision.ComputerVision
Imports Microsoft.Azure.CognitiveServices.Vision.ComputerVision.Models
Imports System
Friend Class Program
	Shared Async Function Main(ByVal args() As String) As Task
		' Create an instance of the ComputerVisionClient
		Dim client As New ComputerVisionClient(New ApiKeyServiceClientCredentials("YOUR_API_KEY")) With {.Endpoint = "https://YOUR_REGION.api.cognitive.microsoft.com/"}
		' Specify the image URL
		Dim imageUrl As String = "https://example.com/image.jpg"
		' Perform OCR on the image
		Dim result As OcrResult = Await client.RecognizePrintedTextAsync(True, imageUrl)
		' Display the extracted text
		For Each region In result.Regions
			For Each line In region.Lines
				For Each word In line.Words
					Console.Write(word.Text & " ")
				Next word
				Console.WriteLine()
			Next line
		Next region
	End Function
End Class
VB   C#

2.2.1 出力

Azure OCR 対 Google OCR(OCR機能の比較):図1 - Azure OCRコードのコンソール出力

3. Google OCR

Google OCR (グーグル OCR)Google Cloud サービスプロバイダーの一部として、強力なテキスト認識とドキュメント解析プラットフォームを提供します。 Googleの高度な機械学習アルゴリズムを活用し、クラウドコンピューティングを通じて画像ラベリングやオブジェクト検出などの追加機能とともに、正確なテキスト抽出機能を提供します。 Google Cloud Platform OCRは、請求書処理、フォーム認識、コンテンツのデジタル化など、さまざまな業界で広く使用されています。

Google OCRの主要な特徴 (3.1)

  • 多言語対応: Google OCRは200以上の言語をサポートしており、ラテン文字、キリル文字、漢字を含む複数のスクリプトでテキストを認識できます。
  • 画像解析: ラベル検出、顔検出、ランドマーク認識などの高度な画像解析機能を提供します。
  • Google Cloud Servicesとの統合: Google OCRは他のGoogle Cloud Vision APIサービスとシームレスに統合され、開発者が文書管理と分析のための包括的なソリューションを構築することを可能にします。

3.2 コード例 (C#)

using Google.Cloud.Vision.V1;
using Google.Protobuf;
using System.IO;
using Google.Apis.Auth.OAuth2;
var clientBuilder = new ImageAnnotatorClientBuilder { CredentialsPath = "path-to-credentials.json" };
var client = clientBuilder.Build();
var image = Image.FromFile("path-to-your-image.jpg");
var response = client.DetectText(image);
foreach (var annotation in response)
{
    Console.WriteLine(annotation.Description);
}
using Google.Cloud.Vision.V1;
using Google.Protobuf;
using System.IO;
using Google.Apis.Auth.OAuth2;
var clientBuilder = new ImageAnnotatorClientBuilder { CredentialsPath = "path-to-credentials.json" };
var client = clientBuilder.Build();
var image = Image.FromFile("path-to-your-image.jpg");
var response = client.DetectText(image);
foreach (var annotation in response)
{
    Console.WriteLine(annotation.Description);
}
Imports Google.Cloud.Vision.V1
Imports Google.Protobuf
Imports System.IO
Imports Google.Apis.Auth.OAuth2
Private clientBuilder = New ImageAnnotatorClientBuilder With {.CredentialsPath = "path-to-credentials.json"}
Private client = clientBuilder.Build()
Private image = System.Drawing.Image.FromFile("path-to-your-image.jpg")
Private response = client.DetectText(image)
For Each annotation In response
	Console.WriteLine(annotation.Description)
Next annotation
VB   C#

3.2.1 出力

Azure OCR対Google OCR(OCR機能の比較):図2 - Google OCRコードのコンソール出力

4. IronOCR

IronOCRは、開発者が.NETアプリケーションでOCR(光学文字認識)機能を組み込むための強力で使いやすいライブラリです。このツールは、画像やPDFドキュメントからテキスト情報を抽出する際の精度とスピードを高めるために設計されています。IronOCRはさまざまな言語とフォーマットをサポートし、カスタマイズ可能なオプションを提供します。

主な特徴:

  • 多言語対応:IronOCRは多数の言語の文字認識に対応しています。
  • 高性能:優れた精度で文字認識を実現し、誤認識を最小限に抑えます。
  • 使いやすいAPI:直感的でシンプルなAPIにより、実装が容易です。
  • 画像前処理機能:画像のクオリティーを向上させ、OCRの精度を向上させます。
  • PDF & 画像対応:幅広い画像フォーマットとPDFドキュメントからテキストを抽出可能です。

IronOCR for .NETは、企業の様々なニーズに応えるために開発されており、デプロイも簡単です。このツールを活用することで、あなたのアプリケーションに高性能なOCR機能を迅速に組み込むことができます。

IronOCRIron Softwareによって開発されたIronOCR for .NETは、業界をリードするOCR精度とパフォーマンスを提供する、.NETアプリケーション向けの多用途なOCRライブラリです。 クラウドベースのOCRサービスとは異なり、IronOCRはオンプレミスのテキスト抽出機能を提供し、データのプライバシーとセキュリティを必要とするアプリケーションに適しています。 IronOCRは、複雑なレイアウト、手書きのテキスト、およびノイズの多い画像を含むシナリオにおいても高い精度を発揮し、信頼性の高いOCR機能を求める企業に好まれる選択肢です。

4.1 IronOCRの主な特徴

  • 高精度: IronOCRはテキスト認識において卓越した精度を提供し、多様な文書タイプと言語に対して信頼性の高い結果を確保します。
  • オンプレミスOCR: 外部サービスに依存せずに機密文書をローカルで処理できるオンプレミスのテキスト抽出機能を提供します。
  • 多様な言語サポート: IronOCRは127以上の言語をサポートし、シームレスな多言語テキスト認識のための包括的な言語パックを提供します。

4.2 IronPDFのインストール

IronOCRは、NuGetパッケージマネージャーを使用してインストールすることができます。以下のコマンドを実行してください。

  1. Visual Studioを開き、新しいプロジェクトを作成するか、既存のプロジェクトを開きます。

    1. ツールバーで「Tools」に移動し、「NuGet Package Manager」を選択します。

    Azure OCR 対 Google OCR (OCR 機能の比較):図3 - Visual Studio NuGet パッケージ マネージャーの場所

  2. 次に、表示されたリストからパッケージ マネージャー コンソールを選択します。

  3. 次にコンソールが表示されますので、以下のコマンドを実行してEnterキーを押してください。
Install-Package IronOcr

IronOCRのインストールには少し時間がかかりますが、完了したらコーディングの例に進むことができます。

4.3 コード例 (C#)

using IronOcr;
using System;
class Program
{
    static void Main(string [] args)
    {
        // Specify the path to the image file
        string imagePath = "path-to-your-image.jpg";
        // Instantiate the IronTesseract OCR engine
        var ocr = new IronTesseract();
        // Set the language for text recognition
        ocr.Language = OcrLanguage.English;
        // Perform text recognition on the image
        var result = ocr.Read(imagePath);
        // Display the extracted text
        Console.WriteLine("Extracted Text:");
        Console.WriteLine(result.Text);
    }
}
using IronOcr;
using System;
class Program
{
    static void Main(string [] args)
    {
        // Specify the path to the image file
        string imagePath = "path-to-your-image.jpg";
        // Instantiate the IronTesseract OCR engine
        var ocr = new IronTesseract();
        // Set the language for text recognition
        ocr.Language = OcrLanguage.English;
        // Perform text recognition on the image
        var result = ocr.Read(imagePath);
        // Display the extracted text
        Console.WriteLine("Extracted Text:");
        Console.WriteLine(result.Text);
    }
}
Imports IronOcr
Imports System
Friend Class Program
	Shared Sub Main(ByVal args() As String)
		' Specify the path to the image file
		Dim imagePath As String = "path-to-your-image.jpg"
		' Instantiate the IronTesseract OCR engine
		Dim ocr = New IronTesseract()
		' Set the language for text recognition
		ocr.Language = OcrLanguage.English
		' Perform text recognition on the image
		Dim result = ocr.Read(imagePath)
		' Display the extracted text
		Console.WriteLine("Extracted Text:")
		Console.WriteLine(result.Text)
	End Sub
End Class
VB   C#

4.3.1 出力

Azure OCR 対 Google OCR (OCR機能の比較): 図4 - IronOCRコードのコンソール出力

比較評価 5

精度とパフォーマンス

  • Microsoft Azure OCRおよびGoogle OCRは、テキスト抽出において高い精度を提供し、広範な用途に適しています。
  • IronOCRは、特に複雑なレイアウト、手書きの文書、およびノイズの多い画像を含むシナリオにおいて、精度に優れています。

5.2 統合の容易さ

  • Microsoft Azure OCR および Google Cloud ソリューション OCR は、クラウドベースの OCR サービスを提供し、クラウドアプリケーションやサービスとの簡単な統合を可能にします。
  • IronOCRは、オンプレミスのOCR機能を提供し、直感的なAPIと豊富なドキュメントを備えた.NETアプリケーションとのシームレスな統合を実現します。

5.3 スケーラビリティ

  • Microsoft Azure OCRおよびGoogle OCRは、大量のテキスト抽出リクエストをシームレスに処理できるため、エンタープライズレベルのアプリケーションに適しています。
  • IronOCRのスケーラビリティはアプリケーションのインフラストラクチャに依存しており、オンプレミスで動作します。

結論

以下のOCRツールの中で、Azure OCR、Google Vision API、およびIronOCRは、高精度かつ高性能なテキスト抽出タスクに対応する強力なOCRソリューションとして知られています。 Azure OCRとGoogle OCRはスケーラブルなインフラストラクチャと幅広い言語サポートを提供するクラウドベースのOCRサービスを提供していますが、IronOCRは最も正確なソリューションとして際立っています。

IronOCRは、特にオンプレミスのテキスト抽出と高精度を必要とするアプリケーションにおいて際立っています。 IronOCRを活用することで、企業はドキュメント処理のワークフローを効率化し、データ抽出の精度を向上させ、スキャンされたドキュメントや画像から貴重な洞察を引き出すことができるため、優先的に選ばれています。

IronOCRおよびそのサービスの詳細については、以下のリンクをご覧ください: IronOCRドキュメントページライセンス、画像の取り扱い方法を変革するためのスタートを切るために。

< 以前
Windows OCRエンジンとTesseractの詳細比較
次へ >
開発者向けの最高の無料OCRソフトウェア