IRONOCRの使い方

OCR C# GitHubインテグレーション：IronOCRでテキスト認識アプリを作る

公開日:2026年1月21日

IronOCR は、99.8% の精度、組み込みの前処理、125 以上の言語のサポートを備えた単一の DLL ソリューションを提供することで、C# GitHub プロジェクトでの OCR 統合を簡素化し、生の Tesseract 実装に必要な複雑な構成を排除します。

今IronOCRを始めましょう。

GitHub で Tesseract OCR を検討している C# 開発者であれば、おそらくコード以外のものも求めているでしょう。実際にすぐに使用でき、実行できる例が付属し、アクティブなコミュニティが背後にあるライブラリが必要です。信頼性の高い統合と堅牢なバージョン管理も同様に重要です。

ここでIronOCRが役立ちます。このガイドでは、IronOCR を GitHub プロジェクトにプラグインして、画像や PDF 内のテキスト認識を簡単に処理できるようにする方法について説明します。プレーンテキストの取得、構造化された単語や行の抽出、さらにはアーカイブ用の検索可能な PDF の生成など、どのような目的であっても、IronOCR が対応します。ライブラリの包括的な機能は、バーコードの読み取りから多言語 OCRまですべてをサポートします。

IronOCR と GitHub を使い始めるにはどうすればいいですか?

IronOCR は、GitHub ベースの開発ワークフローや .NET Core プロジェクトとシームレスに連携する包括的なOCR ソリューションとして際立っています。複雑な構成を必要とする生の Tesseract 実装とは異なり、IronOCR は数分で実行できる洗練された API を提供します。光学文字認識の概念を初めて知る人のために、IronOCR の包括的なドキュメントには、基本的なテキスト抽出から高度な画像処理まですべてが網羅されています。ライブラリには、画像フィルターとOCR 最適化技術の組み込みサポートが含まれています。

どのようなインストール方法を使用すればよいですか?

まず、NuGet パッケージマネージャーを使用して IronOCR をインストールします。

Install-Package IronOcr

! Visual Studio の NuGet パッケージマネージャーウィンドウには、インストール可能なさまざまな言語パックを含む IronOCR パッケージの検索結果が表示されています。

購入の準備ができていませんか？

IronOCR を NuGet でチェックしてください。1000万回以上のダウンロードで、C#によるPDF開発を変革しています。 DLL または Windowsインストーラーをダウンロードすることもできます。

高度なインストールシナリオについては、 NuGet パッケージガイドを参照してください。特定のプラットフォームにデプロイする場合は、 Windows 、 Linux 、 macOS 、またはDocker コンテナーのガイドを確認してください。

サンプルコードはどこにありますか?

IronOCR は、例とチュートリアルを含む複数の GitHub リポジトリを管理しています。公式のIronOCR サンプルリポジトリでは実際の実装が提供されており、 Image to Text チュートリアルリポジトリでは複製して変更できる実用的な使用例が示されています。これらのリポジトリには、バーコード読み取り、多言語サポート、 PDF 処理を備えた OCR が紹介されています。 NuGet で頻繁にパッケージが公開されるため、常に最新の安定したビルドにアクセスできます。デモセクションでは、追加のインタラクティブな例が提供されます。

! OCR処理パイプラインを示すフローチャート: GitHub OCRリポジトリ → IronOCRプロジェクト → OCR処理 → 抽出されたテキスト出力

GitHub で最初の OCR プロジェクトを作成するにはどうすればよいですか?

GitHub 共有に適した包括的な OCR アプリケーションを構築しましょう。 Visual Studio (またはお好みの IDE) で、 OCR 開発のベストプラクティスに従った次のプロジェクト構造を持つ新しいコンソールアプリケーションを作成します。

どのようなプロジェクト構造を使用すればよいですか?

MyOcrProject/
├── src/
│   └── OcrProcessor.cs
├── images/
│   └── sample-invoice.jpg
├── .gitignore
├── README.md
└── MyOcrProject.csproj

この構造は、 JPG、 PNG、 TIFF、 BMPなどのさまざまな入力形式をサポートします。複数ページの TIFFまたはGIF ファイルを処理する場合、IronOCR が自動的に処理します。

OCR 処理コードをどのように実装すればよいですか?

以下は、画像の前処理、テキスト抽出、バーコード検出など、IronOCR の主要機能を示す OCR プロセッサの完全な C# コード例です。

using IronOcr;
using System;
using System.IO;
namespace MyOcrProject
{
    public class OcrProcessor
    {
        private readonly IronTesseract _ocr;
        public OcrProcessor()
        {
            _ocr = new IronTesseract();
            // Configure for optimal accuracy
            _ocr.Configuration.ReadBarCodes = true;
            _ocr.Configuration.PageSegmentationMode = TesseractPageSegmentationMode.Auto;
            _ocr.Language = OcrLanguage.English;
        }
        public void ProcessDocument(string imagePath)
        {
            using var input = new OcrInput();
            // Load and preprocess the image
            input.LoadImage(imagePath);
            input.Deskew();  // Straighten rotated images
            input.DeNoise(); // Remove digital noise
            input.EnhanceResolution(225); // Optimize DPI for OCR
            // Perform OCR
            var result = _ocr.Read(input);
            // Output results
            Console.WriteLine($"Confidence: {result.Confidence}%");
            Console.WriteLine($"Text Found:\n{result.Text}");
            // Process any barcodes found
            foreach (var barcode in result.Barcodes)
            {
                Console.WriteLine($"Barcode: {barcode.Value} ({barcode.Format})");
            }
            // Save as searchable PDF
            result.SaveAsSearchablePdf("output.pdf");
        }
    }
    class Program
    {
        static void Main(string[] args)
        {
            var processor = new OcrProcessor();
            processor.ProcessDocument("images/sample-invoice.jpg");
        }
    }
}

using IronOcr;
using System;
using System.IO;
namespace MyOcrProject
{
    public class OcrProcessor
    {
        private readonly IronTesseract _ocr;
        public OcrProcessor()
        {
            _ocr = new IronTesseract();
            // Configure for optimal accuracy
            _ocr.Configuration.ReadBarCodes = true;
            _ocr.Configuration.PageSegmentationMode = TesseractPageSegmentationMode.Auto;
            _ocr.Language = OcrLanguage.English;
        }
        public void ProcessDocument(string imagePath)
        {
            using var input = new OcrInput();
            // Load and preprocess the image
            input.LoadImage(imagePath);
            input.Deskew();  // Straighten rotated images
            input.DeNoise(); // Remove digital noise
            input.EnhanceResolution(225); // Optimize DPI for OCR
            // Perform OCR
            var result = _ocr.Read(input);
            // Output results
            Console.WriteLine($"Confidence: {result.Confidence}%");
            Console.WriteLine($"Text Found:\n{result.Text}");
            // Process any barcodes found
            foreach (var barcode in result.Barcodes)
            {
                Console.WriteLine($"Barcode: {barcode.Value} ({barcode.Format})");
            }
            // Save as searchable PDF
            result.SaveAsSearchablePdf("output.pdf");
        }
    }
    class Program
    {
        static void Main(string[] args)
        {
            var processor = new OcrProcessor();
            processor.ProcessDocument("images/sample-invoice.jpg");
        }
    }
}

Imports IronOcr
Imports System
Imports System.IO

Namespace MyOcrProject
    Public Class OcrProcessor
        Private ReadOnly _ocr As IronTesseract

        Public Sub New()
            _ocr = New IronTesseract()
            ' Configure for optimal accuracy
            _ocr.Configuration.ReadBarCodes = True
            _ocr.Configuration.PageSegmentationMode = TesseractPageSegmentationMode.Auto
            _ocr.Language = OcrLanguage.English
        End Sub

        Public Sub ProcessDocument(imagePath As String)
            Using input As New OcrInput()
                ' Load and preprocess the image
                input.LoadImage(imagePath)
                input.Deskew() ' Straighten rotated images
                input.DeNoise() ' Remove digital noise
                input.EnhanceResolution(225) ' Optimize DPI for OCR
                ' Perform OCR
                Dim result = _ocr.Read(input)
                ' Output results
                Console.WriteLine($"Confidence: {result.Confidence}%")
                Console.WriteLine($"Text Found:{Environment.NewLine}{result.Text}")
                ' Process any barcodes found
                For Each barcode In result.Barcodes
                    Console.WriteLine($"Barcode: {barcode.Value} ({barcode.Format})")
                Next
                ' Save as searchable PDF
                result.SaveAsSearchablePdf("output.pdf")
            End Using
        End Sub
    End Class

    Module Program
        Sub Main(args As String())
            Dim processor As New OcrProcessor()
            processor.ProcessDocument("images/sample-invoice.jpg")
        End Sub
    End Module
End Namespace

$vbLabelText $csharpLabel

この包括的な例では、いくつかの IronOCR 機能を紹介します。コンストラクターは、バーコード読み取りを有効にし、自動ページ分割を備えた OCR エンジンを構成します。 ProcessDocumentメソッドは、傾き補正(回転の修正)、ノイズ除去 (アーティファクトの除去)、解像度の向上による画像の前処理を示します。処理後、信頼スコア付きの英語のテキストを抽出し、バーコードを識別し、検索可能な PDFを生成します。

高度なシナリオでは、 OcrInput クラスを活用してより詳細な制御を行ったり、非同期処理を使用してパフォーマンスを向上させたり、長時間実行される操作の進行状況追跡を実装したりできます。 OcrResult クラスは、テキストの位置やOCR 結果などの詳細な出力データを提供します。

開発者は、中国語、スペイン語、フランス語などの他の言語を読み取るように IronOCR を簡単に設定することもできるため、多言語 GitHub プロジェクトにとって多目的な選択肢となります。追加の言語パックのインストールに関するリファレンスについては、 125 の国際言語ガイドを参照してください。カスタム言語ファイルを使用したり、カスタムフォントをトレーニングしたりすることもできます。

! OCR デモを表示する分割画面: 左側には白い背景に歪んだ Lorem Ipsum テキストが表示され、右側には抽出されたテキスト出力と信頼度スコア 87.34% を示す Visual Studio デバッグコンソールが表示されます。

.gitignore ファイルには何を含めるべきですか?

.gitignore ファイルには以下を含めます。

# IronOCR runtime files
runtimes/
# Test images and outputs
*.pdf
test-images/
output/
# License keys
appsettings.*.json

IronOCR ランタイムフォルダーと適切なライセンスキー管理の詳細について説明します。

GitHub プロジェクトに IronOCR を選択する理由は何ですか?

IronOCR は、GitHub で OCR プロジェクトを管理する開発者に明確な利点を提供します。このライブラリは、手動によるトレーニングやリポジトリを乱雑にする複雑な構成ファイルを必要とせずに、すぐに 99.8% の精度を実現します。 125 以上の言語をサポートしているため、GitHub プロジェクトは変更を加えることなく国際的なユーザーにサービスを提供できます。互換性機能により、Windows、Linux、macOS、 AzureやAWSなどのクラウドプラットフォーム間でのクロスプラットフォーム展開が保証されます。

IronOCR が他の OCR ソリューションと異なる点は何ですか?

IronOCR は、個々の単語、行、段落全体を認識できるほど柔軟性が高く、スキャンごとにどの程度の詳細を抽出するかを制御できます。このライブラリは、ナンバープレート、パスポート、 MICR 小切手、手書きのテキスト、スクリーンショット、スキャンした文書、さらには文書内の表など、特殊な文書の種類に優れています。

商用ライセンスは、パブリックリポジトリに法的明確性を提供します。 IronOCR を商用アプリケーションに組み込むことは明示的に許可されています。組み込みの画像前処理フィルターには、色補正、品質強化、最適な設定を自動的に検出する強力なフィルターウィザードなどの高度なオプションが含まれています。

シングル DLL アーキテクチャが重要な理由

IronOCR の単一 DLL アーキテクチャにより、貢献者は、他の OCR ソリューションで問題となるネイティブ依存関係やプラットフォーム固有の構成に悩まされることなく、リポジトリを複製してすぐに開発を開始できます。このシンプルさこそが、開発者が生の Tesseract ではなく IronOCR を選択する理由です。このライブラリには、数多くのパフォーマンス改善とマルチスレッドサポートを備えたTesseract 5が含まれています。

OCR プロジェクトのバージョン管理のベストプラクティスは何ですか?

GitHub で OCR プロジェクトを管理する場合は、大きなテストイメージにはGit LFSを使用します。 PDF ストリームまたは画像ストリームを処理する場合は、メモリ管理を改善するためにSystem.Drawing オブジェクトの使用を検討してください。

Git で大きなファイルを処理するにはどうすればよいでしょうか?

git lfs track "*.jpg" "*.png" "*.tiff"
git add .gitattributes

git lfs track "*.jpg" "*.png" "*.tiff"
git add .gitattributes

The provided C# code appears to be a set of Git commands rather than C# code. These commands are used to track certain file types with Git LFS (Large File Storage) and to add the `.gitattributes` file to the staging area in Git.

Since this is not C# code, it cannot be directly converted to VB.NET. If you have any C# code that you would like to convert to VB.NET, please provide it, and I will be happy to assist with the conversion.

$vbLabelText $csharpLabel

これは、高解像度の画像や複数ページの TIFF ファイルを扱う場合に特に重要です。低品質のスキャンの場合、IronOCR の前処理によって結果が大幅に改善されます。

ライセンスキーとドキュメントをどのように管理すればよいですか?

IronOCR ライセンスキーを環境変数またはユーザーシークレットを使用して安全に保存し、直接コミットしないでください。適切な実装については、 IronOCR ライセンスキーガイドに従ってください。 ASP.NET アプリケーションのweb.configでライセンスを構成することもできます。サポートされている画像形式と期待される精度を README に記載します。貢献者が OCR 機能を検証できるように、サンプル画像をテストデータフォルダーに含めます。クロスプラットフォーム開発については、 IronOCR Linux セットアップガイドまたはmacOS インストール手順を参照してください。モバイル開発者は、 Android ガイドとiOS ガイドを確認する必要があります。

高度な機能については、テキスト検出、ページ回転検出、 hOCR エクスポート、および長時間実行操作のタイムアウト構成のためのコンピュータービジョンの使用法を文書化します。キャンセル可能な操作に対して中止トークンを実装することを検討してください。

一般的なトラブルシューティングのヒントは何ですか?

Windows で OCR が動作しないのはなぜですか?

一般的なセットアップの問題としては、Windows でVisual C++ 再頒布可能パッケージが見つからないことが挙げられます。 IronOCR には 2019 バージョンが必要です。詳細なガイダンスについては、 Visual C++ 再頒布可能パッケージのトラブルシューティングガイドを参照してください。 Linux 展開の場合は、 libgdiplus がインストールされていることを確認してください。テキスト認識率が低いと思われる場合は、 DPI 設定ガイドを使用して、画像が少なくとも 200 DPI であることを確認してください。 Stack Overflowの C# OCR コミュニティでは、一般的な GitHub プロジェクトの問題に対する役立つ解決策も提供しています。

具体的な問題については、一般的なトラブルシューティング、 Azure Functions のデプロイ、 AWS Lambda の問題、または .NET 7 以降のSystem.Drawing の代替に関するガイドを参照してください。 IronOCR ユーティリティツールは、構成の問題の診断に役立ちます。

追加のサポートはどこで受けられますか?

詳細なトラブルシューティングについては、 IronOCR トラブルシューティングガイドを参照してください。 IronOCRサポートチームは、GitHub でホストされる OCR アプリケーションで作業するライセンスユーザーに迅速な支援を提供します。最新のアップデートについては製品の変更ログを、包括的なドキュメントについてはAPI リファレンスを確認してください。

次のステップは何ですか?

IronOCR は、直感的な API、包括的な前処理、信頼性の高い精度により、C# GitHub プロジェクトでの OCR 実装を簡素化します。上記のコード例から始めて、公式リポジトリを調べ、GitHub のコラボレーション機能を活用した強力なドキュメント処理アプリケーションを構築します。 MAUI アプリケーションを構築する場合、特殊なドキュメントを処理する場合、または1 行のコードで OCRを実装する場合、IronOCR は必要なツールを提供します。

商用展開用のIronOCR の無料トライアルをダウンロードしてください。チームのニーズに合わせて拡張機能やアップグレードなどのライセンスオプションを検討してください。

よくある質問

OCR C# GitHubチュートリアルの主な目的は何ですか？

OCR C# GitHubチュートリアルの主な目的は、IronOCRを使用してGitHubプロジェクトでテキスト認識を実装する方法を開発者にガイドすることです。コードサンプルとバージョン管理のヒントが含まれています。

IronOCRは私のGitHubのC#プロジェクトをどのように強化できますか？

IronOCRは、強力なテキスト認識機能を提供することでGitHubのC#プロジェクトを強化し、高精度で画像からテキストを抽出し操作することを可能にします。

IronOCRを使用してテキスト認識を行うための利点は何ですか？

IronOCRは、使いやすさ、高精度、C#プロジェクトへのシームレスな統合など、テキスト認識に様々な利点を提供し、画像ベースのテキストデータを扱う開発者にとって理想的な選択肢となります。

OCR C# GitHubチュートリアルにはコードサンプルはありますか？

はい、OCR C# GitHubチュートリアルには、IronOCRを使用してプロジェクトでテキスト認識を実装する方法を示すコードサンプルが含まれています。

チュートリアルで提供されるバージョン管理のヒントはどのようなものですか？

チュートリアルは、IronOCRを統合する際にプロジェクトの変更を効果的に管理するためのバージョン管理のヒントを提供し、円滑なコラボレーションとプロジェクトの維持を確保します。

IronOCRを実時間のテキスト認識アプリケーションに使用できますか？

はい、IronOCRは効率的な処理能力と多様な画像形式のサポートにより、実時間のテキスト認識アプリケーションに使用できます。

IronOCRはテキスト認識にどのような画像形式をサポートしていますか？

IronOCRは、JPEG、PNG、BMP、GIF、およびTIFFを含む幅広い画像形式をテキスト認識に対応しており、ほとんどの画像ソースとの互換性を確保します。

IronOCRにはテスト用のトライアルバージョンがありますか？

はい、IronOCRにはトライアルバージョンがあり、開発者が購入前にプロジェクトでその機能と性能をテストすることができます。

IronOCRはテキスト認識で異なる言語をどのように扱いますか？

IronOCRはテキスト認識に複数の言語をサポートしており、開発者がさまざまな言語で画像からテキストを簡単に抽出することができます。

C#プロジェクトでIronOCRを使用するためのシステム要件は何ですか？

IronOCRは.NET Frameworkと.NET Coreに対応しており、広範なシステムリソースを必要とせずにC#プロジェクトに簡単に統合できます。

Kannapat Udonpant

今すぐエンジニアリングチームとチャット

ソフトウェアエンジニア

ソフトウェアエンジニアになる前に、Kannapatは北海道大学で環境資源の博士号を修了しました。博士号を追求する間に、彼はバイオプロダクションエンジニアリング学科の一部である車両ロボティクスラボラトリーのメンバーになりました。2022年には、C#のスキルを活用してIron Softwareのエンジニアリングチームに参加し、IronPDFに注力しています。Kannapatは、IronPDFの多くのコードを執筆している開発者から直接学んでいるため、この仕事を大切にしています。同僚から学びながら、Iron Softwareでの働く社会的側面も楽しんでいます。コードやドキュメントを書いていない時は、KannapatはPS5でゲームをしたり、『The Last of Us』を再視聴したりしていることが多いです。

顧客ハイライト:

開発者スポットライト:

ウェビナー:

無料30日間のトライアルを開始

OCR C# GitHubインテグレーション：IronOCRでテキスト認識アプリを作る

IronOCR と GitHub を使い始めるにはどうすればいいですか?

どのようなインストール方法を使用すればよいですか?

サンプルコードはどこにありますか?

GitHub で最初の OCR プロジェクトを作成するにはどうすればよいですか?

どのようなプロジェクト構造を使用すればよいですか?

OCR 処理コードをどのように実装すればよいですか?

.gitignore ファイルには何を含めるべきですか?

GitHub プロジェクトに IronOCR を選択する理由は何ですか?

IronOCR が他の OCR ソリューションと異なる点は何ですか?

シングル DLL アーキテクチャが重要な理由

OCR プロジェクトのバージョン管理のベストプラクティスは何ですか?

Git で大きなファイルを処理するにはどうすればよいでしょうか?

ライセンスキーとドキュメントをどのように管理すればよいですか?

一般的なトラブルシューティングのヒントは何ですか?

Windows で OCR が動作しないのはなぜですか?

追加のサポートはどこで受けられますか?

次のステップは何ですか?

よくある質問

OCR C# GitHubチュートリアルの主な目的は何ですか？

IronOCRは私のGitHubのC#プロジェクトをどのように強化できますか？

IronOCRを使用してテキスト認識を行うための利点は何ですか？

OCR C# GitHubチュートリアルにはコードサンプルはありますか？

チュートリアルで提供されるバージョン管理のヒントはどのようなものですか？

IronOCRを実時間のテキスト認識アプリケーションに使用できますか？

IronOCRはテキスト認識にどのような画像形式をサポートしていますか？

IronOCRにはテスト用のトライアルバージョンがありますか？

IronOCRはテキスト認識で異なる言語をどのように扱いますか？

C#プロジェクトでIronOCRを使用するためのシステム要件は何ですか？

無料30日間のトライアルを開始

OCR C# GitHubインテグレーション：IronOCRでテキスト認識アプリを作る

IronOCR と GitHub を使い始めるにはどうすればいいですか?

どのようなインストール方法を使用すればよいですか?

サンプルコードはどこにありますか?

GitHub で最初の OCR プロジェクトを作成するにはどうすればよいですか?

どのようなプロジェクト構造を使用すればよいですか?

OCR 処理コードをどのように実装すればよいですか?

.gitignore ファイルには何を含めるべきですか?

GitHub プロジェクトに IronOCR を選択する理由は何ですか?

IronOCR が他の OCR ソリューションと異なる点は何ですか?

シングル DLL アーキテクチャが重要な理由

OCR プロジェクトのバージョン管理のベストプラクティスは何ですか?

Git で大きなファイルを処理するにはどうすればよいでしょうか?

ライセンス キーとドキュメントをどのように管理すればよいですか?

一般的なトラブルシューティングのヒントは何ですか?

Windows で OCR が動作しないのはなぜですか?

追加のサポートはどこで受けられますか?

次のステップは何ですか?

よくある質問

OCR C# GitHubチュートリアルの主な目的は何ですか？

IronOCRは私のGitHubのC#プロジェクトをどのように強化できますか？

IronOCRを使用してテキスト認識を行うための利点は何ですか？

OCR C# GitHubチュートリアルにはコードサンプルはありますか？

チュートリアルで提供されるバージョン管理のヒントはどのようなものですか？

IronOCRを実時間のテキスト認識アプリケーションに使用できますか？

IronOCRはテキスト認識にどのような画像形式をサポートしていますか？

IronOCRにはテスト用のトライアルバージョンがありますか？

IronOCRはテキスト認識で異なる言語をどのように扱いますか？

C#プロジェクトでIronOCRを使用するためのシステム要件は何ですか？

関連する記事

IronOCRを使用して.NET OCR SDKを作成する

PDFをOCRする方法：C# .NET OCR PDFでスキャン文書からテキストを抽出する

C# PDF フォームフィールドを読む：プログラムでフォームデータを抽出する

Next step: Start free 30-day Trial

Next step: Start free 30-day Trial

世界中の数百万人のエンジニアから信頼されています。

ライセンスキーとドキュメントをどのように管理すればよいですか?