フッターコンテンツにスキップ
IRONOCRの使い方

Tesseract OCRでの多言語対応(開発者向けチュートリアル)

OCRは、さまざまな性質の文書を編集・検索可能なデータに変更するために使用される技術です。 スキャンした画像、PDFファイル、デジタルカメラの写真を編集・検索可能なデータに変換します。 この技術は、印刷された文書を編集、検索、保存のためにデジタル形式に変更する際に広く使用され、文書が占める物理的なスペースを削減します。 OCRは、データ入力の自動化において大きな役割を担っており、人的資源の労力を削減することで、企業や組織の時間を大幅に節約します。

高度な機械学習技術とパターン認識を使用して、画像からテキストを正確に抽出するプロセスです。 OCRに関する最新の開発により精度が向上したため、より多くの言語やアラビア文字などの複雑な文字に対応しています。 OCRは、金融、医療、法律、教育の分野で非常に必要とされ、複数の印刷された文書を迅速に処理することが前提条件となる、不可欠なツールとして登場した。この記事では、Tesseractを使って多言語データの画像をOCRする。

複数の言語でTesseract OCRを使用する方法

1.まず、.NETプロジェクト内にIronOCR/Tesseract NuGetパッケージをインストールします。 2.IronTesseractクラスのインスタンスを作成し、OCRエンジンを初期化します。 3.言語プロパティは、複数の言語をサポートしています。 4.処理したい画像ファイルのパスを指定し、OcrInputオブジェクトを作成します。 5.さて、IronTesseractインスタンスのRead関数を使用して、入力画像にOCRを実行します。 6.翻訳結果を受け取り、認識されたテキストを表示します。

Tesseractとは?

Tesseractは、Hewlett-Packardによって開発され、その後Googleによってメンテナンスされているオープンな光学式文字認識エンジンです。 高い精度と適応性で有名で、最も著名なOCRの1つとなっています。 Tesseractはスクリプト検出をサポートし、多くの言語のテキストを認識し、複数の言語を扱うことができます; そのため、一般的には、多言語のドキュメントやサポートが必要なプロジェクトに使用されます。

Tesseract OCRエンジンは、画像のあらゆるピクセルに含まれる情報に働きかけ、文字、単語、文章を表すパターンに従って、最終的に機械可読テキストに変換します。 Tesseractは、TIFF、JPEG、PNGなど多くの画像ファイル形式をサポートしており、プレーンテキスト、HTML、検索可能なPDFなどの形式でテキストを作成することができます。

Tesseractの大きな利点のひとつは、特定のフォントや新しく追加された言語に敏感に反応するようトレーニングできることです。 また、単純なテキスト抽出から、歴史的文書のデジタル化、請求書の処理、さらには視覚障害者の読書を可能にするアクセシビリティソフトウェアなどの複雑なタスクまで、さまざまなアプリケーションで頻繁に使用されています。

Visual Studio で新しいプロジェクトを作成する


</strong

Visual Studioを開いてください。 プログラムを開いたら、"ファイルメニュー "に進む。ファイルメニュー "の下に、"新規プロジェクト "というオプションがある。新規プロジェクト "の下にある "コンソール・アプリケーション "をクリックする。この投稿では、コンソール・プログラムを使ってPDF文書を作成します。

Tesseract OCR for Multiple Languages(開発者向けチュートリアル):図1 - 新規プロジェクトの作成</p

プロジェクト名とファイルの場所をテキストボックスに入力してください。 次に、下の画像に示すように、作成ボタンをクリックし、必要な.NET Frameworkを選択します。

Tesseract OCR for Multiple Languages(開発者向けチュートリアル):図2 - .NET Frameworkを選択し、プロジェクトと保存場所を指定します。

アプリケーションのバージョンが選択されたので、Visual Studioプロジェクトはその構造を作成します。 コンソール版、Windows版、Web版を選択した場合、program.csファイルを開いてコードを追加し、アプリケーションをビルド/実行します。

.NET用Tesseract OCRをインストールする</h3

最初のステップは、Tesseract OCRソフトウェアをダウンロードし、コンピューターにインストールすることです。 TesseractのインストーラーがあるTesseractの公式GitHubリポジトリはこちらです:https://github.com/tesseract-ocr/tesseract

Tesseract OCRは、Windows、macOS、Linuxなど、ご使用のオペレーティングシステムに特化したセットアップ手順に従ってコンピューターにインストールするのがベストです。 インストールが完了したら、Visual StudioのNuGetパッケージマネージャを使用してTesseract.NETパッケージをC#プロジェクトに追加します。

Tools -> NuGet Package Manager -> Manage NuGet Packages for Solutionから、Visual StudioプロジェクトでNuGet Package Managerを開きます。 その後、NuGetパッケージマネージャで "Tesseract "を検索し、"Tesseract "または "Tesseract.NET "パッケージを入手します。 このパッケージを選択し、インストールボタンをクリックしてプロジェクトにインストールしてください。

Tesseract OCR for Multiple Languages(開発者向けチュートリアル):図3 - ブラウズタブでTesseractを検索

C#を使用したTesseract OCR

Tesseract OCR for Multiple Languages(開発者向けチュートリアル):図4 - 入力例Tesseract OCR for Multiple Languages(開発者向けチュートリアル):図5 - コンソール出力の例**IronOCRとは** [**IronOCR**](/csharp/ocr/)? IronOCRは.NETに特化した独自のOCRライブラリです。 .NETアプリケーションにOCR機能を追加し、画像、スキャン文書、PDF、その他すべての視覚メディアからテキストを抽出できるようにします。 IronOCRはTesseractエンジンで最先端のテキスト認識を行い、エンタープライズ・アプリケーションでの使用に適したいくつかの追加機能を備えています。 IronOCRは、120以上の言語をサポートし、自動言語検出と複数の言語を同時に含むドキュメントの処理をサポートします。 このため、IronOCRは多言語文書処理が非常に重要なグローバルな展開が可能です。 [Tesseract OCR for Multiple Languages(開発者向けチュートリアル):図6 - IronOCR: C#OCRライブラリ](/static-assets/ocr/blog/tesseract-ocr-for-multiple-languages/tesseract-ocr-for-multiple-languages-6.webp). 一方、IronOCRは使いやすさと統合性を重視しています。 非常に使いやすいAPIは、詳細なドキュメントとサンプルプロジェクトによって補完されており、どのような開発者でもすぐに使い始めることができます。 さまざまな画像形式やPDF文書に対応しています。 内蔵の高度な画像前処理、ノイズ除去、エラー補正機能により、OCRの精度とパフォーマンスが向上します。 ## IronOCRをインストールする Visual StudioのNuGetパッケージ管理ツールを使用して、パッケージをソリューションに直接インストールできます。 次のスナップショットは、NuGet Package Managerの開き方を示しています。 [Tesseract OCR for Multiple Languages(開発者向けチュートリアル):図7 - Visual StudioからNuGetパッケージマネージャーにアクセスする方法](/static-assets/ocr/blog/tesseract-ocr-for-multiple-languages/tesseract-ocr-for-multiple-languages-7.webp)

Tesseract OCR for Multiple Languages(開発者向けチュートリアル):図9 - フランス語パッケージのインストールTesseractエンジン搭載IronOCRで複数の言語を読むTesseract OCR for Multiple Languages(開発者向けチュートリアル):図11 - 認識されたテキスト出力なぜIronOCRはTesseractより優れているのでしょうか? IronOCRはTesseractに比べてより使いやすく、いくつかの利点があります。 まず、IronOCRは125の言語に対応し、優れた言語サポートを提供しますが、Tesseractは100の言語に対応し、最適なパフォーマンスを得るために複雑な設定やトレーニングが必要になる場合があります。 さらに、IronOCRは.NETアプリケーションに簡単に統合でき、包括的なドキュメントが付属しています。 IronOCRはTesseractよりも学習曲線が急ではなく、技術的なセットアップも必要ありません。 また、高度な画像前処理と定期的な更新により、複雑なドキュメントタイプでも精度と信頼性が向上します。IronOCRは、堅固で汎用性が高く、簡単に適用できるOCRソリューションを求める開発者に最適です。 ## 結論 [Tesseract OCR for Multiple Languages (Developer Tutorial):図12 - IronOCRライセンスページ](/static-assets/ocr/blog/tesseract-ocr-for-multiple-languages/tesseract-ocr-for-multiple-languages-12.webp). TesseractとIronOCRはどちらも堅牢なOCRテクノロジーですが、それぞれにユニークな機能と強みがあります。 Tesseractはオープンソースであるため、無償のソリューションを求める人にとって信頼性が高く、活発なコミュニティと継続的な改善が行われています。 対照的に、IronOCRは.NET Frameworkのための独自のライブラリであり、より簡単な統合とほとんどの画像ファイルタイプのサポートにより、ユーザーエクスペリエンスの向上を提供します。また、テキスト認識、特に低品質の画像コンテンツで優れた性能を発揮します。 IronOCRは多くの言語を完全にサポートし、よりユーザーフレンドリーな追加機能を備えています。 IronOCRは費用対効果の高い開発版を提供し、購入された場合、生涯ライセンスを提供します。 IronOCRパッケージは、複数のシステムに対して1回限りの費用として$liteLicenseから提供され、優れたコストパフォーマンスと24時間365日のオンラインエンジニアサポートをライセンスユーザーに提供します。 詳細については、[IronOCR](licensing)のウェブサイトを参照してください。

よくある質問

.NETプロジェクトで複数言語のTesseract OCRをどのように使用できますか?

IronOCRライブラリを使用すると、複数言語のテキストを含む画像を処理するためのTesseract OCRの統合が簡素化されます。.NETプロジェクトにIronOCR/Tesseract NuGetパッケージを追加し、IronTesseractクラスのLanguageプロパティを使用して言語を設定します。

IronOCRは標準のTesseractに対してどのような利点を提供しますか?

IronOCRは.NETアプリケーション向けによりユーザーフレンドリーなAPIを提供し、120を超える言語を標準でサポートし、精度向上のための高度な画像前処理を提供します。.NETプロジェクトとのシームレスな統合を提供し、開発者向けに広範なドキュメントとサポートを備えています。

IronOCRは複数の言語を同時に処理できますか?

はい、IronOCRはLanguageプロパティで複数の言語を設定することで多言語ドキュメントを処理できます。この機能は、ドキュメントに異なる言語のテキストが含まれ得るグローバルアプリケーションに特に有用です。

C#プロジェクトでIronOCRを設定するプロセスは何ですか?

C#プロジェクトにIronOCRを設定するには、まずVisual StudioのNuGetパッケージマネージャーを介してIronOCR/Tesseract NuGetパッケージをインストールします。その後、コードでIronTesseractクラスのインスタンスを作成し、テキストを含む画像を処理するためのメソッドを使用します。

IronOCRはOCR結果の精度をどのように向上させますか?

IronOCRはテキスト抽出前に画像品質を向上させる高度な画像前処理技術を通じて精度を改善します。この機能は様々な品質の画像からテキストを正確に認識するのに役立ちます。

IronOCRはどのような種類のドキュメントを処理できますか?

IronOCRはスキャンした画像、PDF、デジタルカメラで撮影した写真など、さまざまなドキュメントタイプを処理できます。これらの文書を編集可能で検索可能なデータ形式に変換します。

IronOCRはデータ入力タスクの自動化に適していますか?

はい、IronOCRは印刷されたドキュメントをデジタルテキストに変換することで、データ入力の自動化に非常に効果的で、手動作業を減らし、時間を節約します。金融、健康、教育などの分野で広く使用されています。

IronOCRはOCR技術の実装において開発者をどのように支援しますか?

IronOCRは、広範なドキュメント、使いやすいAPI、24/7オンラインエンジニアサポートを提供し、開発者が.NETアプリケーションにOCR技術を実装しやすくします。

IronOCRの主なユースケースは何ですか?

IronOCRは印刷された文書のデジタル化、データ入力の自動化、請求書の処理、視覚障害者向けのアクセシビリティソフトウェアの開発に使用されます。金融、医療、教育など、さまざまな業界で適用されています。

Kannaopat Udonpant
ソフトウェアエンジニア
ソフトウェアエンジニアになる前に、Kannapatは北海道大学で環境資源の博士号を修了しました。博士号を追求する間に、彼はバイオプロダクションエンジニアリング学科の一部である車両ロボティクスラボラトリーのメンバーになりました。2022年には、C#のスキルを活用してIron Softwareのエンジニアリングチームに参加し、IronPDFに注力しています。Kannapatは、IronPDFの多くのコードを執筆している開発者から直接学んでいるため、この仕事を大切にしています。同僚から学びながら、Iron Softwareでの働く社会的側面も楽しんでいます。コードやドキュメントを書いていない時は、KannapatはPS5でゲームをしたり、『The Last of Us』を再視聴したりしていることが多いです。