ビデオ

IronOCRでOCR言語パックを使用する方法

Kannaopat Udonpant
カンナパット・ウドンパント
2023年12月10日
共有:


このチュートリアルでは、C#でIronOCRを使用して多言語のPDFドキュメントからテキストを抽出する方法を学びます。 このビデオでは、IronOCRの設定と追加言語パック(特に英語と日本語)のインストール方法を説明しています。 OCRエンジンを設定して複数の言語をサポートし、英語と日本語のテキストを含むサンプルPDFに適用する方法を紹介します。 このチュートリアルでは、OCRエンジンを初期化し、入力ファイルを定義し、Readメソッドを使用してテキストを抽出する方法を示します。 抽出されたコンテンツは、操作失敗時のエラーハンドリングを含めて、.txtファイルに保存されます。 これは、IronOCR が 1 回のスキャンで複数の言語を認識することにより、グローバルな文書処理をサポートする優れた例です。 多言語フォーム、国際的な文書、または世界中のPDFを処理する場合、このガイドではC#で正確で言語に配慮したOCR結果を得るのがいかに簡単かを示しています。

さらなる読書: 追加のOCR言語パック

ライブラリ_製品のお試し版_拡張ブロック

Kannaopat Udonpant
カンナパット・ウドンパント
ソフトウェアエンジニア
ソフトウェアエンジニアになる前に、カンナパットは日本の北海道大学から環境資源学の博士号を取得しました。学位を取得する過程で、カンナパットはバイオプロダクション工学部に所属する車両ロボティクス研究所のメンバーにもなりました。2022年には、C#のスキルを活かしてIron Softwareのエンジニアリングチームに参加し、IronPDFに注力しています。カンナパットは、IronPDFで使用されているコードの大部分を作成した開発者から直接学べることに価値を見いだしています。同僚との学び合いに加えて、Iron Softwareで働くことの社会的側面も楽しんでいます。コードやドキュメントを書いていない時には、カンナパットは通常、PS5でゲームをしたり、『The Last of Us』を再視聴したりしています。
< 以前
IronOCRがTesseract 4 Nugetパッケージより優れている理由
次へ >
Tesseractを使用して複数の言語を扱う方法