透かしなしで本番環境でテストしてください。
必要な場所で動作します。
30日間、完全に機能する製品をご利用いただけます。
数分で稼働させることができます。
製品トライアル期間中にサポートエンジニアリングチームへの完全アクセス
このチュートリアルは、IronOCRと組み合わせてTesseractを使用し、PDFや画像から複数の言語でテキストを認識するための包括的なガイドを提供します。 まず、Nougetパッケージマネージャーを使用して、プロジェクトにIR OCRと必要な言語パックがインストールされていることを確認します。 必要な名前空間をインポートし、有効なライセンスキーを使ってIronOCRをセットアップし、その機能を最大限に活用します。 IronOCR Tesseract オブジェクトをインスタンス化して光学式文字認識を実行し、最初に英語をデフォルトの言語として使用します。 追加の言語、例えばロシア語をサポートするには、「add secondary language」メソッドを利用してください。
OCR PDF入力クラスを使用して、さまざまな言語のテキストを含む「example.PDF」という名前のPDFファイルを読み込みます。 OCRを実行してテキストコンテンツを抽出し、その結果を指定されたオブジェクトに保存します。 多言語文字の正確な表示を保証するために、コンソール出力エンコーディングをUnicodeに設定してから、抽出されたテキストをコンソールに出力してください。
さらに、主要言語をロシア語に調整し、日本語を第二言語として追加してください。 この変更により、ロシア語と日本語のテキスト両方の認識が容易になります。 OCR画像入力クラスを使用して多言語テキストを含む画像ファイル「example.png」を読み込み、設定された言語設定でOCRを実行します。 結果を保存し、画像から抽出したテキストをコンソールに出力します。
これらの手順に従うことで、さまざまなファイル形式から英語、ロシア語、日本語のテキストをシームレスに抽出して認識できます。このチュートリアルは、TesseractとIronOCRを使用して複数の言語を効果的に活用し、PDFや画像内の多言語テキストを簡単に処理できることを強調しています。 チュートリアルをさらに見るには、IronOCRを使い始めるには、Iron Softwareを購読し、トライアルに登録することを検討してください。
さらに読む: Tesseractを使用して複数の言語を使用する方法
ライブラリ_製品のお試し版_拡張ブロック
30日間の試用キーをすぐに取得。
15日間の試用キー 即時発行。
Install-Package IronOcr
質問がありますか?開発チームに連絡する
クレジットカードは不要です
試用キーはメールに送信されるはずです。
正常に送信されました。
もし届かない場合は、
support@ironsoftware.comにお問い合わせください。
無料で始めましょう
クレジットカードは不要です
透かしなしで本番環境でテストしてください。
必要な場所で動作します。
30日間、完全に機能する製品をご利用いただけます。
数分で稼働させることができます。
製品トライアル期間中にサポートエンジニアリングチームへの完全アクセス
クレジットカードやアカウント作成は不要です。
試用キーはメールにあるはずです。
もしない場合は、
support@ironsoftware.comまでご連絡ください。
無料で始めましょう
クレジットカードは不要です
透かしなしで本番環境でテストしてください。
必要な場所で動作します。
30日間、完全に機能する製品をご利用いただけます。
数分で稼働させることができます。
製品トライアル期間中にサポートエンジニアリングチームへの完全アクセス
30分の個別デモを予約する。
契約なし、カード情報不要、義務なし。
10 .NET API製品オフィスドキュメントのために