C#でOCR PDFを読む方法

How to Read PDFs

This article was translated from English: Does it need improvement?
Translated
View the article in English

PDFは、"Portable Document Format "の略です。Adobeが開発したファイル形式で、作成に使用したアプリケーションやプラットフォームに関係なく、ソース文書のフォント、画像、グラフィック、レイアウトを保持します。 PDF ファイルは、通常、ドキュメントを開くためのソフトウェアやハードウェアに関係なく、一貫したフォーマットでドキュメントを共有および表示するために使用されます。 IronOcrは様々なバージョンのPDFドキュメントを簡単に扱えます。

クイックスタート: PDF ファイルを数秒で OCR

IronOCRでOCRを素早くセットアップするには、PDFを指すOcrPdfInputを作成し、Readを呼び出します。 この一行の例は、IronOCRを使ってPDFからテキストを抽出することがいかに簡単であるかを示しています。

Nuget IconGet started making PDFs with NuGet now:

  1. Install IronOCR with NuGet Package Manager

    PM > Install-Package IronOcr

  2. Copy and run this code snippet.

    using var result = new IronOcr.IronTesseract().Read(new IronOcr.OcrPdfInput("document.pdf", PdfContents.TextAndImages));
  3. Deploy to test on your live environment

    Start using IronOCR in your project today with a free trial
    arrow pointer

よくある質問

C#でPDFファイルを読むにはどうすればいいですか?

C#でIronOCRを使用してPDFファイルを読むことができます。IronTesseractクラスをインスタンス化することから始め、ファイルパスを使用してOcrPdfInputオブジェクトを作成するための'using'ステートメントを使用します。最後に、Readメソッドを適用してドキュメントにOCRを実行します。

PDFの特定のページにOCRを実行するために必要なステップは何ですか?

IronOCRを使用してPDFの特定のページにOCRを実行するには、OcrPdfInputを構築する際にPageIndicesパラメータにページインデックスのリストを渡します。IronOCRのページインデックスはゼロから始まるため、最初のページは0としてインデックス付けされます。

PDFのOCRの精度を向上させるにはどうすればよいですか?

IronOCRでPDFのOCRの精度を向上させるには、OcrPdfInputの構築中に高いDPIを指定します。通常は必要ありませんが、より高いDPIは読み取り精度を向上させることができます。

PDFの特定の領域をOCR処理することは可能ですか?

はい、IronOCRを使用すると、SelectRegionメソッドを使用してPDFの特定の領域をOCR処理に選択することができます。これにより、定義された領域からコンテンツを抽出することに集中でき、効率が向上します。

PDFページを読む際のゼロベース番号の重要性は何ですか?

IronOCRでは、PDFページを読む際にページインデックスを指定するためにゼロベース番号が使用されます。これは、最初のページが0としてインデックス付けされることを意味し、正確に処理するページを指定するのに役立ちます。

PDFのOCRを行う際にリソースを手動で管理する必要がありますか?

IronOCRを使用する場合、OcrInputオブジェクトを扱う際に'using'ステートメントを使用することをお勧めします。これにより、OCRプロセスが完了した後にリソースが適切に処分されることが保証されます。

IronOCRを使ってPDFを読むにはどうすれば始められますか?

IronOCRでPDFを読むために始めるには、NuGetからC#ライブラリをダウンロードし、PDFを準備し、ファイルパスでOcrPdfInputオブジェクトを構成し、Readメソッドを使用してOCR処理を行います。

Curtis Chau
テクニカルライター

Curtis Chauは、カールトン大学でコンピュータサイエンスの学士号を取得し、Node.js、TypeScript、JavaScript、およびReactに精通したフロントエンド開発を専門としています。直感的で美しいユーザーインターフェースを作成することに情熱を持ち、Curtisは現代のフレームワークを用いた開発や、構造の良い視覚的に魅力的なマニュアルの作成を楽しんでいます。

開発以外にも、CurtisはIoT(Internet of Things)への強い関心を持ち、ハードウェアとソフトウェアの統合方法を模索しています。余暇には、ゲームをしたりDiscordボットを作成したりして、技術に対する愛情と創造性を組み合わせています。

によってレビュー

A PHP Error was encountered

Severity: Warning

Message: Illegal string offset 'name'

Filename: sections/author_component.php

Line Number: 70

Backtrace:

File: /var/www/ironpdf.com/application/views/main/sections/author_component.php
Line: 70
Function: _error_handler

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 63
Function: view

File: /var/www/ironpdf.com/application/views/products/sections/three_column_docs_page_structure.php
Line: 64
Function: main_view

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 88
Function: view

File: /var/www/ironpdf.com/application/views/products/how-to/index.php
Line: 2
Function: view

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 88
Function: view

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 552
Function: view

File: /var/www/ironpdf.com/application/controllers/Products/Howto.php
Line: 31
Function: render_products_view

File: /var/www/ironpdf.com/index.php
Line: 292
Function: require_once

">

A PHP Error was encountered

Severity: Warning

Message: Illegal string offset 'title'

Filename: sections/author_component.php

Line Number: 84

Backtrace:

File: /var/www/ironpdf.com/application/views/main/sections/author_component.php
Line: 84
Function: _error_handler

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 63
Function: view

File: /var/www/ironpdf.com/application/views/products/sections/three_column_docs_page_structure.php
Line: 64
Function: main_view

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 88
Function: view

File: /var/www/ironpdf.com/application/views/products/how-to/index.php
Line: 2
Function: view

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 88
Function: view

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 552
Function: view

File: /var/www/ironpdf.com/application/controllers/Products/Howto.php
Line: 31
Function: render_products_view

File: /var/www/ironpdf.com/index.php
Line: 292
Function: require_once

A PHP Error was encountered

Severity: Warning

Message: Illegal string offset 'comment'

Filename: sections/author_component.php

Line Number: 85

Backtrace:

File: /var/www/ironpdf.com/application/views/main/sections/author_component.php
Line: 85
Function: _error_handler

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 63
Function: view

File: /var/www/ironpdf.com/application/views/products/sections/three_column_docs_page_structure.php
Line: 64
Function: main_view

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 88
Function: view

File: /var/www/ironpdf.com/application/views/products/how-to/index.php
Line: 2
Function: view

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 88
Function: view

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 552
Function: view

File: /var/www/ironpdf.com/application/controllers/Products/Howto.php
Line: 31
Function: render_products_view

File: /var/www/ironpdf.com/index.php
Line: 292
Function: require_once