検索可能なPDFとして結果を保存する方法
検索可能なPDF、しばしばOCRと呼ばれています(光学文字認識)PDFは、スキャンした画像と機械可読テキストの両方を含むPDFドキュメントの一種です。 これらのPDFは、スキャンされた紙のドキュメントや画像にOCRを実行することによって作成され、画像内のテキストを認識し、選択可能で検索可能なテキストに変換します。
IronOCRは、文書の光学文字認識を行い、その結果を検索可能なPDFとしてエクスポートするためのソリューションを提供します。 ファイル、バイト、ストリームとして検索可能なPDFのエクスポートをサポートします。
IronOCRを始めましょう
今日から無料トライアルでIronOCRをあなたのプロジェクトで使い始めましょう。
検索可能なPDFとして結果を保存する方法
検索可能なPDFとしてエクスポート例
結果を検索可能なPDFとしてエクスポートするには、ユーザーはまずConfiguration.RenderSearchablePdfプロパティをtrueに設定する必要があります。 Read
メソッドからOCR結果オブジェクトを取得した後、出力ファイルパスを指定してSaveAsSearchablePdf
メソッドを使用します。 以下に示すコードは次のものを使用してこれを示していますサンプルTIFFファイル。
:path=/static-assets/ocr/content-code-examples/how-to/searchable-pdf-searchable-pdf.cs
using IronOcr;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Enable render as searchable PDF
ocrTesseract.Configuration.RenderSearchablePdf = true;
// Add image
using var imageInput = new OcrImageInput("Potter.tiff");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
// Export as searchable PDF
ocrResult.SaveAsSearchablePdf("searchablePdf.pdf");
Imports IronOcr
' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()
' Enable render as searchable PDF
ocrTesseract.Configuration.RenderSearchablePdf = True
' Add image
Dim imageInput = New OcrImageInput("Potter.tiff")
' Perform OCR
Dim ocrResult As OcrResult = ocrTesseract.Read(imageInput)
' Export as searchable PDF
ocrResult.SaveAsSearchablePdf("searchablePdf.pdf")
以下は、サンプルTIFFと埋め込み可能な検索対応PDFのスクリーンショットです。 検索可能なPDFを選択して、テキストが選択可能かどうかを確認してみてください。 選択可能なテキストは、PDFビューアソフトウェアでの検索機能も可能にします。
次の内容にご注意ください。
TIFFファイル
検索可能なPDF
バイトおよびストリームとしての検索可能なPDF
検索可能なPDFファイルのバイトおよびストリーム情報は、それぞれ SaveAsSearchablePdfBytes
および SaveAsSearchablePdfStream
メソッドを使用して出力することもできます。 以下のコード例は、これらのメソッドを使用する方法を示しています。
:path=/static-assets/ocr/content-code-examples/how-to/searchable-pdf-searchable-pdf-byte-stream.cs
// Export searchable PDF byte
byte[] pdfByte = ocrResult.SaveAsSearchablePdfBytes();
// Export searchable PDF stream
Stream pdfStream = ocrResult.SaveAsSearchablePdfStream();
' Export searchable PDF byte
Dim pdfByte() As Byte = ocrResult.SaveAsSearchablePdfBytes()
' Export searchable PDF stream
Dim pdfStream As Stream = ocrResult.SaveAsSearchablePdfStream()