Wie man Ergebnisse als durchsuchbares PDF in C# speichert

How to Save Results as a Searchable PDF

This article was translated from English: Does it need improvement?
Translated
View the article in English

A searchable PDF, often referred to as an OCR (Optical Character Recognition) PDF, is a type of PDF document that contains both scanned images and machine-readable text. These PDFs are created by performing OCR on scanned paper documents or images, recognizing the text in the images, and converting it into selectable and searchable text.

IronOCR provides a solution for performing optical character recognition on documents and exporting the results as searchable PDFs. It supports exporting searchable PDFs as files, bytes, and streams.

Quickstart: Export Searchable PDF in One Line

Set RenderSearchablePdf = true, run Read(...) on your input, and invoke SaveAsSearchablePdf(...) — that’s all it takes to generate a fully searchable PDF with IronOCR.

Nuget IconGet started making PDFs with NuGet now:

  1. Install IronOCR with NuGet Package Manager

    PM > Install-Package IronOcr

  2. Copy and run this code snippet.

    new IronOcr.IronTesseract { Configuration = { RenderSearchablePdf = true } } .Read(new IronOcr.OcrImageInput("file.jpg")).SaveAsSearchablePdf("searchable.pdf");
  3. Deploy to test on your live environment

    Start using IronOCR in your project today with a free trial
    arrow pointer


Export as Searchable PDF Example

Here's how you can export the result as a searchable PDF using IronOCR. You must first set the Configuration.RenderSearchablePdf property to true. After obtaining the OCR result object from the Read method, use the SaveAsSearchablePdf method by specifying the output file path. The code below demonstrates using a sample TIFF file.

:path=/static-assets/ocr/content-code-examples/how-to/searchable-pdf-searchable-pdf.cs
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Enable render as searchable PDF
ocrTesseract.Configuration.RenderSearchablePdf = true;

// Add image
using var imageInput = new OcrImageInput("Potter.tiff");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);

// Export as searchable PDF
ocrResult.SaveAsSearchablePdf("searchablePdf.pdf");
Imports IronOcr

' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()

' Enable render as searchable PDF
ocrTesseract.Configuration.RenderSearchablePdf = True

' Add image
Dim imageInput = New OcrImageInput("Potter.tiff")
' Perform OCR
Dim ocrResult As OcrResult = ocrTesseract.Read(imageInput)

' Export as searchable PDF
ocrResult.SaveAsSearchablePdf("searchablePdf.pdf")
$vbLabelText   $csharpLabel

Below is a screenshot of the sample TIFF and an embedded searchable PDF. Attempt to select the text in the PDF to confirm its searchability. The ability to select also means the text can be searched in a PDF viewer.

Hinweis:IronOCR uses a particular font to overlay text on the image file, which might result in some discrepancies in text size.

TIFF file

Export as Searchable PDF with filters applied

The SaveAsSearchablePdf also accepts a boolean flag as a second parameter that allows you to apply filters to a searchable PDF or not, giving developers the flexibility to choose.

Below is an example of applying the grayscale and then saving the PDF with a filter by putting true in the second parameter of SaveAsSearchablePdf.

:path=/static-assets/ocr/content-code-examples/how-to/image-quality-correction-searchable-pdf.cs
using IronOcr;

var ocr = new IronTesseract();
var ocrInput = new OcrInput();

// Load a PDF file
ocrInput.LoadPdf("invoice.pdf");

// Apply gray scale filter
ocrInput.ToGrayScale();
OcrResult result = ocr.Read(ocrInput);

// Save the result as a searchable PDF with filters applied
result.SaveAsSearchablePdf("outputGrayscale.pdf", true);
IRON VB CONVERTER ERROR developers@ironsoftware.com
$vbLabelText   $csharpLabel

Searchable PDF as Byte and Stream

The output of the searchable PDF can also be handled as bytes or streams using SaveAsSearchablePdfBytes and SaveAsSearchablePdfStream methods, respectively. The code example below shows how to utilize these methods.

:path=/static-assets/ocr/content-code-examples/how-to/searchable-pdf-searchable-pdf-byte-stream.cs
// Export searchable PDF byte
byte[] pdfByte = ocrResult.SaveAsSearchablePdfBytes();

// Export searchable PDF stream
Stream pdfStream = ocrResult.SaveAsSearchablePdfStream();
' Export searchable PDF byte
Dim pdfByte() As Byte = ocrResult.SaveAsSearchablePdfBytes()

' Export searchable PDF stream
Dim pdfStream As Stream = ocrResult.SaveAsSearchablePdfStream()
$vbLabelText   $csharpLabel

Häufig gestellte Fragen

Was ist ein durchsuchbares PDF?

Ein durchsuchbares PDF ist ein Dokument, das gescannte Bilder mit maschinenlesbarem Text kombiniert, erstellt durch die Durchführung von OCR auf gescannten Dokumenten oder Bildern, was es den Benutzern ermöglicht, Text im Dokument auszuwählen und zu durchsuchen.

Wie kann ich gescannte Dokumente in durchsuchbare PDFs in C# umwandeln?

Um gescannte Dokumente in durchsuchbare PDFs in C# umzuwandeln, verwenden Sie IronOCR, indem Sie die Eigenschaft Configuration.RenderSearchablePdf auf true setzen, OCR mit der Methode Read ausführen und den Output dann mit SaveAsSearchablePdf speichern.

Kann ich durchsuchbare PDFs als Bytes oder Streams exportieren?

Ja, IronOCR ermöglicht den Export von durchsuchbaren PDFs als Bytes mit der Methode SaveAsSearchablePdfBytes und als Streams mit der Methode SaveAsSearchablePdfStream.

Wie gehe ich mit verschiedenen Dateiformaten zur OCR-Verarbeitung um?

IronOCR unterstützt verschiedene Dateiformate wie TIFF für die OCR-Verarbeitung, wodurch die Erstellung von durchsuchbaren PDFs aus diesen Formaten ermöglicht wird.

Ist es möglich, Text in einem durchsuchbaren PDF auszuwählen und zu durchsuchen, das mit OCR-Technologie erstellt wurde?

Ja, durchsuchbare PDFs, die mit der IronOCR-Technologie erstellt wurden, ermöglichen die Textauswahl und Durchsuchbarkeit innerhalb eines PDF-Viewers.

Welche Schritte sind bei der Erstellung eines durchsuchbaren PDFs mit OCR beteiligt?

Die Schritte beinhalten das Herunterladen der IronOCR C#-Bibliothek, das Vorbereiten der Dokumente für OCR, das Setzen der Eigenschaft RenderSearchablePdf auf true und die Verwendung der Methode SaveAsSearchablePdf, um die Datei zu speichern.

Wie kann ich sicherstellen, dass der Text in meinem PDF durchsuchbar ist?

Stellen Sie sicher, dass der Text durchsuchbar ist, indem Sie IronOCR verwenden, um OCR auf Ihren Bildern durchzuführen und die Eigenschaft RenderSearchablePdf auf true setzen, bevor Sie das Dokument speichern.

Verwendet IronOCR eine spezifische Schriftart für Überlagerungstext in durchsuchbaren PDFs?

Ja, IronOCR verwendet eine spezifische Schriftart für Überlagerungstext auf Bilddateien, was zu einigen Abweichungen in der Textgröße führen kann.

Chaknith Bin
Software Ingenieur
Chaknith arbeitet an IronXL und IronBarcode. Er hat umfassende Expertise in C# und .NET und hilft, die Software zu verbessern und Kunden zu unterstützen. Seine Einblicke aus Benutzerinteraktionen tragen zu besseren Produkten, Dokumentationen und einem insgesamt besseren Erlebnis bei.
Rezensiert von
Jeff Fritz
Jeffrey T. Fritz
Principal Program Manager - .NET Community Team
Jeff ist außerdem Principal Program Manager für das .NET- und Visual Studio-Team. Er ist der ausführende Produzent der .NET Conf Virtual Conference Series und moderiert ‚Fritz and Friends‘, einen Livestream für Entwickler, der zweimal wöchentlich ausgestrahlt wird. Dort spricht er über Technik und schreibt gemeinsam mit den Zuschauern Code. Jeff schreibt Workshops, Präsentationen und plant Inhalte für die größten Microsoft-Entwicklerveranstaltungen, einschließlich Microsoft Build, Microsoft Ignite, .NET Conf und dem Microsoft MVP Summit.
Bereit anzufangen?
Nuget Downloads 5,044,537 | Version: 2025.11 gerade veröffentlicht