Highlight Texts As Images

This article was translated from English: Does it need improvement?
Translated
View the article in English

Das Visualisieren von OCR-Ergebnissen umfasst die Darstellung von Begrenzungsrahmen um die spezifischen Textelemente, die die Engine innerhalb eines Bildes erkannt hat. Dieser Prozess überlagert deutliche Hervorhebungen an den genauen Positionen einzelner Zeichen, Wörter, Zeilen oder Absätze und bietet eine klare Karte des erkannten Inhalts.

Dieses visuelle Feedback ist entscheidend für das Debugging und die Validierung der Genauigkeit der OCR-Ausgabe, sodass Entwickler sehen können, was die Software identifiziert hat und wo sie Fehler gemacht hat.

In diesem Artikel zeigen wir, wie IronOCR es Entwicklern ermöglicht, mit seiner HighlightTextAndSaveAsImages-Methode einfach Diagnosen durchzuführen. Diese Funktion ermöglicht es Entwicklern, bestimmte Textabschnitte hervorzuheben und sie zur Überprüfung als Bilder zu speichern.

als-Überschrift:2(Schnellstart: Wörter in Ihrem PDF sofort hervorheben)

Dieser Ausschnitt zeigt, wie einfach es ist, IronOCR zu verwenden: Laden Sie ein PDF und heben Sie jedes Wort im Dokument hervor, wobei das Ergebnis als Bilder gespeichert wird. Nur eine Zeile, um visuelles Feedback zu Ihren OCR-Ergebnissen zu erhalten und alles reibungslos zu überprüfen.

Nuget IconGet started making PDFs with NuGet now:

  1. Install IronOCR with NuGet Package Manager

    PM > Install-Package IronOcr

  2. Copy and run this code snippet.

    new IronOcr.OcrInput().LoadPdf("document.pdf").HighlightTextAndSaveAsImages(new IronOcr.IronTesseract(), "highlight_page_", IronOcr.ResultHighlightType.Word);
  3. Deploy to test on your live environment

    Start using IronOCR in your project today with a free trial
    arrow pointer
class="hsg-featured-snippet">

Minimaler Arbeitsablauf (5 Schritte)

  1. Laden Sie eine C#-Bibliothek herunter, um Seitenrotation zu erkennen
  2. OCR-Engine initiieren
  3. Laden Sie das PDF-Dokument mit LoadPdf
  4. Mit HighlightTextAndSaveAsImages Textabschnitt hervorheben und als Bilder speichern

Beispiel: Text hervorheben und als Bilder speichern

Das Hervorheben von Text und das Speichern als Bilder ist mit IronOCR ganz einfach. In diesem Beispiel laden wir ein vorhandenes PDF mit LoadPdf und rufen dann die HighlightTextAndSaveAsImages-Methode auf, um Abschnitte des Textes hervorzuheben und als Bilder zu speichern.

Die Methode nimmt drei Parameter an: die IronTesseract OCR-Engine, ein Präfix für den Ausgabedateinamen und ein Enum aus ResultHighlightType, das festlegt, welche Art von Text hervorgehoben werden soll. In diesem Beispiel verwenden wir ResultHighlightType.Paragraph, um die Textblöcke als Absätze hervorzuheben.

Hinweis:Diese Funktion wird das Ausgabepräfix für den String verwenden und jedem Ausgabebilddateinamen einen Seitenbezeichner (z. B. "page_0", "page_1") hinzufügen.

Wir verwenden dieses Beispiel-PDF mit drei Absätzen.

Eingabe

Code

Schauen wir uns den Beispielcode unten an.

:path=/static-assets/ocr/content-code-examples/how-to/highlight-texts-as-images.cs
using IronOcr;

IronTesseract ocrTesseract = new IronTesseract();

using var ocrInput = new OcrInput();
ocrInput.LoadPdf("document.pdf");
ocrInput.HighlightTextAndSaveAsImages(ocrTesseract, "highlight_page_", ResultHighlightType.Paragraph);
Imports IronOcr

Private ocrTesseract As New IronTesseract()

Private ocrInput = New OcrInput()
ocrInput.LoadPdf("document.pdf")
ocrInput.HighlightTextAndSaveAsImages(ocrTesseract, "highlight_page_", ResultHighlightType.Paragraph)
$vbLabelText   $csharpLabel

Ausgabebilder

class="content-img-align-center">
style="width=50%">Hervorgehobene Textausgabe

Wie Sie im obigen Ausgabebild sehen können, wurden alle drei Absätze mit einem hellroten Kasten hervorgehoben.

ResultHighlightType

Im obigen Beispiel haben wir ResultHighlightType.Paragraph verwendet, um Textblöcke hervorzuheben. IronOCR bietet zusätzliche Hervorhebungsoptionen durch dieses Enum. Unten ist eine vollständige Liste der verfügbaren Typen.

Zeichen: Diese Option bietet die detaillierteste Analyseebene, indem sie einen Begrenzungsrahmen um jedes einzelne Zeichen zieht, das die OCR-Engine erkennt, entsprechend jedem IronOcr.OcrResult.Character.

Wort: Wenn auf Wort eingestellt, hebt die Methode jedes komplette Wort hervor, das von der Engine erkannt wurde, was hilft, die Wortsegmentierung und den Abstand jedes Wortes zu überprüfen.

Zeile: Diese Option hebt jede erkannte Zeile mit IronOCR hervor und hebt sie als jede Textzeile hervor.

Absatz: Für einen höherwertigen Blick auf die Dokumentstruktur hebt diese Option ganze Textblöcke hervor, die die Engine als Absatz gruppiert hat.

Häufig gestellte Fragen

Was ist der Zweck der Hervorhebung von Texten als Bilder in IronOCR?

Das Hervorheben von Texten als Bilder in IronOCR wird verwendet, um OCR-Ergebnisse zu visualisieren, indem Begrenzungsrahmen um erkannte Textelemente in einem Bild gerendert werden. Dieser Prozess hilft, die Genauigkeit der OCR-Ausgabe zu debuggen und zu validieren, indem eine klare Karte des erkannten Inhalts bereitgestellt wird.

Wie funktioniert die HighlightTextAndSaveAsImages-Methode von IronOCR?

Die HighlightTextAndSaveAsImages-Methode in IronOCR ermöglicht es Entwicklern, bestimmte Textabschnitte hervorzuheben und als Bilder zu speichern. Sie nimmt drei Parameter: die IronTesseract OCR-Engine, ein Präfix für den Ausgabedateinamen und ein ResultHighlightType-Enum, das den zu hervorhebenden Texttyp angibt.

Welche Hervorhebungstypen stehen in IronOCR zur Verfügung?

IronOCR bietet vier Hervorhebungstypen über das ResultHighlightType-Enum an: Zeichen, Wort, Zeile und Absatz. Jeder Typ bietet eine andere Detailebene, von einzelnen Zeichen bis hin zu ganzen Absätzen.

Kann IronOCR Text in PDF-Dokumenten hervorheben?

Ja, IronOCR kann Text in PDF-Dokumenten hervorheben. Sie können ein PDF mit der LoadPdf-Methode laden und HighlightTextAndSaveAsImages verwenden, um bestimmte Textabschnitte hervorzuheben und als Bilder zu speichern.

Was ist der Vorteil der Verwendung des Absatz-Hervorhebungstyps in IronOCR?

Der Absatz-Hervorhebungstyp in IronOCR bietet eine höhere Sicht auf die Dokumentstruktur, indem ganze Textblöcke, die als Absätze gruppiert sind, hervorgehoben werden. Dies ist nützlich für die Visualisierung des Flusses und der Organisation von Text innerhalb eines Dokuments.

Wie können Entwickler mit der Text-Hervorhebung in IronOCR beginnen?

Entwickler können mit der Text-Hervorhebung in IronOCR beginnen, indem sie eine C#-Bibliothek herunterladen, die OCR-Engine initialisieren, ein PDF-Dokument mit LoadPdf laden und dann die HighlightTextAndSaveAsImages-Methode anwenden, um Textabschnitte hervorzuheben und als Bilder zu speichern.

Welches Codebeispiel wird für die Hervorhebung von Texten als Bilder in IronOCR bereitgestellt?

Die Webseite bietet ein C#-Codebeispiel, das zeigt, wie man ein PDF mit LoadPdf lädt, die HighlightTextAndSaveAsImages-Methode anwendet und den hervorgehobenen Text als Bilder mit der Option ResultHighlightType.Paragraph speichert.

Curtis Chau
Technischer Autor

Curtis Chau hat einen Bachelor-Abschluss in Informatik von der Carleton University und ist spezialisiert auf Frontend-Entwicklung mit Expertise in Node.js, TypeScript, JavaScript und React. Leidenschaftlich widmet er sich der Erstellung intuitiver und ästhetisch ansprechender Benutzerschnittstellen und arbeitet gerne mit modernen Frameworks sowie der Erstellung gut strukturierter, optisch ansprechender ...

Weiterlesen
Bereit anzufangen?
Nuget Downloads 5,044,537 | Version: 2025.11 gerade veröffentlicht