So schwärzen Sie Text in PDF mit IronSecureDoc

Chaknith Bin
Chaknith Bin
20. Oktober 2024
Aktualisiert 17. Dezember 2024
Teilen Sie:
This article was translated from English: Does it need improvement?
Translated
View the article in English

In diesem Artikel werden wir besprechen, wie man Text in einem PDF mit IronSecureDoc redigiert. Dies ermöglicht es dem Dienst oder Prozess, sensible Informationen schnell und einfach zu schwärzen, indem eine einfache POST-Anfrage mit dem PDF an den laufenden IronSecureDoc-Server gesendet wird. Wir werden dies visuell anhand der Nutzung von Swagger-Dokumenten demonstrieren. Die POST-Anfrage nimmt sowohl erforderliche als auch optionale Parameter auf und ist hochgradig anpassbar; Die Antwort liefert das PDF mit dem geschwärzten Text zurück.

Ziehen und Starten von IronSecureDoc

Wenn Sie IronSecureDoc noch nicht gestartet haben, folgen Sie bitte den unten stehenden Links, um es einzurichten:

Lokal hostenIn die Cloud bereitstellen

Die [POST] Redact Text API

Der [POST] Redact Text-API-Endpunkt ermöglicht es Ihnen, sensiblen Text in einem PDF-Dokument durch Schwärzung zu verbergen. Diese Funktionalität ist essenziell für Anwendungen, die mit vertraulichen Dokumenten umgehen, wie beispielsweise juristischen Verträgen, medizinischen Unterlagen oder Finanzberichten. Durch die Verwendung dieser API können Sie sicherstellen, dass bestimmter Text dauerhaft entfernt wird, was eine verbesserte Sicherheit bietet und die Einhaltung von Datenschutzstandards gewährleistet.

Bitte beachten Sie
Sobald ein Text redigiert ist, kann der Inhalt nicht mehr wiederhergestellt werden.

Swagger

Swagger ist ein leistungsstarkes Werkzeug, das Entwicklern ermöglicht, über eine benutzerfreundliche Web-Oberfläche mit RESTful-APIs zu interagieren. Egal, ob Sie Sprachen wie Python, Java oder andere verwenden, Swagger bietet eine bequeme Möglichkeit, diese API zu testen und zu implementieren.

Schritte zum Schwärzen von Text mit Swagger

  1. Zugriff auf die Swagger-Oberfläche:

    Wenn Ihr API-Server lokal läuft, können Sie Swagger aufrufen, indem Sie in Ihrem Webbrowser zu http://localhost:8080/swagger/index.html navigieren.

    Swagger-Dokumentation

  2. Finden Sie die [POST] Redact Text API:

    Im Swagger UI finden Sie den [POST] /v1/document-services/pdfs/redact-text Endpunkt.

    Text schwärzen

  3. Konfigurationen festlegen:

    In diesem Beispiel stelle ich sowohl die PDF-Datei als auch die zu schwärzenden Wörter in der POST-Anfrage bereit. Wir werden das Wort "wir" schwärzen und ein schwarzes Kästchen darüber legen. Für diese Demonstration verwenden wir die Datei 'sample.pdf' mit den folgenden Konfigurationen:

    • draw_black_box: true
    • match_whole_word: true
    • words_to_redact: wir
  4. Laden Sie ein Beispiel-PDF hoch:

    Laden Sie im Anfragekörper eine Beispiel-PDF-Datei hoch, auf die Sie die Schwärzung anwenden möchten. Stellen Sie sicher, dass die Datei als pdf_file hinzugefügt wird.

  5. Die Anforderung ausführen:

    Klicken Sie auf "Ausführen", um die Anfrage auszuführen. Die Antwort wird das geschwärzte PDF enthalten. Diese Swagger-UI-Interaktion ermöglicht es Ihnen, den Schwärzungsprozess einfach zu testen und bietet sofortiges Feedback.

    Das Ergebnis verstehen

Wir führen die POST-Anfrage aus, nachdem wir die erforderlichen Parameter im Swagger-Dokument eingegeben haben. Bei Erfolg gibt die Anfrage einen 200-Statuscode mit einer bearbeiteten PDF-Datei zurück, die wie im obigen Beispiel heruntergeladen werden kann.

Die oben geänderte PDF-Datei zeigt Bereiche, in denen das Wort „wir“ erscheint und durch ein schwarzes Kästchen ersetzt wird. Außerdem ist der boolesche Wert match_whole_word auf True gesetzt, was darauf hinweist, dass wir nur ganze Wörter und keine Teilübereinstimmungen innerhalb von Wörtern schwärzen.

-->


Verwenden Sie eine CURL-Anfrage über die Eingabeaufforderung

Alternativ können wir die Eingabeaufforderung mit einer curl POST-Anfrage verwenden, um das gleiche Ergebnis zu erzielen.

curl -X POST 'http://localhost:8080/v1/document-services/pdfs/redact-text' \
 -H 'accept: */*' \
 -H 'Content-Type: multipart/form-data' \
 -F 'pdf_file=@sample.pdf;type=application/pdf' \
 -F 'words_to_redact="we"' \
 -F 'draw_black_box=true' \
 -F 'match_whole_word=true'

Bitte beachten Sie
Standardmäßig kann PowerShell curl als Alias für Invoke-WebRequest interpretieren, ein eingebautes PowerShell-Cmdlet. Versuchen Sie, curl.exe anstelle von curl zu verwenden.

curl.exe --version

Erforderliche Parameter des Anfragekörpers

Name

Optionale Parameter des Anfragekörpers

NameData TypeDescription
user_passwordstringThis is required if the input PDF has a user password. The operation will fail if no password is provided for the password-protected PDF.
owner_passwordstringThis is required if the input PDF has an owner password. The operation will fail if no password is provided for the password-protected PDF.
specific_pagesarray[int]Allows you to specify which pages to redact text on. By default, the value is null, meaning the provided word in all the pages will be redacted.
draw_black_boxbooleanAllows you to specify whether to draw a black box over the redacted text. By default, this value is set to True.
match_whole_wordbooleanSpecifies whether partial matches within words should also be redacted. For example, if the provided word is "are," any words containing "are," such as "hare," will have the "are" redacted as well. By default, this is set to True.
match_casebooleanSpecifies whether the provided word should be an exact match in terms of case. By default, this value is null. Note: Setting this to True means that lowercase and uppercase strings will not be matched. For example, if the provided word is "WE," the lowercase version "we" would not be redacted.
overlay_textstringIt specifies the overlay text, such as words or symbols, over the redacted text. By default, this string is empty.
save_as_pdfabooleanSaves the modified PDF with PDF/A-3 compliance. By default, this is set to False.
save_as_pdfuabooleanSaves the modified PDF with PDF/UA compliance. By default, this is set to False.

Optionale Header-Parameter

NameData TypeDescription
authorstringUseful for identifying you as the author of the PDF document. By default, this field is empty.
titlestringDisplays the title of the PDF document. By default, this field is empty.
subjectstringUseful for identifying the content of the PDF document at a glance. By default, this field is empty.
Chaknith Bin
Software-Ingenieur
Chaknith arbeitet an IronXL und IronBarcode. Er hat tiefgehende Expertise in C# und .NET und hilft, die Software zu verbessern und Kunden zu unterstützen. Seine Erkenntnisse aus Benutzerinteraktionen tragen zu besseren Produkten, Dokumentation und einem insgesamt besseren Erlebnis bei.