Wie man Bereiche in PDF-Dateien mit C# schwärzt

This article was translated from English: Does it need improvement?
Translated
View the article in English

Das Schwärzen sensibler Informationen in PDF-Dokumenten ist von entscheidender Bedeutung, um die Vertraulichkeit zu gewährleisten und die Datenschutzbestimmungen einzuhalten. Die [POST] Redact Region API von IronSecure Doc bietet eine effiziente Möglichkeit, sensible Texte und Informationen in bestimmten Bereichen eines PDF-Dokuments durch echte Schwärzung auszublenden. Diese API gewährleistet, dass die geschwärzten Daten vollständig entfernt werden und nicht wiederhergestellt werden können. Dadurch eignet sie sich ideal für die Bearbeitung vertraulicher Informationen in juristischen, finanziellen oder persönlichen Dokumenten.

Ziehen und starten Sie IronSecureDoc

Falls IronSecureDoc noch nicht installiert ist, folgen Sie bitte den unten stehenden Links zur Einrichtung:

Lokal hosten Bereitstellung in der Cloud

Die [POST] Redact Region API

Der [POST] Redact Region API-Endpunkt ermöglicht es Ihnen, sensible Informationen innerhalb bestimmter Bereiche eines PDF-Dokuments mittels echter Schwärzung auszublenden. Diese Funktion ist von entscheidender Bedeutung für Anwendungen, die vertrauliche Dokumente verwalten, wie beispielsweise Rechtsverträge, Krankenakten oder Finanzberichte. Durch die Nutzung dieser API können Sie sicherstellen, dass sensible Texte in definierten Bereichen eines PDFs dauerhaft entfernt werden, was sowohl Sicherheit als auch Compliance bietet.

Hinweis:Sobald ein Bereich geschwärzt ist, können die Inhalte innerhalb dieses Bereichs nicht wiederhergestellt werden.

Es mit Selbstbewusstsein ausprobieren

Swagger ist ein leistungsstarkes Tool, das es Entwicklern ermöglicht, über eine benutzerfreundliche Weboberfläche mit RESTful APIs zu interagieren. Egal ob Sie Sprachen wie Python, Java oder andere verwenden, Swagger bietet eine komfortable Möglichkeit, diese API zu testen und zu implementieren.

Schritte zum Schwärzen von Bereichen mit Swagger

  1. Zugriff auf die Swagger-UI:

    Wenn Ihr API-Server lokal läuft, können Sie auf Swagger zugreifen, indem Sie in Ihrem Webbrowser zu http://localhost:8080/swagger/index.html navigieren.

! Swagger-Dokumentation

  1. Suchen Sie die [POST] Redact Region API:

    Suchen Sie innerhalb der Swagger-UI den Endpunkt [POST] /v1/document-services/pdfs/redact-region.

! Schwärzungsbereiche

  1. Schwärzungskoordinaten angeben:

    In diesem Beispiel entfernen wir eine Tabelle aus der PDF-Datei auf Seite 1 (d. h. Seite 2). Verwenden Sie die folgenden Koordinaten, um den Schwärzungsbereich zu definieren:

    • Seitenindex (spezifische_Seiten): 1
    • X-Koordinate (region_to_redact_x): 60
    • Y-Koordinate (region_to_redact_y): 270
    • Breite (region_to_redact_w): 470
    • Höhe (region_to_redact_h): 200
  2. Optionale Parameter festlegen:

    Optional können Sie ein Benutzer- oder Eigentümerpasswort hinzufügen, bestimmte Seiten angeben oder entscheiden, ob der geschwärzte Bereich mit einem schwarzen Rahmen überdeckt und das Dokument im PDF/A- oder PDF/UA-Format gespeichert werden soll.

! Swagger eingeben

  1. Laden Sie eine PDF-Beispieldatei hoch:

    Laden Sie im Anfragetext eine PDF-Beispieldatei hoch, in der Sie die Schwärzung anwenden möchten. Stellen Sie sicher, dass die Datei als pdf_file hinzugefügt wird.

  2. Führe die Anfrage aus:

    Klicken Sie auf "Ausführen", um die Anfrage zu starten. Die Antwort enthält die redigierte PDF-Datei, wobei die Tabelle wie angegeben ab Seite 1 entfernt wurde.

    Response

    Diese Swagger UI-Interaktion ermöglicht es Ihnen, den Schwärzungsprozess einfach zu testen und gibt Ihnen sofortiges Feedback darüber, wie sich die Koordinaten auf den PDF-Inhalt auswirken.

  3. Überprüfen Sie die Ausgabedatei (PDF):

    Der geschwärzte Bereich befindet sich auf Seite 2.


Eingabeparameter verstehen

Bevor Sie diese API verwenden, ist es unerlässlich, die erforderlichen und optionalen Eingabeparameter zum Schwärzen eines Bereichs in Ihrem PDF zu verstehen. Mithilfe dieser Parameter lässt sich der spezifische zu schwärzende Bereich definieren.

Wichtige Parameter

  • pdf_file: Das PDF-Dokument, das Sie schwärzen möchten.
  • region_to_redact_x: X-Koordinate des zu schwärzenden Bereichs (beginnend unten links auf der Seite).
  • region_to_redact_y: Y-Koordinate des zu schwärzenden Bereichs (beginnend unten links auf der Seite).
  • region_to_redact_w: Breite des zu schwärzenden Bereichs.
  • region_to_redact_h: Höhe des zu schwärzenden Bereichs.

Optionale Parameter

  • Benutzerpasswort: Falls die PDF-Datei passwortgeschützt ist, geben Sie bitte das Benutzerpasswort an.
  • owner_password: Geben Sie das Besitzerpasswort an, wenn Änderungen eingeschränkt sind.
  • specific_pages: Geben Sie an, welche Seiten geschwärzt werden sollen. Sofern keine Angabe erfolgt, gilt die Schwärzung für alle Seiten.
  • save_as_pdfa: Speichert die PDF-Datei im PDF/A-3-Format.
  • save_as_pdfua: Speichert die PDF-Datei mit PDF/UA-Konformität.

API-Integration: Python-Beispiel

Sobald Sie mit den Parametern vertraut sind, können Sie diese API mit Ihrer bevorzugten Programmiersprache aufrufen. Nachfolgend finden Sie ein Beispiel für die Integration dieser API mit Python.

import requests

# Define the API endpoint URL
url = 'http://localhost:8080/v1/document-services/pdfs/redact-region'

# Set the headers for the request (optional relevant metadata)
headers = {
    'accept': '*/*',
    'author': 'Iron Software',
    'title': 'REDACT REGION DEMO 2024',
    'subject': 'DEMO EXAMPLE'
}

# Open the PDF file to be redacted in binary read mode
files = {
    'pdf_file': ('sample_file.pdf', open('sample_file.pdf', 'rb'), 'application/pdf')
}

# Define the coordinates and page for the redaction region
data = {
    'region_to_redact_x': '60',  # X-coordinate starting at the bottom-left
    'region_to_redact_y': '270', # Y-coordinate starting at the bottom-left
    'region_to_redact_w': '470', # Width of the region to be redacted
    'region_to_redact_h': '200', # Height of the region to be redacted
    'specific_pages': [1]        # Specify the page index to redact
}

# Make the POST request to the API with the provided parameters and file
response = requests.post(url, headers=headers, files=files, data=data)

# Save the redacted PDF response to a new file
with open('redacted_output.pdf', 'wb') as f:
    f.write(response.content)

print('PDF redacted successfully.')
import requests

# Define the API endpoint URL
url = 'http://localhost:8080/v1/document-services/pdfs/redact-region'

# Set the headers for the request (optional relevant metadata)
headers = {
    'accept': '*/*',
    'author': 'Iron Software',
    'title': 'REDACT REGION DEMO 2024',
    'subject': 'DEMO EXAMPLE'
}

# Open the PDF file to be redacted in binary read mode
files = {
    'pdf_file': ('sample_file.pdf', open('sample_file.pdf', 'rb'), 'application/pdf')
}

# Define the coordinates and page for the redaction region
data = {
    'region_to_redact_x': '60',  # X-coordinate starting at the bottom-left
    'region_to_redact_y': '270', # Y-coordinate starting at the bottom-left
    'region_to_redact_w': '470', # Width of the region to be redacted
    'region_to_redact_h': '200', # Height of the region to be redacted
    'specific_pages': [1]        # Specify the page index to redact
}

# Make the POST request to the API with the provided parameters and file
response = requests.post(url, headers=headers, files=files, data=data)

# Save the redacted PDF response to a new file
with open('redacted_output.pdf', 'wb') as f:
    f.write(response.content)

print('PDF redacted successfully.')
PYTHON

Dieser Code führt die folgenden Schritte aus:

  • Laden der PDF-Datei: Die zu schwärzende PDF-Datei wird aus dem lokalen Dateisystem geladen.
  • Schwärzungsparameter festlegen: Geben Sie die Koordinaten (X, Y), die Breite, die Höhe und die zu schwärzende Seite an.
  • API-Aufruf: Die [POST] Redact Region API wird aufgerufen und die erforderlichen Parameter werden übergeben.
  • Ergebnis speichern: Die redigierte PDF-Datei wird als neue Datei gespeichert.

Der angegebene Bereich ist wie unten dargestellt geschwärzt.

! Geschwärzte Ausgabe

Häufig gestellte Fragen

Wie kann ich bestimmte Regionen in einer PDF-Datei redigieren?

Sie können bestimmte Regionen in einer PDF-Datei mit der [POST] Redact Region API von IronSecureDoc redigieren. Durch die Angabe von Koordinaten und Abmessungen für den Redaktionsbereich stellt die API sicher, dass die sensiblen Informationen dauerhaft aus dem Dokument entfernt werden.

Welche Schritte sind erforderlich, um die IronSecureDoc API für die Redaktionsfunktion einzurichten?

Um die IronSecureDoc API für die Redaktionsfunktion einzurichten, müssen Sie das Docker-Image ziehen und starten, die API mit Swagger konfigurieren, die Redaktionsparameter spezifizieren und den API-Aufruf ausführen, um Regionen in Ihren PDF-Dokumenten zu redigieren.

Kann IronSecureDoc auf Cloud-Plattformen verwendet werden?

Ja, IronSecureDoc kann auf Cloud-Plattformen wie Azure und AWS bereitgestellt werden, was skalierbare und flexible Redaktionslösungen ermöglicht.

Wie gebe ich an, welche Bereiche eines PDFs mit IronSecureDoc redigiert werden sollen?

Um Bereiche für die Redaktion mit IronSecureDoc anzugeben, müssen Sie die X- und Y-Koordinaten zusammen mit der Breite und Höhe des zu redigierenden Bereichs angeben. Diese Parameter definieren den genauen Bereich auf der PDF-Seite.

Gibt es eine Möglichkeit, den Redaktionsprozess vor der vollständigen Implementierung zu testen?

Ja, Sie können den Redaktionsprozess lokal testen, indem Sie den IronSecureDoc API-Server ausführen und Swagger verwenden, um mit der API zu interagieren. So können Sie mit den Redaktionsparametern experimentieren und die Ausgabe vor der vollständigen Implementierung überprüfen.

Welche Programmiersprachen können zur Integration mit der IronSecureDoc API verwendet werden?

Die IronSecureDoc API kann mit jeder Programmiersprache integriert werden, die in der Lage ist, HTTP-Anfragen zu stellen, wie z. B. Python, Java, C# und andere.

Was versteht man unter wahrer Redaktion in PDFs und warum ist sie wichtig?

Wahre Redaktion in PDFs stellt sicher, dass sensible Daten nicht nur versteckt, sondern vollständig aus dem Dokument entfernt werden. Dies ist entscheidend für die Wahrung der Vertraulichkeit und die Einhaltung von Datenschutzbestimmungen.

Unterstützt IronSecureDoc PDF-Konformitätsstandards?

Ja, beim Speichern eines redigierten PDFs mit IronSecureDoc können Sie sich für die Einhaltung von Standards wie PDF/A-3 oder PDF/UA entscheiden, um spezifische Dokumentanforderungen zu erfüllen.

Kann IronSecureDoc mit passwortgeschützten PDFs für die Redaktion umgehen?

Ja, IronSecureDoc kann passwortgeschützte PDFs verarbeiten, indem die erforderlichen Benutzer- und Eigentümerpasswörter als optionale Parameter während des Redaktionsprozesses bereitgestellt werden.

Curtis Chau
Technischer Autor

Curtis Chau hat einen Bachelor-Abschluss in Informatik von der Carleton University und ist spezialisiert auf Frontend-Entwicklung mit Expertise in Node.js, TypeScript, JavaScript und React. Leidenschaftlich widmet er sich der Erstellung intuitiver und ästhetisch ansprechender Benutzerschnittstellen und arbeitet gerne mit modernen Frameworks sowie der Erstellung gut strukturierter, optisch ansprechender ...

Weiterlesen
Bereit anzufangen?
Version: 2024.10 gerade veröffentlicht