Comment masquer des régions dans des fichiers PDF avec C

This article was translated from English: Does it need improvement?
Translated
View the article in English

La suppression des informations sensibles dans les documents PDF est essentielle pour garantir la confidentialité et la conformité aux réglementations en matière de protection des données. L'API [POST] Redact Region d'IronSecure Doc offre un moyen efficace de masquer le texte et les informations sensibles dans des régions spécifiques d'un document PDF en utilisant une véritable rédaction. Cette API garantit que les données expurgées sont complètement supprimées et ne peuvent pas être récupérées, ce qui la rend idéale pour la gestion des informations confidentielles dans les documents juridiques, financiers ou personnels.

Démarrez IronSecureDoc

Si IronSecureDoc n'est pas encore installé, veuillez suivre les liens ci-dessous pour le configurer :

Hébergez localement Déploiement sur le cloud

L'API de région de rédaction [POST]

Le point de terminaison API [POST] Redact Region vous permet de masquer des informations sensibles dans des régions spécifiques d'un document PDF en utilisant une véritable rédaction. Cette fonctionnalité est essentielle pour les applications qui gèrent des documents confidentiels, tels que les contrats juridiques, les dossiers médicaux ou les états financiers. En exploitant cette API, vous pouvez garantir la suppression définitive des textes sensibles contenus dans des zones définies d'un PDF, assurant ainsi sécurité et conformité.

Une fois une zone masquée, son contenu ne peut plus être récupéré.

Essai avec Swagger

Swagger est un outil puissant qui permet aux développeurs d'interagir avec les API RESTful via une interface web conviviale. Que vous utilisiez des langages comme Python, Java ou autres, Swagger offre un moyen pratique de tester et d'implémenter cette API.

Étapes pour masquer une région avec Swagger

  1. Accédez à l'interface utilisateur Swagger :

    Si votre serveur API est exécuté localement, vous pouvez accéder à Swagger en naviguant vers http://localhost:8080/swagger/index.html dans votre navigateur Web.

! Documentation Swagger

  1. Localisez l'API [POST] Redact Region :

    Dans l'interface utilisateur Swagger, recherchez le point de terminaison [POST] /v1/document-services/pdfs/redact-region.

! Régions à masquer

  1. Spécifiez les coordonnées de rédaction :

    Dans cet exemple, nous allons supprimer un tableau du PDF à la page index 1 (c'est-à-dire la page n° 2). Utilisez les coordonnées suivantes pour définir la zone de rédaction :

    • Index des pages (specific_pages) : 1
    • Coordonnée X (region_to_redact_x) : 60
    • Coordonnée Y (region_to_redact_y) : 270
    • Largeur (region_to_redact_w) : 470
    • Hauteur (region_to_redact_h) : 200
  2. Définir les paramètres optionnels :

    Vous pouvez également ajouter un mot de passe utilisateur ou propriétaire, spécifier des pages particulières ou décider de dessiner un cadre noir sur la zone masquée et d'enregistrer le document au format PDF/A ou PDF/UA.

! Swagger d'entrée

  1. Téléversez un exemple de PDF :

    Dans le corps de la requête, veuillez télécharger un exemple de fichier PDF où vous souhaitez appliquer la rédaction. Assurez-vous que le fichier est ajouté en tant que fichier pdf .

  2. Exécuter la requête :

    Cliquez sur " Exécuter " pour lancer la requête. La réponse inclura le PDF expurgé, le tableau ayant été supprimé de la page 1 comme spécifié.

    Response

    Cette interaction Swagger UI vous permet de tester facilement le processus de rédaction, en fournissant un retour d'information immédiat sur la façon dont les coordonnées affectent le contenu du PDF.

  3. Vérifiez le PDF de sortie :

    La zone masquée se trouvera à la page 2.


Comprendre les paramètres d'entrée

Avant d'utiliser cette API, il est essentiel de comprendre les paramètres d'entrée obligatoires et facultatifs pour masquer une région dans votre PDF. Ces paramètres permettent de définir la zone précise à masquer.

Paramètres clés

  • pdf_file : Le document PDF que vous souhaitez expurger.
  • region_to_redact_x : Coordonnée X de la région à masquer (en partant du coin inférieur gauche de la page).
  • region_to_redact_y : Coordonnée Y de la région à masquer (en partant du coin inférieur gauche de la page).
  • region_to_redact_w : Largeur de la région à masquer.
  • region_to_redact_h : Hauteur de la région à expurger.

Paramètres optionnels

  • user_password : Si le PDF est protégé par un mot de passe, veuillez indiquer le mot de passe de l'utilisateur.
  • owner_password : Indiquez le mot de passe du propriétaire si les modifications sont restreintes.
  • specific_pages : Spécifiez les pages à masquer. Si aucune information n'est fournie, la suppression s'applique à toutes les pages.
  • save_as_pdfa : Enregistrer le PDF conforme à la norme PDF/A-3.
  • save_as_pdfua : Enregistrer le PDF en respectant la norme PDF/UA.

Intégration API : exemple Python

Une fois que vous vous serez familiarisé avec les paramètres, vous pourrez appeler cette API en utilisant votre langage de programmation préféré. Vous trouverez ci-dessous un exemple d'intégration de cette API en utilisant Python.

import requests

# Define the API endpoint URL
url = 'http://localhost:8080/v1/document-services/pdfs/redact-region'

# Set the headers for the request (optional relevant metadata)
headers = {
    'accept': '*/*',
    'author': 'Iron Software',
    'title': 'REDACT REGION DEMO 2024',
    'subject': 'DEMO EXAMPLE'
}

# Open the PDF file to be redacted in binary read mode
files = {
    'pdf_file': ('sample_file.pdf', open('sample_file.pdf', 'rb'), 'application/pdf')
}

# Define the coordinates and page for the redaction region
data = {
    'region_to_redact_x': '60',  # X-coordinate starting at the bottom-left
    'region_to_redact_y': '270', # Y-coordinate starting at the bottom-left
    'region_to_redact_w': '470', # Width of the region to be redacted
    'region_to_redact_h': '200', # Height of the region to be redacted
    'specific_pages': [1]        # Specify the page index to redact
}

# Make the POST request to the API with the provided parameters and file
response = requests.post(url, headers=headers, files=files, data=data)

# Save the redacted PDF response to a new file
with open('redacted_output.pdf', 'wb') as f:
    f.write(response.content)

print('PDF redacted successfully.')
import requests

# Define the API endpoint URL
url = 'http://localhost:8080/v1/document-services/pdfs/redact-region'

# Set the headers for the request (optional relevant metadata)
headers = {
    'accept': '*/*',
    'author': 'Iron Software',
    'title': 'REDACT REGION DEMO 2024',
    'subject': 'DEMO EXAMPLE'
}

# Open the PDF file to be redacted in binary read mode
files = {
    'pdf_file': ('sample_file.pdf', open('sample_file.pdf', 'rb'), 'application/pdf')
}

# Define the coordinates and page for the redaction region
data = {
    'region_to_redact_x': '60',  # X-coordinate starting at the bottom-left
    'region_to_redact_y': '270', # Y-coordinate starting at the bottom-left
    'region_to_redact_w': '470', # Width of the region to be redacted
    'region_to_redact_h': '200', # Height of the region to be redacted
    'specific_pages': [1]        # Specify the page index to redact
}

# Make the POST request to the API with the provided parameters and file
response = requests.post(url, headers=headers, files=files, data=data)

# Save the redacted PDF response to a new file
with open('redacted_output.pdf', 'wb') as f:
    f.write(response.content)

print('PDF redacted successfully.')
PYTHON

Ce code effectue les étapes suivantes :

  • Charger le PDF : Le fichier PDF à expurger est chargé depuis le système de fichiers local.
  • Définir les paramètres de rédaction : Spécifiez les coordonnées (X, Y), la largeur, la hauteur et la page spécifique à rédiger.
  • Appel de l'API : L'API [POST] Redact Region est appelée, en passant les paramètres nécessaires.
  • Enregistrer le résultat : Le PDF expurgé est enregistré comme un nouveau fichier.

La région indiquée est masquée comme indiqué ci-dessous.

! Sortie expurgée

Questions Fréquemment Posées

Comment puis-je rédiger des régions spécifiques dans un fichier PDF ?

Vous pouvez rédiger des régions spécifiques dans un fichier PDF en utilisant l'API [POST] Redact Region d'IronSecureDoc. En fournissant les coordonnées et les dimensions de la zone de rédaction, l'API assure que les informations sensibles sont définitivement supprimées du document.

Quelles étapes sont impliquées dans la configuration de l'API IronSecureDoc pour la rédaction ?

Pour configurer l'API IronSecureDoc pour la rédaction, vous devez télécharger et démarrer l'image Docker, configurer l'API avec Swagger, spécifier les paramètres de rédaction, et exécuter l'appel API pour rédiger les régions dans vos documents PDF.

IronSecureDoc peut-il être utilisé sur les plateformes cloud ?

Oui, IronSecureDoc peut être déployé sur des plateformes cloud telles qu'Azure et AWS, permettant des solutions de rédaction évolutives et flexibles.

Comment spécifier quelles zones d'un PDF rédiger avec IronSecureDoc ?

Pour spécifier les zones à rédiger en utilisant IronSecureDoc, vous devez fournir les coordonnées X et Y ainsi que la largeur et la hauteur de la région à rédiger. Ces paramètres définissent la zone exacte sur la page PDF.

Existe-t-il un moyen de tester le processus de rédaction avant une mise en œuvre complète ?

Oui, vous pouvez tester le processus de rédaction localement en exécutant le serveur API IronSecureDoc et en utilisant Swagger pour interagir avec l'API. Cela vous permet de tester les paramètres de rédaction et de vérifier le résultat avant une mise en œuvre à grande échelle.

Quels langages de programmation peuvent être utilisés pour intégrer l'API IronSecureDoc ?

L'API IronSecureDoc peut être intégrée à n'importe quel langage de programmation capable de faire des requêtes HTTP, tel que Python, Java, C#, et d'autres.

Qu'est-ce que la vraie rédaction dans les PDF, et pourquoi est-ce important ?

La vraie rédaction dans les PDF assure que les données sensibles ne sont pas seulement cachées mais complètement supprimées du document. Cela est crucial pour maintenir la confidentialité et se conformer aux réglementations sur la protection des données.

IronSecureDoc prend-il en charge les normes de conformité PDF ?

Oui, lors de la sauvegarde d'un PDF rédigé avec IronSecureDoc, vous pouvez opter pour la conformité avec des normes comme PDF/A-3 ou PDF/UA pour répondre à des exigences spécifiques de documents.

IronSecureDoc peut-il gérer les PDF protégés par mot de passe pour la rédaction ?

Oui, IronSecureDoc peut gérer les PDF protégés par mot de passe en fournissant les mots de passe utilisateur et propriétaire requis comme paramètres optionnels pendant le processus de rédaction.

Curtis Chau
Rédacteur technique

Curtis Chau détient un baccalauréat en informatique (Université de Carleton) et se spécialise dans le développement front-end avec expertise en Node.js, TypeScript, JavaScript et React. Passionné par la création d'interfaces utilisateur intuitives et esthétiquement plaisantes, Curtis aime travailler avec des frameworks modernes ...

Lire la suite
Prêt à commencer?
Version: 2024.10 vient de sortir