如何重制 PDF 文件中的区域

This article was translated from English: Does it need improvement?
Translated
View the article in English

作者:Mehr Muhammad Hamza

编辑 PDF 文档中的敏感信息对于确保隐私和遵守数据保护法规至关重要。 "(《世界人权宣言》)[职位]IronSecure Doc 的 Redact Region API 提供了一种有效的方法,可使用真正的编辑功能隐藏 PDF 文档特定区域中的敏感文本和信息。 该 API 可确保完全删除经编辑的数据,且无法恢复,因此非常适合处理法律、财务或个人文件中的机密信息。

拉动并启动 IronSecureDoc

如果您还没有运行 IronSecureDoc,请按照以下链接进行设置:

本地主办部署到云端

POST]Redact Region API

"(《世界人权宣言》)[职位]Redact Region API 端点允许您使用真正的编辑功能将敏感信息隐藏在 PDF 文档的特定区域内。 这一功能对于管理法律合同、医疗记录或财务报表等机密文件的应用程序至关重要。 利用此 API,您可以确保永久删除 PDF 定义区域内的敏感文本,从而实现安全性和合规性。

请注意
一旦某个区域被编辑,该区域内的内容将无法恢复。

在 Swagger 中试用

Swagger 是一款功能强大的工具,可帮助开发人员通过用户友好的 Web 界面与 RESTful API 进行交互。 无论您使用的是 Python、Java 还是其他语言,Swagger 都能为您提供测试和实现该 API 的便捷方法。

使用 Swagger 重制区域的步骤

  1. 访问 Swagger 用户界面:

    如果您的 API 服务器在本地运行,您可以通过在 Web 浏览器中导航到 http://localhost:8080/swagger/index.html 访问 Swagger。

    Swagger 文档

  2. 定位[职位]Redact Region API:

    在 Swagger UI 中,找到[职位]/v1/document-services/pdfs/redact-region 终端。

    重编地区

  3. 指定重action 坐标:

    在本例中,我们将删除 PDF 中索引页 1 上的一个表格(即,第 2 页). 使用以下坐标定义节录区域:

    • 页面索引(specific_pages):1
    • X 坐标(region_to_redact_x): 60
    • Y 坐标(区域_待编辑_y): 270
    • 宽度(region_to_redact_w):470
    • 高度(region_to_redact_h): 200
  4. 设置可选参数:

    您可以选择添加用户或所有者密码,指定特定页面,或决定是否在编辑区域上画一个黑框,并以 PDF/A 或 PDF/UA 合规性保存文档。

    输入 Swagger

  5. 上传 PDF 样本:

    在请求正文中,上传您要应用编辑的 PDF 样本文件。 确保将文件添加为 pdf_file

  6. 执行请求:

    单击 "执行 "运行请求。响应将包括经编辑的 PDF,并按照指定删除索引 1 页中的表格。

    响应

    这种 Swagger UI 交互方式可让您轻松测试编辑过程,即时反馈坐标对 PDF 内容的影响。

  7. 检查输出 PDF:

    节录区域将位于第 2 页。


理解输入参数

在使用此 API 之前,必须了解在 PDF 中编辑区域所需和可选的输入参数。 这些参数有助于确定需要编辑的特定区域。

关键参数

  • pdf_file: 您要编辑的 PDF 文档。
  • region_too_redact_x: 要编辑区域的 X 坐标(从页面左下方开始).
  • region_too_redact_y: 要编辑区域的 Y 坐标(从页面左下方开始).
  • region_too_redact_w: 要编辑的区域的宽度。
  • region_too_redact_h: 要编辑区域的高度。

可选参数

  • 用户密码: 如果 PDF 有密码保护,请提供用户密码。
  • owner_password: 如果修改受到限制,请提供所有者密码。
  • specific_pages: 指定要编辑的页面。 如果未提供,则节录适用于所有页面。
  • save_as_pdfa: 保存符合 PDF/A-3 标准的 PDF。
  • save_as_pdfua: 保存符合 PDF/UA 标准的 PDF。

API 集成:Python 示例

熟悉参数后,您就可以使用自己喜欢的编程语言调用此 API。 下面是一个如何使用 Python 集成此 API 的示例。

import requests

url = 'http://localhost:8080/v1/document-services/pdfs/redact-region'
headers = {
    'accept': '*/*',
    'author': 'IronSoftware',
    'title': 'REDACT REGION DEMO 2024',
    'subject': 'DEMO EXAMPLE'
}

# Open the file
files = {
    'pdf_file': ('sample_file.pdf', open('sample_file.pdf', 'rb'), 'application/pdf')
}

# Prepare the argument
data = {
    'region_to_redact_x': '60',
    'region_to_redact_y': '270',
    'region_to_redact_w': '470',
    'region_to_redact_h': '200',
    'specific_pages':[1]
}

# Call the API
response = requests.post(url, headers=headers, files=files, data=data)

# Save the redacted PDF
with open('redacted_output.pdf', 'wb') as f:
    f.write(response.content)

print('PDF redacted successfully.')
PYTHON

本《代码》执行以下步骤:

  • 加载 PDF: 从本地文件系统加载要编辑的 PDF 文件。
  • 设置重action 参数: 指定坐标(X, Y)译文必须包括.NET、Java、Python 或 Node js 的名称、宽度、高度和要编辑的具体页面。
  • 调用 API: The[职位]调用 Redact Region API,传递必要的参数。
  • 保存结果: 将编辑后的 PDF 保存为新文件。

    给定区域已编辑,如下所示。

    编辑输出