PDFファイルのリージョンを再編集する方法

チャクニット・ビン
チャクニット・ビン
2024年10月17日
更新済み 2024年12月17日
共有:
This article was translated from English: Does it need improvement?
Translated
View the article in English

PDF 文書内の機密情報をリダクティングすることは、プライバシーを確保し、データ保護規制を遵守する上で非常に重要です。 IronSecure Docの[POST] Redact Region APIは、特定のPDF文書内の地域において機密テキストや情報を真の編集で隠すための効率的な方法を提供します。 このAPIは、冗長化されたデータが完全に削除され、復元できないことを保証するため、法律、金融、または個人的な文書で機密情報を扱うのに理想的です。

IronSecureDocをプルして開始する

IronSecureDocをまだお使いでない場合は、以下のリンクからセットアップしてください:

ローカルでホスト クラウドにデプロイ

POST] Redact Region API

[POST] Redact Region APIエンドポイントでは、真の墨塗りを使用してPDFドキュメントの特定の領域内の機密情報を隠すことができます。 この機能は、法律上の契約書、医療記録、財務諸表などの機密文書を管理するアプリケーションにとって非常に重要です。 このAPIを活用することで、PDFの定義された領域内の機密テキストを恒久的に削除し、セキュリティとコンプライアンスの両方を提供することができます。

次の内容にご注意ください。
一度領域が編集されると、その領域内のコンテンツは復元できません。

Swaggerで試す

Swaggerは、開発者がユーザーフレンドリーなWebインターフェイスを介してRESTful APIと対話できる強力なツールです。 Python、Javaなどの言語を使用しているかどうかにかかわらず、SwaggerはこのAPIをテストし実装する便利な方法を提供します。

Swaggerでリージョンをリダクトする手順

  1. Swagger UIにアクセスする:

    APIサーバーがローカルで実行されている場合、Webブラウザでhttp://localhost:8080/swagger/index.html にナビゲートすることでSwaggerにアクセスできます。

    Swagger ドキュメント

  2. [POST] Redact Region API を見つける:

    Swagger UI内で、[POST] /v1/document-services/pdfs/redact-region エンドポイントを見つけてください。

    領域をマスキングする

  3. 編集座標を指定:

    この例では、ページインデックス 1(つまり、ページ #2)にある PDF からテーブルを削除します。 以下の座標を使用して、再編集領域を定義してください:

    • ページインデックス(特定のページ):1
    • X座標 (region_to_redact_x): 60
    • Y 座標 (region_to_redact_y): 270
    • 幅 (region_to_redact_w): 470
    • 高さ (redact_h の領域): 200
  4. オプションのパラメーターを設定する:

    オプションで、ユーザーまたは所有者のパスワードを追加したり、特定のページを指定したり、冗長化された領域にブラックボックスを描画するかどうかを決定したり、PDF/AまたはPDF/UAコンプライアンスで文書を保存したりすることができます。

    入力スワッガー

  5. サンプルPDFをアップロード:

    リクエスト本文に、再編集を適用したいサンプルPDFファイルをアップロードしてください。 pdf_fileとしてファイルが追加されていることを確認してください。

  6. リクエストを実行する:

    実行」をクリックしてリクエストを実行します。レスポンスには、指定されたページインデックス1からテーブルが削除された、再編集されたPDFが含まれます。

    応答

    このSwagger UIインタラクションにより、再編集プロセスを簡単にテストすることができ、座標がPDFコンテンツにどのように影響するかを即座にフィードバックすることができます。

  7. 出力PDFを確認する:

    再編集された地域は2ページになります。


入力パラメータの理解

このAPIを使用する前に、PDF内の領域を再編集するために必要な入力パラメータとオプションのパラメータを理解することが不可欠です。 これらのパラメータは、再編集する特定の領域を定義するのに役立ちます。

主要パラメータ

  • pdf_file: 編集したいPDFドキュメント。
  • region_to_redact_x: 編集する領域のX座標(ページの左下から開始)。
  • region_to_redact_y: 編集する領域のY座標(ページの左下から開始)。
  • region_to_redact_w: 削除する領域の幅。
  • region_to_redact_h: 編集する領域の高さ。

オプションパラメーター

  • user_password: PDFがパスワードで保護されている場合は、ユーザーパスワードを入力してください。
  • owner_password: 変更が制限されている場合は、オーナーパスワードを提供してください。
  • specific_pages: 編集するページを指定します。 提供されない場合、再編集はすべてのページに適用されます。
  • save_as_pdfa: PDF/A-3 準拠でPDFを保存します。
  • save_as_pdfua: PDF/UA準拠でPDFを保存します。

APIの統合:Pythonの例

パラメータに慣れれば、好みのプログラミング言語を使ってこのAPIを呼び出すことができます。 以下は、Pythonを使用してこのAPIを統合する方法の例です。

import requests

url = 'http://localhost:8080/v1/document-services/pdfs/redact-region'
headers = {
    'accept': '*/*',
    'author': 'IronSoftware',
    'title': 'REDACT REGION DEMO 2024',
    'subject': 'DEMO EXAMPLE'
}

# Open the file
files = {
    'pdf_file': ('sample_file.pdf', open('sample_file.pdf', 'rb'), 'application/pdf')
}

# Prepare the argument
data = {
    'region_to_redact_x': '60',
    'region_to_redact_y': '270',
    'region_to_redact_w': '470',
    'region_to_redact_h': '200',
    'specific_pages':[1]
}

# Call the API
response = requests.post(url, headers=headers, files=files, data=data)

# Save the redacted PDF
with open('redacted_output.pdf', 'wb') as f:
    f.write(response.content)

print('PDF redacted successfully.')
PYTHON

このコードでは、以下のステップを実行します:

  • PDFを読み込む: 赤字対象のPDFファイルはローカルファイルシステムから読み込まれます。
  • 編集パラメーターを設定: 削除するための座標 (X, Y)、幅、高さ、および特定のページを指定します。
  • APIを呼び出す: 必要なパラメータを渡して、[POST] Redact Region APIを呼び出します。
  • 結果を保存: 編集されたPDFは新しいファイルとして保存されます。

    指定された地域は、以下のように編集されています。

    編集済みの出力

チャクニット・ビン
ソフトウェアエンジニア
ChaknithはIronXLとIronBarcodeで作業しています。彼はC#と.NETに深い専門知識を持ち、ソフトウェアの改善と顧客サポートを支援しています。ユーザーとの対話から得た彼の洞察は、より良い製品、文書、および全体的な体験に貢献しています。