PDFファイルのリージョンを再編集する方法

This article was translated from English: Does it need improvement?
Translated
View the article in English

メヘル・ムハンマド・ハムザによって

PDF 文書内の機密情報をリダクティングすることは、プライバシーを確保し、データ保護規制を遵守する上で非常に重要です。 について[ポスト]IronSecure Doc の Redact Region API は、PDF ドキュメントの特定の領域に機密テキストや情報を隠す効率的な方法を提供します。 このAPIは、冗長化されたデータが完全に削除され、復元できないことを保証するため、法律、金融、または個人的な文書で機密情報を扱うのに理想的です。

IronSecureDocをプルして開始する

IronSecureDocをまだお使いでない場合は、以下のリンクからセットアップしてください:

地元での開催 クラウドへのデプロイ

POST]リージョンAPIの再編集

について[ポスト]Redact Region API エンドポイントを使うと、真の再編集を使って PDF 文書の特定の領域内に機密情報を隠すことができます。 この機能は、法律上の契約書、医療記録、財務諸表などの機密文書を管理するアプリケーションにとって非常に重要です。 このAPIを活用することで、PDFの定義された領域内の機密テキストを恒久的に削除し、セキュリティとコンプライアンスの両方を提供することができます。

次の内容にご注意ください。
一度領域が編集されると、その領域内のコンテンツは復元できません。

Swaggerで試す

Swaggerは、開発者がユーザーフレンドリーなWebインターフェイスを介してRESTful APIと対話できる強力なツールです。 Python、Javaなどの言語を使用しているかどうかにかかわらず、SwaggerはこのAPIをテストし実装する便利な方法を提供します。

Swaggerでリージョンをリダクトする手順

  1. Swagger UIにアクセス:

    APIサーバーがローカルで実行されている場合、Webブラウザでhttp://localhost:8080/swagger/index.html にナビゲートすることでSwaggerにアクセスできます。

    Swaggerドキュメント

  2. **翻訳対象[ポスト]リージョンAPIの再編集

    Swagger UI内で[ポスト]/v1/document-services/pdfs/redact-regionエンドポイント。

    リダクト地域

  3. **再編集座標を指定してください。

    この例では、ページインデックス1のPDFから表を削除します。(例:2ページ目). 以下の座標を使用して、再編集領域を定義してください:

    • ページインデックス(specific_pages):1
    • X コーディネート(region_to_redact_x): 60
    • Yコーディネート(region_to_redact_y): 270
    • 幅(領域_to_redact_w):470
    • 身長(リージョンを非表示にするための h): 200
  4. **オプションのパラメータを設定します。

    オプションで、ユーザーまたは所有者のパスワードを追加したり、特定のページを指定したり、冗長化された領域にブラックボックスを描画するかどうかを決定したり、PDF/AまたはPDF/UAコンプライアンスで文書を保存したりすることができます。

    Swaggerの入力

  5. **サンプルPDFのアップロード

    リクエスト本文に、再編集を適用したいサンプルPDFファイルをアップロードしてください。 ファイルが pdf_file として追加されていることを確認してください。

  6. **リクエストの実行

    実行」をクリックしてリクエストを実行します。レスポンスには、指定されたページインデックス1からテーブルが削除された、再編集されたPDFが含まれます。

    レスポンス

    このSwagger UIインタラクションにより、再編集プロセスを簡単にテストすることができ、座標がPDFコンテンツにどのように影響するかを即座にフィードバックすることができます。

  7. **出力されたPDFを確認する

    再編集された地域は2ページになります。


入力パラメータの理解

このAPIを使用する前に、PDF内の領域を再編集するために必要な入力パラメータとオプションのパラメータを理解することが不可欠です。 これらのパラメータは、再編集する特定の領域を定義するのに役立ちます。

主要パラメータ

  • pdf_file:再編集したいPDF文書。
  • region_to_redact_x:redactする領域のX座標(ページ左下から).
  • region_to_redact_y:redactする領域のY座標(ページ左下から).
  • region_to_redact_w:redactする領域の幅。
  • region_to_redact_h:redactする領域の高さ。

オプションパラメーター

  • user_password: PDF がパスワードで保護されている場合は、ユーザーパスワードを入力してください。
  • owner_password:修正が制限されている場合は、所有者のパスワードを入力してください。
  • specific_pages: どのページを再編集するかを指定してください。 提供されない場合、再編集はすべてのページに適用されます。
  • save_as_pdfa: PDF/A-3 準拠の PDF を保存します。
  • save_as_pdfua: PDF/UA 準拠で PDF を保存します。

APIの統合:Pythonの例

パラメータに慣れれば、好みのプログラミング言語を使ってこのAPIを呼び出すことができます。 以下は、Pythonを使用してこのAPIを統合する方法の例です。

import requests

url = 'http://localhost:8080/v1/document-services/pdfs/redact-region'
headers = {
    'accept': '*/*',
    'author': 'IronSoftware',
    'title': 'REDACT REGION DEMO 2024',
    'subject': 'DEMO EXAMPLE'
}

# Open the file
files = {
    'pdf_file': ('sample_file.pdf', open('sample_file.pdf', 'rb'), 'application/pdf')
}

# Prepare the argument
data = {
    'region_to_redact_x': '60',
    'region_to_redact_y': '270',
    'region_to_redact_w': '470',
    'region_to_redact_h': '200',
    'specific_pages':[1]
}

# Call the API
response = requests.post(url, headers=headers, files=files, data=data)

# Save the redacted PDF
with open('redacted_output.pdf', 'wb') as f:
    f.write(response.content)

print('PDF redacted successfully.')
PYTHON

このコードでは、以下のステップを実行します:

  • PDFをロードする:再編集されるPDFファイルは、ローカルファイルシステムからロードされます。
  • 再編集パラメータを設定する: 座標を指定する(X, Y)幅、高さ、再編集する特定のページ。
  • **APIを呼び出す[ポスト]Redact Region APIを呼び出し、必要なパラメータを渡します。
  • 結果を保存する:再編集されたPDFは、新しいファイルとして保存されます。

    指定された地域は、以下のように編集されています。

    再編集された出力