PDFファイルのリージョンを再編集する方法
PDF 文書内の機密情報をリダクティングすることは、プライバシーを確保し、データ保護規制を遵守する上で非常に重要です。 IronSecure Docの[POST] Redact Region APIは、特定のPDF文書内の地域において機密テキストや情報を真の編集で隠すための効率的な方法を提供します。 このAPIは、冗長化されたデータが完全に削除され、復元できないことを保証するため、法律、金融、または個人的な文書で機密情報を扱うのに理想的です。
PDFファイルのリージョンを再編集する方法
- IronSecureDoc Docker イメージをプルして開始する
- Swaggerを使用してAPIを試す
- 引数を設定する
- 任意の言語からAPIを呼び出す
- PDFドキュメントをダウンロード
IronSecureDocをプルして開始する
IronSecureDocをまだお使いでない場合は、以下のリンクからセットアップしてください:
ローカルでホスト | クラウドにデプロイ |
---|---|
POST] Redact Region API
[POST] Redact Region APIエンドポイントでは、真の墨塗りを使用してPDFドキュメントの特定の領域内の機密情報を隠すことができます。 この機能は、法律上の契約書、医療記録、財務諸表などの機密文書を管理するアプリケーションにとって非常に重要です。 このAPIを活用することで、PDFの定義された領域内の機密テキストを恒久的に削除し、セキュリティとコンプライアンスの両方を提供することができます。
次の内容にご注意ください。
Swaggerで試す
Swaggerは、開発者がユーザーフレンドリーなWebインターフェイスを介してRESTful APIと対話できる強力なツールです。 Python、Javaなどの言語を使用しているかどうかにかかわらず、SwaggerはこのAPIをテストし実装する便利な方法を提供します。
Swaggerでリージョンをリダクトする手順
-
Swagger UIにアクセスする:
APIサーバーがローカルで実行されている場合、Webブラウザでhttp://localhost:8080/swagger/index.html にナビゲートすることでSwaggerにアクセスできます。
-
[POST] Redact Region API を見つける:
Swagger UI内で、[POST] /v1/document-services/pdfs/redact-region エンドポイントを見つけてください。
-
編集座標を指定:
この例では、ページインデックス 1(つまり、ページ #2)にある PDF からテーブルを削除します。 以下の座標を使用して、再編集領域を定義してください:
- ページインデックス(特定のページ):1
- X座標 (region_to_redact_x): 60
- Y 座標 (region_to_redact_y): 270
- 幅 (region_to_redact_w): 470
- 高さ (redact_h の領域): 200
-
オプションのパラメーターを設定する:
オプションで、ユーザーまたは所有者のパスワードを追加したり、特定のページを指定したり、冗長化された領域にブラックボックスを描画するかどうかを決定したり、PDF/AまたはPDF/UAコンプライアンスで文書を保存したりすることができます。
-
サンプルPDFをアップロード:
リクエスト本文に、再編集を適用したいサンプルPDFファイルをアップロードしてください。 pdf_fileとしてファイルが追加されていることを確認してください。
-
リクエストを実行する:
実行」をクリックしてリクエストを実行します。レスポンスには、指定されたページインデックス1からテーブルが削除された、再編集されたPDFが含まれます。
このSwagger UIインタラクションにより、再編集プロセスを簡単にテストすることができ、座標がPDFコンテンツにどのように影響するかを即座にフィードバックすることができます。
-
出力PDFを確認する:
再編集された地域は2ページになります。
入力パラメータの理解
このAPIを使用する前に、PDF内の領域を再編集するために必要な入力パラメータとオプションのパラメータを理解することが不可欠です。 これらのパラメータは、再編集する特定の領域を定義するのに役立ちます。
主要パラメータ
- pdf_file: 編集したいPDFドキュメント。
- region_to_redact_x: 編集する領域のX座標(ページの左下から開始)。
- region_to_redact_y: 編集する領域のY座標(ページの左下から開始)。
- region_to_redact_w: 削除する領域の幅。
- region_to_redact_h: 編集する領域の高さ。
オプションパラメーター
- user_password: PDFがパスワードで保護されている場合は、ユーザーパスワードを入力してください。
- owner_password: 変更が制限されている場合は、オーナーパスワードを提供してください。
- specific_pages: 編集するページを指定します。 提供されない場合、再編集はすべてのページに適用されます。
- save_as_pdfa: PDF/A-3 準拠でPDFを保存します。
- save_as_pdfua: PDF/UA準拠でPDFを保存します。
APIの統合:Pythonの例
パラメータに慣れれば、好みのプログラミング言語を使ってこのAPIを呼び出すことができます。 以下は、Pythonを使用してこのAPIを統合する方法の例です。
import requests
url = 'http://localhost:8080/v1/document-services/pdfs/redact-region'
headers = {
'accept': '*/*',
'author': 'IronSoftware',
'title': 'REDACT REGION DEMO 2024',
'subject': 'DEMO EXAMPLE'
}
# Open the file
files = {
'pdf_file': ('sample_file.pdf', open('sample_file.pdf', 'rb'), 'application/pdf')
}
# Prepare the argument
data = {
'region_to_redact_x': '60',
'region_to_redact_y': '270',
'region_to_redact_w': '470',
'region_to_redact_h': '200',
'specific_pages':[1]
}
# Call the API
response = requests.post(url, headers=headers, files=files, data=data)
# Save the redacted PDF
with open('redacted_output.pdf', 'wb') as f:
f.write(response.content)
print('PDF redacted successfully.')
このコードでは、以下のステップを実行します:
- PDFを読み込む: 赤字対象のPDFファイルはローカルファイルシステムから読み込まれます。
- 編集パラメーターを設定: 削除するための座標 (X, Y)、幅、高さ、および特定のページを指定します。
- APIを呼び出す: 必要なパラメータを渡して、[POST] Redact Region APIを呼び出します。
-
結果を保存: 編集されたPDFは新しいファイルとして保存されます。
指定された地域は、以下のように編集されています。