PDFファイルのリージョンを再編集する方法
PDF 文書内の機密情報をリダクティングすることは、プライバシーを確保し、データ保護規制を遵守する上で非常に重要です。 について[ポスト]IronSecure Doc の Redact Region API は、PDF ドキュメントの特定の領域に機密テキストや情報を隠す効率的な方法を提供します。 このAPIは、冗長化されたデータが完全に削除され、復元できないことを保証するため、法律、金融、または個人的な文書で機密情報を扱うのに理想的です。
PDFファイルのリージョンを再編集する方法
- IronSecureDoc Docker Imageをプルして起動します。
- Swaggerを使用してAPIを試す
- 引数の設定
- 好きな言語からAPIを呼び出す
- PDFドキュメントをダウンロード
IronSecureDocをプルして開始する
IronSecureDocをまだお使いでない場合は、以下のリンクからセットアップしてください:
地元での開催 | クラウドへのデプロイ |
---|---|
POST]リージョンAPIの再編集
について[ポスト]Redact Region API エンドポイントを使うと、真の再編集を使って PDF 文書の特定の領域内に機密情報を隠すことができます。 この機能は、法律上の契約書、医療記録、財務諸表などの機密文書を管理するアプリケーションにとって非常に重要です。 このAPIを活用することで、PDFの定義された領域内の機密テキストを恒久的に削除し、セキュリティとコンプライアンスの両方を提供することができます。
次の内容にご注意ください。
Swaggerで試す
Swaggerは、開発者がユーザーフレンドリーなWebインターフェイスを介してRESTful APIと対話できる強力なツールです。 Python、Javaなどの言語を使用しているかどうかにかかわらず、SwaggerはこのAPIをテストし実装する便利な方法を提供します。
Swaggerでリージョンをリダクトする手順
-
Swagger UIにアクセス:。
APIサーバーがローカルで実行されている場合、Webブラウザでhttp://localhost:8080/swagger/index.html にナビゲートすることでSwaggerにアクセスできます。
-
**翻訳対象[ポスト]リージョンAPIの再編集
Swagger UI内で[ポスト]/v1/document-services/pdfs/redact-regionエンドポイント。
-
**再編集座標を指定してください。
この例では、ページインデックス1のPDFから表を削除します。(例:2ページ目). 以下の座標を使用して、再編集領域を定義してください:
- ページインデックス(specific_pages):1
- X コーディネート(region_to_redact_x): 60
- Yコーディネート(region_to_redact_y): 270
- 幅(領域_to_redact_w):470
- 身長(リージョンを非表示にするための h): 200
-
**オプションのパラメータを設定します。
オプションで、ユーザーまたは所有者のパスワードを追加したり、特定のページを指定したり、冗長化された領域にブラックボックスを描画するかどうかを決定したり、PDF/AまたはPDF/UAコンプライアンスで文書を保存したりすることができます。
-
**サンプルPDFのアップロード
リクエスト本文に、再編集を適用したいサンプルPDFファイルをアップロードしてください。 ファイルが pdf_file として追加されていることを確認してください。
-
**リクエストの実行
実行」をクリックしてリクエストを実行します。レスポンスには、指定されたページインデックス1からテーブルが削除された、再編集されたPDFが含まれます。
このSwagger UIインタラクションにより、再編集プロセスを簡単にテストすることができ、座標がPDFコンテンツにどのように影響するかを即座にフィードバックすることができます。
-
**出力されたPDFを確認する
再編集された地域は2ページになります。
入力パラメータの理解
このAPIを使用する前に、PDF内の領域を再編集するために必要な入力パラメータとオプションのパラメータを理解することが不可欠です。 これらのパラメータは、再編集する特定の領域を定義するのに役立ちます。
主要パラメータ
- pdf_file:再編集したいPDF文書。
- region_to_redact_x:redactする領域のX座標(ページ左下から).
- region_to_redact_y:redactする領域のY座標(ページ左下から).
- region_to_redact_w:redactする領域の幅。
- region_to_redact_h:redactする領域の高さ。
オプションパラメーター
- user_password: PDF がパスワードで保護されている場合は、ユーザーパスワードを入力してください。
- owner_password:修正が制限されている場合は、所有者のパスワードを入力してください。
- specific_pages: どのページを再編集するかを指定してください。 提供されない場合、再編集はすべてのページに適用されます。
- save_as_pdfa: PDF/A-3 準拠の PDF を保存します。
- save_as_pdfua: PDF/UA 準拠で PDF を保存します。
APIの統合:Pythonの例
パラメータに慣れれば、好みのプログラミング言語を使ってこのAPIを呼び出すことができます。 以下は、Pythonを使用してこのAPIを統合する方法の例です。
import requests
url = 'http://localhost:8080/v1/document-services/pdfs/redact-region'
headers = {
'accept': '*/*',
'author': 'IronSoftware',
'title': 'REDACT REGION DEMO 2024',
'subject': 'DEMO EXAMPLE'
}
# Open the file
files = {
'pdf_file': ('sample_file.pdf', open('sample_file.pdf', 'rb'), 'application/pdf')
}
# Prepare the argument
data = {
'region_to_redact_x': '60',
'region_to_redact_y': '270',
'region_to_redact_w': '470',
'region_to_redact_h': '200',
'specific_pages':[1]
}
# Call the API
response = requests.post(url, headers=headers, files=files, data=data)
# Save the redacted PDF
with open('redacted_output.pdf', 'wb') as f:
f.write(response.content)
print('PDF redacted successfully.')
このコードでは、以下のステップを実行します:
- PDFをロードする:再編集されるPDFファイルは、ローカルファイルシステムからロードされます。
- 再編集パラメータを設定する: 座標を指定する(X, Y)幅、高さ、再編集する特定のページ。
- **APIを呼び出す[ポスト]Redact Region APIを呼び出し、必要なパラメータを渡します。
-
結果を保存する:再編集されたPDFは、新しいファイルとして保存されます。
指定された地域は、以下のように編集されています。