IronSecureDocでPDF上のテキストを再編集する方法
この記事では、IronSecureDocを使用したPDF上のテキストの朱書きについて説明します。 これにより、サービスやプロセスは、実行中のIronSecureDocサーバにPDFを添えて簡単なPOSTリクエストを行うだけで、機密情報を迅速かつ簡単に再編集することができます。 Swaggerドキュメントを使用し、視覚的に説明します。 POSTリクエストは、必須パラメータとオプションパラメータの両方を受け取り、高度にカスタマイズ可能です; 応答は、テキストを編集したPDFを返します。
IronSecureDocでPDF上のテキストを再編集する方法
- IronSecureDoc Docker Imageをプルして起動します。
- Swaggerを使用したAPIのテスト
- 編集するテキストを指定する
- 提供された詳細でAPIコールを実行する
- 再編集されたPDF文書をエクスポートする
IronSecureDocをプルして開始する
IronSecureDocをまだお使いでない場合は、以下のリンクからセットアップしてください:
地元での開催 | クラウドへのデプロイ |
---|---|
POST] リダクトテキストAPI
について[ポスト]Redact Text API エンドポイントを使うと、PDF 文書内の機密テキストを再編集を使って隠すことができます。 この機能は、法的契約書、医療記録、財務報告書などの機密文書を扱うアプリケーションに不可欠です。 このAPIを使用することで、特定のテキストが永久に削除され、セキュリティが強化され、データ保護基準への準拠が保証されます。
次の内容にご注意ください。
スワッガー
Swaggerは、開発者がユーザーフレンドリーなWebインターフェイスを介してRESTful APIと対話できる強力なツールです。 Python、Javaなどの言語を使用しているかどうかにかかわらず、SwaggerはこのAPIをテストし実装する便利な方法を提供します。
Swaggerでテキストを再編集する手順
-
Swagger UIにアクセス:。
APIサーバーがローカルで実行されている場合、Webブラウザでhttp://localhost:8080/swagger/index.html にナビゲートすることでSwaggerにアクセスできます。
-
翻訳対象[ポスト]リダクトテキスト API:
Swagger UI内で[ポスト]/v1/document-services/pdfs/redact-textエンドポイント。
-
** コンフィギュレーションの指定:***
この例では、PDFファイルとPOSTリクエストで編集する単語の両方を提供します。私たちは "we "という単語を編集し、その上にブラックボックスを重ねます。 このデモでは、'sample.pdf'ファイルを以下の構成で作成します:
- draw_black_box: true
- match_whole_word: true
- words_to_redact: 私たち
-
**サンプルPDFのアップロード
リクエスト本文に、再編集を適用したいサンプルPDFファイルをアップロードしてください。 ファイルが pdf_file として追加されていることを確認してください。
-
**リクエストの実行
実行」をクリックしてリクエストを実行します。レスポンスには、再編集されたPDFが含まれます。 このSwagger UIインタラクションにより、再編集プロセスを簡単にテストでき、すぐにフィードバックが得られます。
申し訳ありませんが、翻訳するコンテンツのテキストを提供してください。その後、英語から日本語に翻訳いたします。!-- 6.出力されたPDFの確認:。
結果の理解
Swagger Docに必要なパラメータを入力した後、POSTリクエストを実行します。 リクエストに成功すると、上の例にあるように、ダウンロード可能な修正されたPDFファイルとともに200ステータスコードが返されます。
上の修正PDFでは、「we」という単語がブラックボックスに置き換えられています。 さらに、match_whole_word
booleanはTrue
に設定され、単語内の部分一致ではなく、単語全体のみを再編集することを示す。
-->
コマンドプロンプトからCURLリクエストを使用する
別の方法として、コマンドプロンプトでcurl POSTリクエストを使って同じ結果を得ることもできます。
curl -X POST 'http://localhost:8080/v1/document-services/pdfs/redact-text' \
-H 'accept: */*' \
-H 'Content-Type: multipart/form-data' \
-F 'pdf_file=@sample.pdf;type=application/pdf' \
-F 'words_to_redact="we"' \
-F 'draw_black_box=true' \
-F 'match_whole_word=true'
次の内容にご注意ください。
curl.exe --version
必須リクエスト・ボディ・パラメータ
名前 | データ型 | 説明 |
---|---|---|
pdf_file | アプリケーション/pdf | 操作したいPDFファイル |
ワード_トゥ_リダクト | 配列[文字列] | このパラメータは、単語のリストを取り、入力に一致するテキストを再編集します。 |
オプションのリクエストボディパラメータ
名前 | データ型 | 説明 |
---|---|---|
ユーザー_パスワード | 文字列 | これは、入力PDFにユーザーパスワードがある場合に必要です。パスワードで保護されたPDFにパスワードが与えられない場合、操作は失敗します。 |
オーナーパスワード | 文字列 | これは、入力PDFに所有者パスワードがある場合に必要です。パスワードで保護されたPDFにパスワードが与えられない場合、操作は失敗します。 |
specific_pages | 配列[整数] | テキストを再編集するページを指定できます。デフォルトでは、値はnullで、すべてのページで提供された単語が再編集されることを意味します。 |
draw_black_box | ブーリアン | テキストにブラック ボックスを付けるかどうかを指定します。デフォルトでは、この値はTrueに設定されています。 |
match_whole_word | ブーリアン | 単語内の部分一致も再編集するかどうかを指定します。例えば、指定された単語が "are "の場合、"hare "のような "are "を含む単語は、"are "も再編集されます。デフォルトではTrueに設定されています。 |
一致ケース | ブーリアン | 大文字と小文字の完全一致を指定します。デフォルトでは、この値はNULLです。注意: これを True に設定すると、小文字と大文字の文字列はマッチしません。例えば、指定された単語が "WE "の場合、小文字の "we "は編集されません。 |
オーバーレイテキスト | 文字列 | これは、冗長化されたテキストの上に、単語や記号などのオーバーレイテキストを指定します。デフォルトでは、この文字列は空です。 |
PDF/Aとして保存 | ブーリアン | PDF/A-3 準拠で変更 PDF を保存します。デフォルトではFalseに設定されています。 |
save_as_pdfua | ブーリアン | PDF/UA 準拠で変更 PDF を保存します。デフォルトではFalseに設定されています。 |
オプションのヘッダーパラメータ
名前 | データ型 | 説明 |
---|---|---|
著者 | 文字列 | PDF文書の作成者であることを示すのに便利です。デフォルトでは、このフィールドは空です。 |
タイトル | 文字列 | PDF文書のタイトルを表示します。デフォルトでは、このフィールドは空です。 |
件名 | 文字列 | PDF文書の内容を一目で識別するのに便利です。デフォルトでは、このフィールドは空です。 |