IronSecureDocでPDF上のテキストを再編集する方法

This article was translated from English: Does it need improvement?
Translated
View the article in English

カーティス・チャウによる

この記事では、IronSecureDocを使用したPDF上のテキストの朱書きについて説明します。 これにより、サービスやプロセスは、実行中のIronSecureDocサーバにPDFを添えて簡単なPOSTリクエストを行うだけで、機密情報を迅速かつ簡単に再編集することができます。 Swaggerドキュメントを使用し、視覚的に説明します。 POSTリクエストは、必須パラメータとオプションパラメータの両方を受け取り、高度にカスタマイズ可能です; 応答は、テキストを編集したPDFを返します。

IronSecureDocをプルして開始する

IronSecureDocをまだお使いでない場合は、以下のリンクからセットアップしてください:

地元での開催 クラウドへのデプロイ

POST] リダクトテキストAPI

について[ポスト]Redact Text API エンドポイントを使うと、PDF 文書内の機密テキストを再編集を使って隠すことができます。 この機能は、法的契約書、医療記録、財務報告書などの機密文書を扱うアプリケーションに不可欠です。 このAPIを使用することで、特定のテキストが永久に削除され、セキュリティが強化され、データ保護基準への準拠が保証されます。

次の内容にご注意ください。
テキストは一度再編集されると、内容を復元することはできません。

スワッガー

Swaggerは、開発者がユーザーフレンドリーなWebインターフェイスを介してRESTful APIと対話できる強力なツールです。 Python、Javaなどの言語を使用しているかどうかにかかわらず、SwaggerはこのAPIをテストし実装する便利な方法を提供します。

Swaggerでテキストを再編集する手順

  1. Swagger UIにアクセス:

    APIサーバーがローカルで実行されている場合、Webブラウザでhttp://localhost:8080/swagger/index.html にナビゲートすることでSwaggerにアクセスできます。

    Swaggerドキュメント

  2. 翻訳対象[ポスト]リダクトテキスト API:

    Swagger UI内で[ポスト]/v1/document-services/pdfs/redact-textエンドポイント。

    テキストの再編集

  3. ** コンフィギュレーションの指定:***

    この例では、PDFファイルとPOSTリクエストで編集する単語の両方を提供します。私たちは "we "という単語を編集し、その上にブラックボックスを重ねます。 このデモでは、'sample.pdf'ファイルを以下の構成で作成します:

    • draw_black_box: true
    • match_whole_word: true
    • words_to_redact: 私たち
  4. **サンプルPDFのアップロード

    リクエスト本文に、再編集を適用したいサンプルPDFファイルをアップロードしてください。 ファイルが pdf_file として追加されていることを確認してください。

  5. **リクエストの実行

    実行」をクリックしてリクエストを実行します。レスポンスには、再編集されたPDFが含まれます。 このSwagger UIインタラクションにより、再編集プロセスを簡単にテストでき、すぐにフィードバックが得られます。

    申し訳ありませんが、翻訳するコンテンツのテキストを提供してください。その後、英語から日本語に翻訳いたします。!-- 6.出力されたPDFの確認:

    結果の理解

Swagger Docに必要なパラメータを入力した後、POSTリクエストを実行します。 リクエストに成功すると、上の例にあるように、ダウンロード可能な修正されたPDFファイルとともに200ステータスコードが返されます。

上の修正PDFでは、「we」という単語がブラックボックスに置き換えられています。 さらに、match_whole_word booleanはTrueに設定され、単語内の部分一致ではなく、単語全体のみを再編集することを示す。

-->


コマンドプロンプトからCURLリクエストを使用する

別の方法として、コマンドプロンプトでcurl POSTリクエストを使って同じ結果を得ることもできます。

curl -X POST 'http://localhost:8080/v1/document-services/pdfs/redact-text' \
 -H 'accept: */*' \
 -H 'Content-Type: multipart/form-data' \
 -F 'pdf_file=@sample.pdf;type=application/pdf' \
 -F 'words_to_redact="we"' \
 -F 'draw_black_box=true' \
 -F 'match_whole_word=true'

次の内容にご注意ください。
デフォルトでは、PowerShell は curl を PowerShell 組み込みコマンドレット Invoke-WebRequest のエイリアスとして解釈します。 curlの代わりにcurl.exeを使ってみてください。

curl.exe --version

必須リクエスト・ボディ・パラメータ

名前 データ型 説明
pdf_file アプリケーション/pdf 操作したいPDFファイル
ワード_トゥ_リダクト 配列[文字列] このパラメータは、単語のリストを取り、入力に一致するテキストを再編集します。

オプションのリクエストボディパラメータ

名前 データ型 説明
ユーザー_パスワード 文字列 これは、入力PDFにユーザーパスワードがある場合に必要です。パスワードで保護されたPDFにパスワードが与えられない場合、操作は失敗します。
オーナーパスワード 文字列 これは、入力PDFに所有者パスワードがある場合に必要です。パスワードで保護されたPDFにパスワードが与えられない場合、操作は失敗します。
specific_pages 配列[整数] テキストを再編集するページを指定できます。デフォルトでは、値はnullで、すべてのページで提供された単語が再編集されることを意味します。
draw_black_box ブーリアン テキストにブラック ボックスを付けるかどうかを指定します。デフォルトでは、この値はTrueに設定されています。
match_whole_word ブーリアン 単語内の部分一致も再編集するかどうかを指定します。例えば、指定された単語が "are "の場合、"hare "のような "are "を含む単語は、"are "も再編集されます。デフォルトではTrueに設定されています。
一致ケース ブーリアン 大文字と小文字の完全一致を指定します。デフォルトでは、この値はNULLです。注意: これを True に設定すると、小文字と大文字の文字列はマッチしません。例えば、指定された単語が "WE "の場合、小文字の "we "は編集されません。
オーバーレイテキスト 文字列 これは、冗長化されたテキストの上に、単語や記号などのオーバーレイテキストを指定します。デフォルトでは、この文字列は空です。
PDF/Aとして保存 ブーリアン PDF/A-3 準拠で変更 PDF を保存します。デフォルトではFalseに設定されています。
save_as_pdfua ブーリアン PDF/UA 準拠で変更 PDF を保存します。デフォルトではFalseに設定されています。

オプションのヘッダーパラメータ

名前 データ型 説明
著者 文字列 PDF文書の作成者であることを示すのに便利です。デフォルトでは、このフィールドは空です。
タイトル 文字列 PDF文書のタイトルを表示します。デフォルトでは、このフィールドは空です。
件名 文字列 PDF文書の内容を一目で識別するのに便利です。デフォルトでは、このフィールドは空です。