C#でDOCXからテキストを削除する方法
IronWordはC#でWord文書からテキストを削除する複数の方法を提供します。段落全体の削除、特定のテキストの削除、削除前の内容によるテキストの検索などが含まれ、すべて文書構造と書式の整合性を維持します。
DOCXからテキストを削除する方法
- Word文書からテキストを削除するC#ライブラリのダウンロード
- 既存のWord文書を読み込む
- 削除が必要なテキストコンテンツの特定
- `Remove`メソッドで選択したテキストを削除します。
- 変更を保存し、更新されたドキュメントをDOCXファイルとしてエクスポートします。
クイックスタート: DOCX からテキストを削除する
1.NuGetパッケージマネージャ経由でIronWordをインストールする
WordDocumentを使用して DOCX ファイルをロードします。
3.インデックスから段落やテキストにアクセス- 対象要素に対して
Remove()を呼び出す
5.修正したドキュメントを保存する
-
IronWord をNuGetパッケージマネージャでインストール
PM > Install-Package IronWord -
このコード スニペットをコピーして実行します。
using IronWord; // Load document WordDocument doc = new WordDocument("document.docx"); // Remove second paragraph doc.Paragraphs[1].Remove(); // Save changes doc.SaveAs("document_modified.docx"); -
実際の環境でテストするためにデプロイする
今日プロジェクトで IronWord を使い始めましょう無料トライアル
Word文書から段落全体を削除するにはどうすればよいですか?
Word 文書から段落を削除するには、そのインデックス位置を使用して Paragraphs コレクションを通じてアクセスします。 この例では、インデックス1の段落を削除し、その内容と書式をすべて削除しています。 文書構造は、削除後に自動的に調整され、後続の段落がギャップを埋めるようにシフトアップします。
段落を削除する場合は、インデックスがゼロベースであることを忘れないでください。 最初の段落はインデックス0、2番目の段落はインデックス1、といった具合です。 Remove() メソッドは、すべてのテキスト ラン、書式設定、およびその段落内の画像やハイパーリンクなどの埋め込みコンテンツを含む段落要素をドキュメント構造から完全に削除します。
:path=/static-assets/word/content-code-examples/how-to/remove-text-simple.cs
using IronWord;
// Load a DOCX document
WordDocument doc = new WordDocument("text_document.docx");
// Remove the second paragraph
doc.Paragraphs[1].Remove();
// Export the file
doc.SaveAs("text_document_modified.docx");
Imports IronWord
' Load a DOCX document
Dim doc As New WordDocument("text_document.docx")
' Remove the second paragraph
doc.Paragraphs(1).Remove()
' Export the file
doc.SaveAs("text_document_modified.docx")
削除前のドキュメントはどのようなものですか?
削除後、文書構造はどのように変化しますか?
削除作業では、文書全体の書式と構造を維持します。 残りの段落は、元の色と書式のプロパティを保持します。 これは、IronWordの除去メソッドを使用する主な利点です。ターゲットとなる要素をきれいに除去しながら、周囲のコンテンツの整合性を保つことができます。
段落内の特定の書式付きテキストを削除するにはどうすればよいですか?
段落には複数のテキスト ランを含めることができ、各ランは太字、斜体、色などの一貫した書式設定プロパティを持つテキストを表します。 正確なコンテンツ操作のためには、テキストランを理解することが重要です。 段落内で書式が変わるたびに、新しいテキストが始まります。 たとえば、1つの単語が太字になっている文章がある場合、通常、太字の前のテキスト、太字の単語そのもの、太字の後のテキストの3つのテキストがあります。
段落内の特定の書式設定されたコンテンツを削除するには、Texts コレクションにアクセスし、インデックスによって実行される目的のテキストをターゲットにします。 この例では、最初の段落から 3 番目のテキスト ラン (インデックス 2) を削除し、他のコンテンツはそのまま残します。 このきめ細かなコントロールにより、段落構造を維持しながら、特定の書式セグメントのみを削除することができます。
:path=/static-assets/word/content-code-examples/how-to/remove-text-text-run.cs
using IronWord;
// Load a DOCX document
WordDocument doc = new WordDocument("sample.docx");
// Remove the first paragraph's third textrun
doc.Paragraphs[0].Texts[2].Remove();
// Export the file
doc.SaveAs("sample_after_textrun_removal.docx");
Imports IronWord
' Load a DOCX document
Dim doc As New WordDocument("sample.docx")
' Remove the first paragraph's third textrun
doc.Paragraphs(0).Texts(2).Remove()
' Export the file
doc.SaveAs("sample_after_textrun_removal.docx")
テキストランを使用する場合、テキストランを削除しても、周囲のランのフォーマットには影響しないことを覚えておいてください。 各テキストは、独立してフォーマットプロパティを維持します。 このため、残りのテキストの視覚的な外観を崩すことなく、特定の書式のコンテンツを外科的に削除することが可能です。
削除前のテキストはどうなりますか?
テキストを削除すると、段落の書式設定にどのような影響がありますか?
画像に示すように、特定のテキストを削除しても、残りのコンテンツの書式は維持されます。 下線テキストやその他の書式プロパティは変更せず、テキスト実行操作の正確さを示します。
位置ではなく内容でテキストを検索して削除するにはどうすればよいですか?
FindText メソッドは、位置ではなくテキストの一致に基づいてコンテンツを動的に検索および削除します。 これは、無効なテキスト、プレースホルダ、または正確な場所を知らなくてもドキュメントの任意の場所にある特定のコンテンツを削除する場合に特に便利です。 このメソッドは一致するテキスト要素を返すか、見つからない場合は null を返すため、Remove を呼び出す前に null チェックを行って安全に削除できます。
このアプローチは、プレースホルダ・テキストの削除が必要なテンプレート・ドキュメントを扱う場合や、既知のエラー・パターンを含むドキュメントをクリーンアップする場合に非常に有効です。 FindText メソッドは、デフォルトで大文字と小文字を区別した検索を実行し、対象コンテンツの正確な一致を保証します。
:path=/static-assets/word/content-code-examples/how-to/remove-text-find.cs
using IronWord;
// Load the document
WordDocument doc = new WordDocument("sample.docx");
// Find and remove erroneous text
var textToRemove = doc.FindText("ERRONEOUS TEXT IS HERE.");
textToRemove?.Remove();
// Save the cleaned document
doc.SaveAs("sample_cleaned.docx");
Imports IronWord
' Load the document
Dim doc As New WordDocument("sample.docx")
' Find and remove erroneous text
Dim textToRemove = doc.FindText("ERRONEOUS TEXT IS HERE.")
textToRemove?.Remove()
' Save the cleaned document
doc.SaveAs("sample_cleaned.docx")
上記のコードの null 条件演算子 (?.) は、安全な実行に不可欠です。 テキストが見つからない場合、FindText は null を返し、null 条件演算子によって NullReferenceException が防止されます。 このパターンは、ターゲットテキストが常に存在するとは限らないドキュメントを扱うときに、コードをより堅牢にします。
検索と削除を使用する前に、どのようなコンテンツを探す必要がありますか?
どのように FindText は複数の出現を処理しますか?
FindText を使用する場合、一致するテキストの最初の出現が返されることに注意してください。 文書全体で特定のテキストをすべて削除する必要がある場合は、一致するテキストがなくなるまで検索と削除を続けるループを実装します。 この反復的なアプローチにより、文書全体にわたって包括的なテキスト除去が保証されます。
検索と削除の機能により、削除されたテキスト以外の文書の書式と構造が保持されます。 段落の区切り、周囲のテキストの書式、ドキュメントスタイルはそのままで、不要なコンテンツを削除しながらドキュメントの一貫性を維持する安全な作業です。
よくある質問
C# で Word 文書から段落全体を削除するにはどうすればよいですか?
IronWordでは、Paragraphsコレクションのインデックス位置から段落にアクセスし、Remove()メソッドを呼び出すことで段落を削除することができます。例えば、doc.Paragraphs[1].Remove() は2番目の段落(インデックス1)を削除します。削除後、文書構造は自動的に調整され、後続の段落は隙間を埋めるように上に移動します。
テキストを削除すると、文書構造はどうなりますか?
IronWordはテキストを削除しても、文書全体の書式と構造を維持します。残りの段落は元の色と書式プロパティを保持し、文書は自動的にリフローしてギャップをなくします。これにより、対象となる要素をきれいに削除しながら、周囲のコンテンツの整合性が保たれます。
段落全体ではなく、段落内の特定の書式付きテキストを削除できますか?
はい、IronWordでは段落内の特定のテキストを削除することができます。段落には複数のテキストラン(それぞれが一貫した書式を持つテキストを表す)が含まれることがあるため、段落の残りの内容や構造を維持したまま、個々のテキストランをターゲットにして削除することができます。
Word文書のテキストランとは何ですか?
IronWordでは、テキスト・ランは、太字、斜体、色などの一貫した書式プロパティを持つ段落内のテキストの一部を表します。段落内で書式が変更されるたびに、新しいテキスト・ランが始まります。テキストランを理解することは、Word文書を扱う際に正確なコンテンツ操作を行うために非常に重要です。
Word文書からテキストを削除した後、変更を保存する方法を教えてください。
IronWordを使ってテキストを削除した後、SaveAs()メソッドを呼び出して変更したドキュメントを保存することができます。例えば、doc.SaveAs("document_modified.docx")は、すべての削除変更を適用した更新されたドキュメントを保存します。これにより、元のドキュメントを保持したまま新しいファイルが作成されます。
段落を削除すると、画像やハイパーリンクなどの埋め込みコンテンツも削除されますか?
はい、段落に対してIronWordのRemove()メソッドを使用すると、すべてのテキスト実行、書式設定、段落内の画像やハイパーリンクなどの埋め込みコンテンツを含め、文書構造から段落要素が完全に削除されます。

