IronWord ハウツー テキストを抽出 C#でIronWordを使ってDOCXからテキストを抽出する Ahmad Sohail 更新日:11月 16, 2025 IronWord をダウンロード NuGet ダウンロード 無料トライアル LLM向けのコピー LLM向けのコピー LLM 用の Markdown としてページをコピーする ChatGPTで開く このページについてChatGPTに質問する ジェミニで開く このページについてGeminiに問い合わせる ジェミニで開く このページについてGeminiに問い合わせる 困惑の中で開く このページについてPerplexityに問い合わせる 共有する Facebook で共有 Xでシェア(Twitter) LinkedIn で共有 URLをコピー 記事をメールで送る This article was translated from English: Does it need improvement? Translated View the article in English DOCXファイルからのテキスト抽出は、文書処理やデータ分析に不可欠な要件です。 IronWordは既存のDOCXファイルからテキストコンテンツを読み出し、抽出する簡単な方法を提供し、段落、表、その他のテキスト要素にプログラムでアクセスできるようにします。 このガイドでは、ExtractText() メソッドと、複数のドキュメント コンポーネントからテキストを抽出するその機能に焦点を当てます。 IronWordを始める 今日あなたのプロジェクトでIronWordを無料トライアルで使用開始。 最初のステップ: 無料で始める DOCXからテキストを抽出する方法 DOCXからテキストを抽出するためのC#ライブラリをダウンロードしてインストールする。 新しいWord文書を作成する ターゲットテキストの特定 ExtractTextを使用してテキストコンテンツを抽出する 抽出したテキストを処理またはエクスポートする テキスト抽出の例 ExtractText()メソッドは、Word文書全体からテキストコンテンツを取得します。 この例では、新しいドキュメントオブジェクトがインスタンス化され、サンプルテキストが追加され、ExtractText()メソッドが呼び出され、結果がコンソールに表示されます。 :path=/static-assets/word/content-code-examples/how-to/extract-text-simple.cs using IronWord; // Instantiate a new DOCX file WordDocument doc = new WordDocument(); // Add text doc.AddText("Hello, World!"); // Print extracted text from the document to the console Console.WriteLine(doc.ExtractText()); IRON VB CONVERTER ERROR developers@ironsoftware.com $vbLabelText $csharpLabel 出力 コンソールログ 段落からテキストを抽出する さらに細かく制御するために、ドキュメント全体ではなく特定の段落からテキストを抽出できます。 Paragraphsコレクションにアクセスすることで、任意のセクションをターゲットにして処理することができます。 この例では、最初の段落と最後の段落からテキストを抽出し、それらを結合して、結果を .txt ファイルに保存します。 :path=/static-assets/word/content-code-examples/how-to/extract-text-paragraphs.cs using IronWord; using System.IO; // Load an existing DOCX file WordDocument doc = new WordDocument("document.docx"); // Extract text and assign variables string firstParagraph = doc.Paragraphs[0].ExtractText(); string lastParagraph = doc.Paragraphs.Last().ExtractText(); // Combine the texts string newText = firstParagraph + " " + lastParagraph; // Export the combined text as a new .txt file File.WriteAllText("output.txt", newText); IRON VB CONVERTER ERROR developers@ironsoftware.com $vbLabelText $csharpLabel 最初の段落 最後の段落 テキストファイル出力 上のスクリーンショットは、最初の段落の抽出、最後の段落の抽出、およびテキスト ファイルに保存された結合出力を示しています。 表からのテキスト抽出 テーブルには、処理や分析のために抽出する必要がある構造化データが含まれることがよくあります。 IronWord を使用すると、行やセルを移動してテーブル データにアクセスできます。 この例では、API 統計テーブルを含むドキュメントを読み込み、2 行目の 4 列目から特定のセルの値を抽出します。 :path=/static-assets/word/content-code-examples/how-to/extract-text-table.cs using IronWord; // Load the API statistics document WordDocument apiStatsDoc = new WordDocument("api-statistics.docx"); // Extract text from the 1st table, 4th column and 2nd row string extractedValue = apiStatsDoc.Tables[0].Rows[2].Cells[3].ExtractText(); // Print extracted value Console.WriteLine($"Target success rate: {extractedValue}"); IRON VB CONVERTER ERROR developers@ironsoftware.com $vbLabelText $csharpLabel 例表 コンソールログ よくある質問 IronWord で DOCX ファイルからテキストを抽出する主な方法は何ですか? IronWord を使用して DOCX ファイルからテキストを抽出する主な方法は `ExtractText()` メソッドです。これにより、段落や表などのさまざまなドキュメント要素からテキスト コンテンツを取得できます。 IronWord を使用して特定の段落からテキストを抽出するにはどうすればよいですか? IronWordの「Paragraphs」コレクションにアクセスすることで、特定の段落からテキストを抽出できます。これにより、必要な段落をターゲットにして処理できるため、テキスト抽出プロセスをより細かく制御できます。 IronWord を使用して DOCX ドキュメント内のテーブルからデータを抽出することは可能ですか? はい、IronWord を使用すると、行やセルをナビゲートしてテーブルからデータを抽出できるため、処理や分析のために構造化されたデータに簡単にアクセスできます。 抽出したテキストを IronWord を使用してファイルにエクスポートできますか? はい、IronWord を使用してテキストを抽出したら、それをさらに処理して、.txt ファイルなどのさまざまな形式でエクスポートし、保存したり、さらに使用したりすることができます。 テキスト抽出に IronWord を使い始める手順は何ですか? テキスト抽出に IronWord を使い始めるには、C# ライブラリをダウンロードし、新しい Word 文書を作成し、`ExtractText()` メソッドを使用してテキスト コンテンツにアクセスして抽出し、必要に応じて抽出したテキストを処理またはエクスポートします。 IronWord は DOCX ドキュメント全体からのデータの抽出をサポートしていますか? はい、IronWord は DOCX ドキュメント全体からのデータの抽出をサポートしており、`ExtractText()` メソッドを使用して段落や表を含むすべてのテキスト コンテンツを取得できます。 IronWord は、Word 文書の最初と最後の段落からのテキスト抽出をどのように処理しますか? IronWord では、`Paragraphs` コレクションを通じて特定の段落にアクセスし、必要に応じてテキストを処理することで、最初と最後の段落を含む特定の段落からテキストを抽出できます。 IronWord で抽出されたテキストのコンソール出力を表示する方法はありますか? はい、IronWord は抽出されたテキストをコンソールに表示する機能を提供しており、抽出プロセス中に出力を直接確認できます。 IronWord を使用して DOCX ファイル内のテーブルから特定のセルの値を抽出するにはどうすればよいですか? IronWord を使用すると、行と列をナビゲートしてテーブルから特定のセルの値を抽出できるため、テーブル内の任意のセルからデータをターゲットにして取得することができます。 IronWord は DOCX ファイルからどのようなテキスト要素を抽出できますか? IronWord は、段落、表、その他のテキスト コンポーネントを含むさまざまなテキスト要素を DOCX ファイルから抽出し、包括的なテキスト抽出機能を提供します。 Ahmad Sohail 今すぐエンジニアリングチームとチャット フルスタックデベロッパー Ahmadは、C#、Python、およびウェブ技術に強い基盤を持つフルスタック開発者です。彼はスケーラブルなソフトウェアソリューションの構築に深い関心を持ち、デザインと機能が実際のアプリケーションでどのように融合するかを探求することを楽しんでいます。Iron Softwareチームに参加する前、Ahmadは自動化プロジェクトやAPI統合に取り組み、パフォーマンスの向上と開発者の体験向上に注力してきました。彼の自由時間には、UI/UXのアイデアを試したり、オープンソースツールに貢献したり、時折テクニカルライティングやドキュメンテーションに取り組んで、複雑なトピックを理解しやすくすることを目指しています。 準備はできましたか? Nuget ダウンロード 27,129 | Version: 2025.11 リリース NuGet 無料版 総ダウンロード数: 27,129 ライセンスを見る