using IronWord; using System.Linq; using System; // Load docx WordDocument doc = new WordDocument("multi-paragraph.docx"); // Returns text from the entire file Console.WriteLine(doc.ExtractText()); // Returns text from the first paragraph only Console.WriteLine(doc.Paragraphs[0].ExtractText()); // Returns text from the last paragraph only Console.WriteLine(doc.Paragraphs.Last().ExtractText());

提取文本

从文档中提取大量文本时，尤其是在处理表格和大量段落时，效率低下且耗时。然而，IronWord 的 ExtractText 方法是一种节省时间的解决方案。它使开发人员能够轻松提取文档中特定数量的所有文本，从而无需额外的循环，并简化了对 Text 属性的访问。这种方法可以确保开发人员高效工作并节省宝贵时间。

在这个例子中，我们将展示几种使用 ExtractText 方法的方法，以提高从文档中检索文本的效率。

从 Docx 文件中提取文本的实用方法

using IronWord;
WordDocument doc = new WordDocument("multi-paragraph.docx");
Console.WriteLine(doc.ExtractText());
Console.WriteLine(doc.Paragraphs[0].ExtractText());
Console.WriteLine(doc.Paragraphs.Last().ExtractText());

提取文本

使用 IronWord 库，从 Word 文档中提取文本是一个简单的过程。我们首先导入库并初始化 WordDocument 类。这一步骤允许我们加载一个包含段落的现有文档。然后，我们调用 ExtractText 方法，并将文档的全部文本打印到控制台。

提取特定文本

上面的示例提取了整个文档的文本，但使用 IronWord 库，您可以完全控制提取过程。如果您只想获取特定部分或段落，可以使用 Paragraphs 属性在 WordDocument 中返回一个 Paragraphs 数组。作为通用列表，您可以根据需要操作此数组，既可以通过像上面那样使用 doc.Paragraphs[0] 调用索引，也可以使用 C# 集合的内置数组方法。

访问 Paragraphs 的索引时，我们只返回并提取文档第一段的文本，并将其打印到控制台。随后，我们还调用 Last 数组，以便仅从文档中返回和提取最后一个段落的文本。

探索 IronWord API 的高级文本提取功能