擷取文字
在從文件中擷取大量文字時,此過程可能效率低下且耗時,特別是在處理表格和大量段落時。然而,IronWord 的 ExtractText 方法 提供了一種節省時間的解決方案。 它讓開發人員能夠輕鬆擷取文件中特定數量的文字,無需額外使用迴圈,並簡化對 Text 屬性的存取。 此方法可確保開發人員能高效工作並節省寶貴的時間。
在此範例中,我們將展示幾種使用 ExtractText 方法的方式,並提升您從文件中擷取文字的效率。
從 Docx 檔案中擷取文字的實用方法
using IronWord;WordDocument doc = new WordDocument("multi-paragraph.docx");Console.WriteLine(doc.ExtractText());Console.WriteLine(doc.Paragraphs[0].ExtractText());Console.WriteLine(doc.Paragraphs.Last().ExtractText());
擷取文字
使用 IronWord程式庫,從 Word 文件中擷取文字是一項簡單的流程。 我們首先導入該函式庫,並初始化 WordDocument 類別。 此步驟可讓我們載入包含段落的現有文件。接著我們呼叫 ExtractText 方法,並將文件的完整內容輸出至控制台。
擷取特定文字
上述範例會擷取整份文件的文字內容,但透過 IronWord程式庫,您可完全掌控擷取流程。 若您僅需特定段落或內容,可使用 Paragraphs 中的 WordDocument 屬性,以返回 Paragraphs 陣列。 作為一般性清單,此陣列可根據您的需求進行操作,無論是如上所示透過 doc.Paragraphs[0] 呼叫索引,或是使用 C# 集合的內建陣列方法皆可。
當存取 Paragraphs 的索引時,我們僅會擷取文件首段的文字並將其 PRINT 至控制台。 隨後,我們也在 Paragraphs 陣列上呼叫 Last,以僅從文件中擷取並返回最後一段的文字。

