擷取文字

在從文件中擷取大量文字時,此過程可能效率低下且耗時,特別是在處理表格和大量段落時。然而,IronWord 的 ExtractText 方法 提供了一種節省時間的解決方案。 它讓開發人員能夠輕鬆擷取文件中特定數量的文字,無需額外使用迴圈,並簡化對 Text 屬性的存取。 此方法可確保開發人員能高效工作並節省寶貴的時間。

在此範例中,我們將展示幾種使用 ExtractText 方法的方式,並提升您從文件中擷取文字的效率。

從 Docx 檔案中擷取文字的實用方法

  • using IronWord;
  • WordDocument doc = new WordDocument("multi-paragraph.docx");
  • Console.WriteLine(doc.ExtractText());
  • Console.WriteLine(doc.Paragraphs[0].ExtractText());
  • Console.WriteLine(doc.Paragraphs.Last().ExtractText());

擷取文字

使用 IronWord程式庫,從 Word 文件中擷取文字是一項簡單的流程。 我們首先導入該函式庫,並初始化 WordDocument 類別。 此步驟可讓我們載入包含段落的現有文件。接著我們呼叫 ExtractText 方法,並將文件的完整內容輸出至控制台。

擷取特定文字

上述範例會擷取整份文件的文字內容,但透過 IronWord程式庫,您可完全掌控擷取流程。 若您僅需特定段落或內容,可使用 Paragraphs 中的 WordDocument 屬性,以返回 Paragraphs 陣列。 作為一般性清單,此陣列可根據您的需求進行操作,無論是如上所示透過 doc.Paragraphs[0] 呼叫索引,或是使用 C# 集合的內建陣列方法皆可。

當存取 Paragraphs 的索引時,我們僅會擷取文件首段的文字並將其 PRINT 至控制台。 隨後,我們也在 Paragraphs 陣列上呼叫 Last,以僅從文件中擷取並返回最後一段的文字。

探索 IronWord API 以進行進階文字擷取

準備開始了嗎?
Nuget 下載 44,829 | 版本: 2026.5 just released
Still Scrolling Icon

還在往下捲動嗎?

想要快速確認成果嗎? PM > Install-Package IronWord
執行範例 觀看您的資料轉為 WORD 文件。