Metin Çıkart
Belgelerdeki büyük hacimli metinleri çıkarırken, özellikle tablolar ve çok sayıda paragraf söz konusu olduğunda, bu işlem verimsiz ve zaman alıcı olabilir. Ancak, IronWord'ün ExtractText yöntemi zaman kazandıran bir çözümdür. Geliştiricilerin, belge içindeki belirli sayıda metni kolayca ayıklamasını sağlar, ek döngülere olan ihtiyacı ortadan kaldırır ve Text özelliğine erişimi basitleştirir. Bu yöntem, geliştiricilerin verimli bir şekilde çalışmasını ve değerli zaman kazanmalarını sağlar.
Bu örnekte, ExtractText yöntemini kullanmanın ve belgelerden metin alırken verimliliğinizi artırmanın çeşitli yollarını göstereceğiz.
Docx Dosyasından Metin Çıkarmanın Kullanışlı Yolları
using IronWord;WordDocument doc = new WordDocument("multi-paragraph.docx");Console.WriteLine(doc.ExtractText());Console.WriteLine(doc.Paragraphs[0].ExtractText());Console.WriteLine(doc.Paragraphs.Last().ExtractText());
Metni Çıkar
IronWord kütüphanesini kullanarak, bir Word belgesinden metin çıkarmak basit bir işlemdir. Kütüphaneyi içe aktararak ve WordDocument sınıfını başlatarak başlıyoruz. Bu adım, paragraflar içeren mevcut bir belgeyi yüklememizi sağlar. Ardından ExtractText yöntemini çağırır ve belgenin tüm metnini konsola PRINT ederiz.
Belirli Metni Çıkarın
Yukarıdaki örnek, belgenin tamamının metnini çıkarır, ancak IronWord kütüphanesi ile çıkarma süreci üzerinde tam kontrole sahipsiniz. Yalnızca belirli bölümleri veya paragrafları istiyorsanız, WordDocument içindeki Paragraphs özelliğini kullanarak Paragraphs dizisini döndürebilirsiniz. Genel bir liste olarak, bu dizi, yukarıda doc.Paragraphs[0] ile gösterildiği gibi indeksi çağırarak veya C# koleksiyonları için yerleşik dizi yöntemlerini kullanarak gereksinimlerinize göre değiştirilebilir.
Paragraphs dizinine erişirken, yalnızca belgenin ilk paragrafındaki metni döndürür ve çıkarır, ardından konsola PRINT ederiz. Ardından, Paragraphs dizisinde Last olarak da adlandırıyoruz ve belgeden yalnızca son paragrafın metnini döndürüp çıkarıyoruz.

