Wyodrębnij tekst
Pobieranie dużych ilości tekstu z dokumentów może być nieefektywne i czasochłonne, zwłaszcza w przypadku tabel i dużych ilości akapitów. Jednak metoda ExtractText programu IronWord stanowi rozwiązanie pozwalające zaoszczędzić czas. Umożliwia to programistom łatwe wyodrębnianie określonej liczby tekstu z dokumentu, eliminując potrzebę stosowania dodatkowych pętli i upraszczając dostęp do właściwości Text. Ta metoda gwarantuje, że programiści mogą pracować wydajnie i oszczędzać cenny czas.
W tym przykładzie pokażemy kilka sposobów wykorzystania metody ExtractText i zwiększenia wydajności podczas pobierania tekstu z dokumentów.
Przydatne sposoby na wyciąganie tekstu z pliku Docx
using IronWord;WordDocument doc = new WordDocument("multi-paragraph.docx");Console.WriteLine(doc.ExtractText());Console.WriteLine(doc.Paragraphs[0].ExtractText());Console.WriteLine(doc.Paragraphs.Last().ExtractText());
Wyodrębnij tekst
Dzięki bibliotece IronWord wyodrębnianie tekstu z dokumentu Worda jest prostym procesem. Zaczynamy od zaimportowania biblioteki i zainicjowania klasy WordDocument. Ten krok pozwala nam załadować istniejący dokument zawierający akapity. Następnie wywołujemy metodę ExtractText i drukujemy cały tekst dokumentu na konsoli.
Wyodrębnij określony tekst
W powyższym przykładzie wyodrębniono cały tekst dokumentu, ale dzięki bibliotece IronWord masz pełną kontrolę nad procesem wyodrębniania. Jeśli chcesz przetłumaczyć tylko określone fragmenty lub akapity, możesz użyć właściwości Paragraphs w WordDocument, aby zwrócić tablicę Paragraphs. Jako lista ogólna, ta tablica może być modyfikowana zgodnie z wymaganiami, albo poprzez wywołanie indeksu, jak pokazano powyżej za pomocą doc.Paragraphs[0], albo poprzez użycie wbudowanych metod tablicowych dla kolekcji C#.
Podczas uzyskiwania dostępu do indeksu Paragraphs zwracamy i wyodrębniamy jedynie tekst z pierwszego akapitu dokumentu, a następnie PRINTujemy go w konsoli. Następnie wywołujemy również Last w tablicy Paragraphs, aby zwrócić i wyodrębnić z dokumentu wyłącznie tekst ostatniego akapitu.

