Wyodrębnij tekst

Pobieranie dużych ilości tekstu z dokumentów może być nieefektywne i czasochłonne, zwłaszcza w przypadku tabel i dużych ilości akapitów. Jednak metoda ExtractText programu IronWord stanowi rozwiązanie pozwalające zaoszczędzić czas. Umożliwia to programistom łatwe wyodrębnianie określonej liczby tekstu z dokumentu, eliminując potrzebę stosowania dodatkowych pętli i upraszczając dostęp do właściwości Text. Ta metoda gwarantuje, że programiści mogą pracować wydajnie i oszczędzać cenny czas.

W tym przykładzie pokażemy kilka sposobów wykorzystania metody ExtractText i zwiększenia wydajności podczas pobierania tekstu z dokumentów.

Przydatne sposoby na wyciąganie tekstu z pliku Docx

  • using IronWord;
  • WordDocument doc = new WordDocument("multi-paragraph.docx");
  • Console.WriteLine(doc.ExtractText());
  • Console.WriteLine(doc.Paragraphs[0].ExtractText());
  • Console.WriteLine(doc.Paragraphs.Last().ExtractText());

Wyodrębnij tekst

Dzięki bibliotece IronWord wyodrębnianie tekstu z dokumentu Worda jest prostym procesem. Zaczynamy od zaimportowania biblioteki i zainicjowania klasy WordDocument. Ten krok pozwala nam załadować istniejący dokument zawierający akapity. Następnie wywołujemy metodę ExtractText i drukujemy cały tekst dokumentu na konsoli.

Wyodrębnij określony tekst

W powyższym przykładzie wyodrębniono cały tekst dokumentu, ale dzięki bibliotece IronWord masz pełną kontrolę nad procesem wyodrębniania. Jeśli chcesz przetłumaczyć tylko określone fragmenty lub akapity, możesz użyć właściwości Paragraphs w WordDocument, aby zwrócić tablicę Paragraphs. Jako lista ogólna, ta tablica może być modyfikowana zgodnie z wymaganiami, albo poprzez wywołanie indeksu, jak pokazano powyżej za pomocą doc.Paragraphs[0], albo poprzez użycie wbudowanych metod tablicowych dla kolekcji C#.

Podczas uzyskiwania dostępu do indeksu Paragraphs zwracamy i wyodrębniamy jedynie tekst z pierwszego akapitu dokumentu, a następnie PRINTujemy go w konsoli. Następnie wywołujemy również Last w tablicy Paragraphs, aby zwrócić i wyodrębnić z dokumentu wyłącznie tekst ostatniego akapitu.

Poznaj API IronWord do zaawansowanego wyodrębniania tekstu

Gotowy, aby rozpocząć?
Nuget Pliki do pobrania 44,829 | Wersja: 2026.5 just released
Still Scrolling Icon

Wciąż przewijasz?

Czy chcesz szybko dowodu? PM > Install-Package IronWord
uruchom próbkę zobacz, jak twoje dane stają się dokumentem Word.