Extraer Texto

Al extraer un gran volumen de texto en documentos, el proceso puede ser ineficiente y llevar mucho tiempo, especialmente cuando se trata de tablas y grandes cantidades de párrafos. Sin embargo, el método ExtractText de IronWord es una solución que ahorra tiempo. Permite a los desarrolladores extraer fácilmente todo un número específico de texto dentro del documento, eliminando la necesidad de bucles adicionales y simplificando el acceso a la propiedad Text. Este método garantiza que los desarrolladores puedan trabajar de manera eficiente y ahorrar tiempo valioso.

En este ejemplo, mostraremos varias formas de usar el método ExtractText y aumentar tu eficiencia al recuperar texto de documentos.

Formas útiles de extraer texto de un DOCX

  • using IronWord;
  • WordDocument doc = new WordDocument("multi-paragraph.docx");
  • Console.WriteLine(doc.ExtractText());
  • Console.WriteLine(doc.Paragraphs[0].ExtractText());
  • Console.WriteLine(doc.Paragraphs.Last().ExtractText());

Extraer texto

Usando la biblioteca IronWord, extraer texto de un documento Word es un proceso sencillo. Comenzamos importando la biblioteca e inicializando la clase WordDocument. Este paso nos permite cargar un documento existente con párrafos. Luego llamamos al método ExtractText e imprimimos todo el texto del documento en la consola.

Extraer texto específico

El ejemplo anterior extrae el texto completo del documento, pero con la biblioteca IronWord, tienes control total sobre el proceso de extracción. Si solo quieres porciones específicas o párrafos, puedes usar la propiedad Paragraphs en el WordDocument para devolver un array de Paragraphs. Como una lista genérica, este array se puede manipular según tus necesidades, ya sea llamando al índice como se muestra arriba con doc.Paragraphs[0] o utilizando los métodos de array integrados para colecciones de C#.

Al acceder al índice de los Paragraphs, solo devolvemos y extraemos el texto del primer párrafo del documento y lo imprimimos en la consola. Subsecuentemente, también llamamos al Last en el array de Paragraphs para devolver y extraer el texto solo del último párrafo del documento.

Explora la API de IronWord para la extracción avanzada de texto

¿Listo para empezar?
Nuget Descargas 27,129 | Version: 2025.11 recién lanzado