Extraer Texto

Al extraer un gran volumen de texto de documentos, el proceso puede ser ineficiente y lento, especialmente al trabajar con tablas y muchos párrafos. Sin embargo, el método ExtractText de IronWord es una solución que ahorra tiempo. Permite a los desarrolladores extraer fácilmente una cantidad específica de texto dentro del documento, eliminando la necesidad de bucles adicionales y simplificando el acceso a la propiedad Text. Este método garantiza que los desarrolladores puedan trabajar de manera eficiente y ahorrar tiempo valioso.

En este ejemplo, mostraremos varias formas de utilizar el método ExtractText y aumentar su eficiencia al recuperar texto de documentos.

Formas útiles de extraer texto de un DOCX

  • using IronWord;
  • WordDocument doc = new WordDocument("multi-paragraph.docx");
  • Console.WriteLine(doc.ExtractText());
  • Console.WriteLine(doc.Paragraphs[0].ExtractText());
  • Console.WriteLine(doc.Paragraphs.Last().ExtractText());

Extraer texto

Usando la biblioteca IronWord, extraer texto de un documento Word es un proceso sencillo. Comenzamos importando la biblioteca e inicializando la clase WordDocument. Este paso nos permite cargar un documento existente con párrafos. Luego, llamamos al método ExtractText e imprimimos el texto completo del documento en la consola.

Extraer texto específico

El ejemplo anterior extrae todo el texto del documento, pero con la biblioteca IronWord, usted tiene el control total sobre el proceso de extracción. Si solo desea partes o párrafos específicos, puede usar la propiedad Paragraphs en WordDocument para devolver una matriz de Paragraphs. Como lista genérica, esta matriz se puede manipular según sus requisitos, ya sea llamando al índice como se muestra arriba con doc.Paragraphs[0] o utilizando los métodos de matriz integrados para colecciones de C#.

Al acceder al índice de Paragraphs, solo retornamos y extraemos el texto del primer párrafo del documento y lo imprimimos en la consola. Posteriormente, también lo llamamos Last en el array Paragraphs para devolver y extraer solo el texto del último párrafo del documento.

Explora la API de IronWord para la extracción avanzada de texto

¿Listo para empezar?
Nuget Descargas 36,374 | Versión: 2026.3 recién lanzado
Still Scrolling Icon

¿Aún desplazándote?

¿Quieres una prueba rápida? PM > Install-Package IronWord
ejecuta una muestra observa cómo tus datos se convierten en un documento de Word.