Extrair texto

Ao extrair um grande volume de texto de documentos, o processo pode ser ineficiente e demorado, especialmente ao lidar com tabelas e grandes quantidades de parágrafos. No entanto, o método ExtractText do IronWord é uma solução que economiza tempo. Isso permite que os desenvolvedores extraiam facilmente todo um número específico de textos dentro do documento, eliminando a necessidade de loops adicionais e simplificando o acesso à propriedade Text. Esse método garante que os desenvolvedores possam trabalhar de forma eficiente e economizar tempo valioso.

Neste exemplo, mostraremos várias maneiras de usar o método ExtractText e aumentar sua eficiência ao recuperar texto de documentos.

Formas úteis de extrair texto de um arquivo Docx

  • using IronWord;
  • WordDocument doc = new WordDocument("multi-paragraph.docx");
  • Console.WriteLine(doc.ExtractText());
  • Console.WriteLine(doc.Paragraphs[0].ExtractText());
  • Console.WriteLine(doc.Paragraphs.Last().ExtractText());

Texto extraído

Utilizando a biblioteca IronWord , extrair texto de um documento do Word é um processo simples. Começamos importando a biblioteca e inicializando a classe WordDocument. Esta etapa nos permite carregar um documento existente com parágrafos. Em seguida, chamamos o método ExtractText e imprimimos todo o texto do documento no console.

Extrair texto específico

O exemplo acima extrai o texto completo do documento, mas com a biblioteca IronWord , você tem controle total sobre o processo de extração. Se você quiser apenas partes ou parágrafos específicos, pode usar a propriedade Paragraphs em WordDocument para retornar uma matriz de Paragraphs. Como uma lista genérica, essa matriz pode ser manipulada de acordo com suas necessidades, seja chamando o índice como mostrado acima com doc.Paragraphs[0] ou usando os métodos de matriz integrados para coleções C#.

Ao acessar o índice de Paragraphs, retornamos e extraímos apenas o texto do primeiro parágrafo do documento e o imprimimos no console. Em seguida, também o chamamos de Last no array Paragraphs para retornar e extrair o texto apenas do último parágrafo do documento.

Explore a API IronWord para extração de texto avançada.

Pronto para começar?
Nuget Baixar 44,829 | Versão: 2026.5 just released
Still Scrolling Icon

Ainda está rolando a tela?

Quer provas rápidas? PM > Install-Package IronWord
executar um exemplo Veja seus dados se transformarem em um documento do Word.