Extract Images from DOCX with C# using IronWord

Actualizado:22 de febrero de 2026

Translated

View the article in English

El método ExtractImages() de IronWord le permite extraer mediante programación todas las imágenes incrustadas de documentos de Word, proporcionando acceso a datos de imágenes y metadatos como dimensiones y formato para guardar o procesar.

Inicio rápido: Extraer imágenes de DOCX en C#

Instala IronWord con el Administrador de Paquetes NuGet
PM > Install-Package IronWord

Copie y ejecute este fragmento de código.

// Install IronWord: Install-Package IronWord
using IronWord;
using IronSoftware.Drawing;

// Load your Word document
WordDocument doc = new WordDocument("document.docx");

// Extract all images
var images = doc.ExtractImages();

// Save each image with custom naming
int imageIndex = 0;
foreach (var image in images)
{
    // Cast to AnyBitmap to access SaveAs method
    ((AnyBitmap)image.Image).SaveAs($"output-{imageIndex}.png");

    // Access image properties
    Console.WriteLine($"Image {imageIndex}: {image.Width}x{image.Height}");
    imageIndex++;
}

Despliegue para probar en su entorno real

Comienza a usar IronWord en tu proyecto hoy mismo con una prueba gratuita

La extracción de imágenes de documentos de Word es un requisito común para la migración de contenidos, la gestión de medios y el procesamiento programático de documentos. Tanto si está construyendo un sistema de gestión de contenidos, automatizando flujos de trabajo de documentos o creando archivos digitales, IronWord simplifica el acceso a imágenes incrustadas, permitiendo guardarlas, reutilizarlas o analizarlas a través de propiedades como dimensiones y formato.

Comience a usar IronWord

Cómo extraer imágenes de DOCX

Instalar IronWord: `Install-Package IronWord`
Cargar un documento de Word existente
Llama `ExtractImages()` para recuperar todas las imágenes incrustadas
Iterar a través de imágenes y guardarlas en el disco
Acceda a propiedades de imagen como ancho y alto

¿Cómo extraer imágenes de un documento de Word?

Extraer imágenes de un documento de Word es sencillo con IronWord. El archivo embedded_images.docx se utilizará como archivo de ejemplo que incluye 5 imágenes en 3 páginas diferentes. El fragmento de código a continuación define el flujo de trabajo principal para el proceso de extracción de imágenes utilizando el método ExtractImages().

Al trabajar con bibliotecas de procesamiento de documentos, es esencial comprender los requisitos de licencia para asegurarse de que su aplicación cumple con los términos de uso. IronWord sigue patrones de licencia similares a los de otros productos de Iron, ofreciendo licencias perpetuas con opciones de asistencia completas. Para los despliegues de producción, tendrás que aplicar claves de licencia para eliminar cualquier marca de agua o restricción.

:path=/static-assets/word/content-code-examples/how-to/extract-images-properties.cs

using System;
using IronWord;
using IronSoftware.Drawing;

// Load an existing Word document
WordDocument doc = new WordDocument("embedded_images.docx");

// Extract all images from the document
var images = doc.ExtractImages();

// Iterate through extracted images
int count = 0;
foreach (var image in images)
{
    // Save each image to disk
    string fileName = $"extracted-image-{count}.png";
    ((AnyBitmap)image.Image).SaveAs(fileName);

    Console.WriteLine($"Extracted image {count}:");
    Console.WriteLine($"Width: {image.Width}");
    Console.WriteLine($"Height: {image.Height}");
    Console.WriteLine($"Saved as: {fileName}");

    count++;
}

Console.WriteLine($"Total images extracted: {count}");

$vbLabelText $csharpLabel

El método ExtractImages devuelve una colección enumerable de objetos de imagen, cada uno de los cuales contiene los datos completos de la imagen junto con los metadatos. Para guardar imágenes, convierta la propiedad Image a AnyBitmap usando ((AnyBitmap)image.Image).SaveAs() para acceder al método SaveAs. Esto requiere agregar using IronSoftware.Drawing; a sus declaraciones de espacio de nombres.

Este enfoque permite flujos de trabajo de procesamiento flexibles: puedes guardar las imágenes en el disco como se muestra arriba, convertirlas a diferentes formatos o transmitirlas directamente a servicios de almacenamiento en la nube. El método maneja varios formatos de imagen comúnmente incrustados en documentos de Word, incluyendo JPEG, PNG, BMP y GIF.

¿Cómo es el documento de muestra?

¿Qué resultados puedo esperar?

Las imágenes extraídas conservan su formato original (por ejemplo, .jpg, .png u otros formatos) y se pueden guardar con las extensiones de archivo adecuadas. Puede recorrer todas las imágenes del documento o centrarse en secciones específicas en función de sus necesidades.

Escenarios avanzados de extracción de imágenes

Más allá de la extracción básica, las capacidades de manejo de imágenes de IronWord admiten varios escenarios avanzados que los desarrolladores encuentran con frecuencia en las aplicaciones de producción:

Procesamiento por lotes de múltiples documentos: Al procesar grandes colecciones de documentos, puede implementar el procesamiento paralelo para extraer imágenes de varios archivos de Word simultáneamente. Este enfoque reduce significativamente el tiempo de procesamiento de archivos de documentos o proyectos de migración de contenidos.

Conversión de formatos de imagen: Los objetos de imagen extraídos admiten la conversión entre formatos. Podría extraer un JPEG de un documento de Word y guardarlo como PNG para optimizarlo para la web, o convertirlo a WebP para que sea compatible con los navegadores modernos.

Conservación de metadatos: Cada imagen extraída conserva metadatos importantes, como dimensiones, resolución y profundidad de color. Esta información resulta muy valiosa a la hora de implementar procesos de optimización de imágenes o de mantener los estándares de calidad en toda la aplicación.

En el caso de las aplicaciones empresariales que requieren asistencia continua y actualizaciones periódicas, considere la posibilidad de explorar extensiones de licencia que proporcionan acceso continuo a nuevas funciones y asistencia prioritaria. Si el alcance de su proyecto se amplía, opciones de actualización permiten escalar sin problemas para cubrir desarrolladores o ubicaciones de despliegue adicionales.

Integración con flujos de trabajo de documentos

La extracción de imágenes suele formar parte de flujos de trabajo más amplios de procesamiento de documentos. Considere estos patrones de integración comunes:

Sistemas de gestión de contenidos: extraer imágenes durante la carga de documentos para crear vistas previas en miniatura, crear galerías de imágenes o rellenar bibliotecas multimedia. Las imágenes extraídas pueden indexarse para realizar búsquedas o etiquetarse con metadatos de documentos.

Conversión de documentos: Al convertir documentos de Word a otros formatos, las imágenes extraídas pueden procesarse por separado para obtener una calidad óptima. Esta separación permite la optimización de formatos específicos, por ejemplo, aplicando diferentes ajustes de compresión para la web y para la impresión.

Flujos de trabajo de garantía de calidad: La extracción automatizada permite la revisión sistemática de las imágenes incrustadas para comprobar que cumplen las directrices de la marca, los requisitos de resolución o las limitaciones de tamaño de archivo. Puede marcar los documentos que contengan imágenes de baja resolución o formatos incorrectos antes de su publicación.

Para mantenerse al día de las últimas funciones y mejoras en las capacidades de procesamiento de documentos, consulte periódicamente el registro de cambios del producto. Las nuevas versiones suelen incluir mejoras de rendimiento y una mayor compatibilidad con formatos que pueden beneficiar a sus flujos de trabajo de extracción de imágenes.

Consideraciones sobre el rendimiento

Cuando trabaje con documentos que contengan numerosas imágenes o imágenes de alta resolución, tenga en cuenta estas estrategias de optimización del rendimiento:

Gestión de memoria: Procese imágenes por lotes en lugar de cargar todas las imágenes en memoria simultáneamente. Este enfoque evita el agotamiento de la memoria cuando se trata de documentos de gran tamaño o imágenes de alta resolución.

Procesamiento asíncrono: implementar patrones asíncronos/de espera para operaciones de E/S, especialmente al guardar imágenes extraídas en disco o almacenamiento en red. Esto mantiene la capacidad de respuesta de su aplicación durante largas operaciones de extracción.

Extracción selectiva: si solo necesita imágenes específicas, considere la posibilidad de implementar filtros basados en las propiedades de la imagen o en la estructura del documento para evitar procesar contenido innecesario.

El sólido diseño de la API garantiza un comportamiento coherente en diferentes tipos de documentos y formatos de imagen, lo que facilita la incorporación de funciones fiables de extracción de imágenes en sus aplicaciones .NET.

Preguntas Frecuentes

¿Cómo extraer imágenes de un archivo DOCX en C#?

Puede extraer imágenes de archivos DOCX utilizando el método ExtractImages() de IronWord. Simplemente cargue su documento Word con WordDocument doc = new WordDocument("document.docx"), luego llame a doc.ExtractImages() para recuperar todas las imágenes incrustadas. Cada imagen puede guardarse utilizando el método SaveAs() con el formato y nombre de archivo que prefiera.

¿A qué propiedades de imagen puedo acceder al extraer imágenes de documentos de Word?

IronWord proporciona acceso a metadatos de imagen importantes, incluidas las dimensiones de anchura y altura. El método ExtractImages() devuelve una colección de objetos de imagen que contienen tanto datos de imagen sin procesar como estas propiedades de metadatos, lo que permite analizar o procesar imágenes mediante programación en función de sus características.

¿Puedo guardar las imágenes extraídas en distintos formatos?

Sí, IronWord permite guardar las imágenes extraídas en varios formatos. Utilice el método SaveAs() en cada objeto de imagen y especifique el nombre de archivo deseado con la extensión adecuada (por ejemplo, .png, .jpg). La biblioteca se encarga automáticamente de la conversión de formato basándose en la extensión de archivo que le proporcione.

¿Cómo se instala la biblioteca para extraer imágenes de documentos Word?

Instale IronWord a través del gestor de paquetes NuGet utilizando el comando: Install-Package IronWord. Una vez instalado, añada 'using IronWord;' a su archivo C# para acceder a la funcionalidad de extracción de imágenes y otras características de procesamiento de documentos.

¿Es posible extraer imágenes de documentos Word de varias páginas?

Sí, el método ExtractImages() de IronWord extrae todas las imágenes del documento Word completo, independientemente del número de páginas que contenga. El método devuelve una colección completa de todas las imágenes incrustadas que se encuentran en el documento, tanto si están en una página como si están repartidas por varias páginas.

Ahmad Sohail

Chatea con el equipo de ingeniería ahora

Desarrollador Full Stack

Ahmad es un desarrollador full-stack con una sólida base en C#, Python y tecnologías web. Tiene un profundo interés en construir soluciones de software escalables y disfruta explorando cómo el diseño y la funcionalidad se encuentran en aplicaciones del mundo real.

Antes ...

¿Listo para empezar?

Nuget Descargas 36,374 | Versión: 2026.3 recién lanzado

Ver Licencias

¿Aún desplazándote?

¿Quieres una prueba rápida? PM > Install-Package IronWord
ejecuta una muestra observa cómo tus datos se convierten en un documento de Word.

Ver Licencias

Destacado del Cliente:

Enfoque del Desarrollador:

Webinars:

Comenzar prueba gratuita de 30 días

En esta página

Extract Images from DOCX with C# using IronWord

Instala IronWord con el Administrador de Paquetes NuGet

Copie y ejecute este fragmento de código.

Despliegue para probar en su entorno real

Comience a usar IronWord

Cómo extraer imágenes de DOCX

¿Cómo extraer imágenes de un documento de Word?

¿Cómo es el documento de muestra?

¿Qué resultados puedo esperar?

Escenarios avanzados de extracción de imágenes

Integración con flujos de trabajo de documentos

Consideraciones sobre el rendimiento

Preguntas Frecuentes

¿Cómo extraer imágenes de un archivo DOCX en C#?

¿A qué propiedades de imagen puedo acceder al extraer imágenes de documentos de Word?

¿Puedo guardar las imágenes extraídas en distintos formatos?

¿Cómo se instala la biblioteca para extraer imágenes de documentos Word?

¿Es posible extraer imágenes de documentos Word de varias páginas?

¿Aún desplazándote?

Equipo de soporte de Iron

Comenzar prueba gratuita de 30 días

En esta página

Extract Images from DOCX with C# using IronWord

Instala IronWord con el Administrador de Paquetes NuGet

Copie y ejecute este fragmento de código.

Despliegue para probar en su entorno real

Comience a usar IronWord

Cómo extraer imágenes de DOCX

¿Cómo extraer imágenes de un documento de Word?

¿Cómo es el documento de muestra?

¿Qué resultados puedo esperar?

Escenarios avanzados de extracción de imágenes

Integración con flujos de trabajo de documentos

Consideraciones sobre el rendimiento

Preguntas Frecuentes

¿Cómo extraer imágenes de un archivo DOCX en C#?

¿A qué propiedades de imagen puedo acceder al extraer imágenes de documentos de Word?

¿Puedo guardar las imágenes extraídas en distintos formatos?

¿Cómo se instala la biblioteca para extraer imágenes de documentos Word?

¿Es posible extraer imágenes de documentos Word de varias páginas?

¿Aún desplazándote?

Próximo paso: Comenzar prueba gratuita de 30 días

Próximo paso: Comenzar prueba gratuita de 30 días

Confiado por millones de ingenieros en todo el mundo

Equipo de soporte de Iron