How to Extract Images from DOCX

This article was translated from English: Does it need improvement?
Translated
View the article in English

Extracting images from Word documents is a common requirement for content migration, media management, and programmatic document processing. IronWord simplifies access to embedded images, allowing them to be saved, reused, or analyzed through properties like dimensions and format.

The ExtractImages() function provides a simple and efficient way to retrieve all images from a document and access their metadata for further processing.

Get started with IronWord

Commencez à utiliser IronWord dans votre projet aujourd'hui avec un essai gratuit.

Première étape :
green arrow pointer


Extract Images Example

Extracting images from a Word document is straightforward with IronWord. The file "embedded_images.docx" will be used as an example file which includes 5 images on 3 different pages. The code snippet down below defines the core workflow for the image extraction process using the ExtractImages() method.

:path=/static-assets/word/content-code-examples/how-to/extract-images-properties.cs
using IronWord;

// Load an existing Word document
WordDocument doc = new WordDocument("embedded_images.docx");

// Extract all images from the document
var images = doc.ExtractImages();

// Iterate through extracted images
int count = 0;
foreach (var image in images)
{
    // Save each image to disk
    string fileName = $"extracted-image-{count}.png";
    image.SaveAs(fileName);

    Console.WriteLine($"Extracted image {count}:");
    Console.WriteLine($"Width: {image.Width}");
    Console.WriteLine($"Height: {image.Height}");
    Console.WriteLine($"Saved as: {fileName}");

    count++;
}

Console.WriteLine($"Total images extracted: {count}");
IRON VB CONVERTER ERROR developers@ironsoftware.com
$vbLabelText   $csharpLabel

Sample File (embedded_images.docx)

Extract images from DOCX

Output

Output of extraction

The extracted images retain their original format (e.g., .jpg, .png, or other formats) and can be saved with appropriate file extensions. You can iterate through all images in the document or target specific sections based on your requirements.

Questions Fréquemment Posées

Quelle est la principale fonctionnalité de la fonction ExtractImages() dans IronWord ?

La fonction ExtractImages() d'IronWord offre un moyen simple et efficace de récupérer toutes les images d'un document Word et d'accéder à leurs métadonnées pour un traitement ultérieur.

Comment puis-je extraire des images de fichiers DOCX avec IronWord ?

Pour commencer à extraire des images de fichiers DOCX à l'aide d'IronWord, téléchargez la bibliothèque IronWord, chargez le document Word, utilisez la méthode ExtractImages() pour extraire les images et enregistrez-les sur le disque pour une utilisation ultérieure.

IronWord peut-il gérer les métadonnées des images lors de l'extraction ?

Oui, IronWord vous permet d'accéder aux métadonnées de l'image, telles que ses dimensions et son format, pendant le processus d'extraction, ce qui peut s'avérer utile pour des analyses ou des traitements ultérieurs.

Quels sont les formats de fichiers pris en charge pour les images extraites avec IronWord ?

Les images extraites à l'aide d'IronWord conservent leur format d'origine, tel que .jpg, .png ou autres formats, et peuvent être enregistrées avec les extensions de fichier appropriées.

Est-il possible d'extraire des images de sections spécifiques d'un document Word à l'aide d'IronWord ?

Oui, avec IronWord, vous pouvez parcourir toutes les images du document ou cibler des sections spécifiques en fonction de vos besoins lors du processus d'extraction.

Ai-je besoin de connaissances en programmation pour utiliser IronWord afin d'extraire des images ?

Des connaissances de base en programmation, notamment en C#, sont nécessaires pour implémenter le code d'extraction d'images à l'aide d'IronWord, car cela implique l'utilisation de méthodes telles que ExtractImages().

Quel est l'exemple de fichier utilisé pour illustrer l'extraction d'images dans IronWord ?

Un fichier d'exemple nommé « embedded_images.docx », qui comprend 5 images sur 3 pages différentes, est utilisé pour illustrer le processus d'extraction d'images dans IronWord.

Ahmad Sohail
Développeur Full Stack

Ahmad est un développeur full-stack avec une solide fondation en C#, Python et technologies web. Il a un profond intérêt pour la construction de solutions logicielles évolutives et aime explorer comment le design et la fonctionnalité se rencontrent dans des applications du monde réel.

<...
Lire la suite
Prêt à commencer?
Nuget Téléchargements 25,807 | Version : 2025.11 vient de sortir