使用 C# / IronWord 从 DOCX 中提取图片

This article was translated from English: Does it need improvement?
Translated
View the article in English

从 Word 文档中提取图像是内容迁移、媒体管理和程序化文档处理的常见要求。 IronWord 可以方便地访问嵌入式图片,然后通过尺寸和格式等属性保存、重复使用或分析这些图片。

ExtractImages()函数提供了一种从文档中检索所有图像并访问其元数据以进行进一步处理的有效方法。

开始使用 IronWord

今天在您的项目中使用 IronWord,免费试用。

第一步:
green arrow pointer


提取图像示例

使用 IronWord 从 Word 文档中提取图像非常简单。 文件"embedded_images.docx"将用作示例文件,其中包含 3 个不同页面上的 5 张图片。 代码片段使用 ExtractImages() 方法定义了图像提取过程的核心工作流程。

:path=/static-assets/word/content-code-examples/how-to/extract-images-properties.cs
using IronWord;

// Load an existing Word document
WordDocument doc = new WordDocument("embedded_images.docx");

// Extract all images from the document
var images = doc.ExtractImages();

// Iterate through extracted images
int count = 0;
foreach (var image in images)
{
    // Save each image to disk
    string fileName = $"extracted-image-{count}.png";
    image.SaveAs(fileName);

    Console.WriteLine($"Extracted image {count}:");
    Console.WriteLine($"Width: {image.Width}");
    Console.WriteLine($"Height: {image.Height}");
    Console.WriteLine($"Saved as: {fileName}");

    count++;
}

Console.WriteLine($"Total images extracted: {count}");
IRON VB CONVERTER ERROR developers@ironsoftware.com
$vbLabelText   $csharpLabel

示例文件(embedded_images.docx)

从 DOCX 文件中提取图像

输出

萃取输出

提取的图像保留其原始格式(例如 .jpg、.png),并且可以保存为正确的文件扩展名。 图像迭代可以涵盖整个文档,也可以专注于特定部分,这取决于实体级需求,例如个人或企业用例。

常见问题解答

IronWord 中 ExtractImages() 函数的主要功能是什么?

IronWord 中的 ExtractImages() 函数提供了一种简单高效的方法,可以从 Word 文档中检索所有图像并访问其元数据以进行进一步处理。

如何使用 IronWord 从 DOCX 文件中提取图像?

要开始使用 IronWord 从 DOCX 文件中提取图像,请下载 IronWord 库,加载 Word 文档,使用 ExtractImages() 方法提取图像,并将其保存到磁盘以供进一步使用。

IronWord能否在提取过程中处理图像元数据?

是的,IronWord 允许您在提取过程中访问图像元数据,例如尺寸和格式,这对于进一步的分析或处理非常有用。

IronWord支持提取图像的文件格式有哪些?

使用 IronWord 提取的图像保留其原始格式,例如 .jpg、.png 或其他格式,并可以保存为适当的文件扩展名。

是否可以使用 IronWord 从 Word 文档的特定部分提取图像?

是的,使用 IronWord,您可以在提取过程中遍历文档中的所有图像,或根据您的要求定位到特定部分。

我需要具备编程知识才能使用 IronWord 提取图像吗?

要使用 IronWord 实现图像提取代码,需要具备基本的编程知识,特别是 C# 编程知识,因为它涉及到使用 ExtractImages() 等方法。

IronWord中用于演示图像提取的示例文件是什么?

一个名为“embedded_images.docx”的示例文件(包含 3 个不同页面上的 5 张图片)用于演示 IronWord 中的图像提取过程。

Ahmad Sohail
全栈开发者

Ahmad 是一名全栈开发人员,拥有扎实的 C#、Python 和 Web 技术基础。他对构建可扩展的软件解决方案深感兴趣,并喜欢探索设计和功能在实际应用中如何结合。

在加入 Iron Software 团队之前,Ahmad 致力于自动化项目和 API 集成,专注于提高性能和开发人员体验。

在业余时间,他喜欢尝试 UI/UX 想法,贡献开源工具,并偶尔从事技术写作和文档工作,以便让复杂主题更易于理解。

准备开始了吗?
Nuget 下载 27,129 | Version: 2025.11 刚刚发布