Bilder aus DOCX mit C# / IronWord extrahieren

This article was translated from English: Does it need improvement?
Translated
View the article in English

Mit der ExtractImages()-Methode von IronWord können Sie programmatisch alle eingebetteten Bilder aus Word-Dokumenten extrahieren und so Zugriff auf Bilddaten und Metadaten wie Abmessungen und Format zum Speichern oder Verarbeiten erhalten.

als-Überschrift:2(Schnellstart: Bilder aus DOCX in C# extrahieren)

```csharp {title="Quick Image Extraction Example"} // IronWord installieren: Installieren-Paket IronWord ironWord verwenden;

// Laden Sie Ihr Word-Dokument WordDocument doc = new WordDocument("document.docx");

// Alle Bilder extrahieren var images = doc.ExtractImages();

// Speichern Sie jedes Bild mit benutzerdefinierter Benennung int imageIndex = 0; foreach (var image in images) { // Speichern im angegebenen Format image.SaveAs($"output-{imageIndex}.png");

// Zugriff auf Bildeigenschaften
Console.WriteLine($"Bild {imageIndex}: {image.Width}x{image.Height}");
imageIndex++;

}


Das Extrahieren von Bildern aus Word-Dokumenten ist eine häufige Anforderung für die Migration von Inhalten, die Medienverwaltung und die programmatische Dokumentenverarbeitung. Ganz gleich, ob Sie ein Content-Management-System aufbauen, Dokumenten-Workflows automatisieren oder digitale Archive erstellen, IronWord vereinfacht den Zugriff auf eingebettete Bilder und ermöglicht es, diese zu speichern, wiederzuverwenden oder durch Eigenschaften wie Abmessungen und Format zu analysieren.

Die Funktion `ExtractImages()` bietet eine einfache und effiziente Möglichkeit, alle Bilder aus einem Dokument abzurufen und auf deren Metadaten zur Weiterverarbeitung zuzugreifen. Diese Methode gibt eine Sammlung von Bildobjekten zurück, die sowohl die Rohbilddaten als auch nützliche Metadateneigenschaften enthalten. Für Entwickler, die mit [PowerPoint-Präsentationen](https://ironsoftware.com/csharp/ppt/examples/create-empty-presentation/) arbeiten, gibt es ähnliche Funktionen in anderen Iron-Bibliotheken, was ein konsistentes API-Design in der gesamten Produktreihe demonstriert.

### Wie fange ich mit IronWord an?

Nutzen Sie IronWord heute kostenlos in Ihrem Projekt.

Erster Schritt:
green arrow pointer
--- <div class="hsg-featured-snippet"> <h2>Wie man Bilder aus DOCX extrahiert</h2> <ol> <li>Download einer C#-Bibliothek zum Extrahieren von Bildern aus DOCX</li> <li>Laden Sie ein vorhandenes Word-Dokument</li> <li>Bildinhalte mit <code>ExtractImages</code> aufrufen und extrahieren</li> <li>Extrahierte Bilder auf der Festplatte speichern</li> <li>Verarbeiten oder exportieren Sie die Bilddateien</li> </ol> </div> ## Wie extrahiere ich Bilder aus einem Word-Dokument? <!-- TODO: Bild hier einfügen --> <!-- ![Diagramm zur Veranschaulichung der Beispielimplementierung von extract images](/static-assets/images/TODO/extract-images-example-code_illustration.webp) --> <!-- Beschreibung: Diagramm oder Screenshot zur Veranschaulichung des Code-Konzepts --> Mit IronWord ist das Extrahieren von Bildern aus einem Word-Dokument unkompliziert. Die Datei `embedded_images.docx` wird als Beispieldatei verwendet, die 5 Bilder auf 3 verschiedenen Seiten enthält. Der nachstehende Codeausschnitt definiert den zentralen Arbeitsablauf für den Bildextraktionsprozess mit der Methode `ExtractImages()`. Bei der Arbeit mit Bibliotheken zur Dokumentenverarbeitung ist es wichtig, die [Lizenzbestimmungen](https://ironsoftware.com/csharp/ppt/licensing/) zu verstehen, um sicherzustellen, dass Ihre Anwendung den Nutzungsbedingungen entspricht. IronWord folgt ähnlichen Lizenzierungsmustern wie andere Iron-Produkte und bietet unbefristete Lizenzen mit umfassenden Support-Optionen. Für den Produktionseinsatz müssen Sie [Lizenzschlüssel](https://ironsoftware.com/csharp/ppt/get-started/license-keys/) anwenden, um Wasserzeichen oder Einschränkungen zu entfernen. ```csharp :path=/static-assets/word/content-code-examples/how-to/extract-images-properties.cs

Die Methode ExtractImages() gibt eine aufzählbare Sammlung von Bildobjekten zurück, die jeweils die vollständigen Bilddaten zusammen mit den Metadaten enthalten. Dieser Ansatz ermöglicht flexible Verarbeitungsabläufe: Sie können Bilder wie oben gezeigt auf der Festplatte speichern, sie in verschiedene Formate konvertieren oder sie direkt in Cloud-Speicherdienste streamen. Die Methode verarbeitet verschiedene Bildformate, die üblicherweise in Word-Dokumente eingebettet sind, darunter JPEG, PNG, BMP und GIF.

Wie sieht das Beispieldokument aus?

Word-Dokument mit eingebetteten Bildern: Google-Logo, Kopfsilhouetten, Galaxieszene, Löwe und Zen-Steine

Welches Ergebnis kann ich erwarten?

Debug-Konsole zeigt 5 extrahierte Bilder mit Abmessungen und Dateinamen extracted-image-0.png bis extracted-image-4.png

Die extrahierten Bilder behalten ihr Originalformat (z. B. .jpg, .png oder andere Formate) und können mit den entsprechenden Dateierweiterungen gespeichert werden. Sie können entweder alle Bilder im Dokument durchlaufen oder gezielt bestimmte Abschnitte auswählen, je nach Ihren Anforderungen.

Fortgeschrittene Szenarien der Bildextraktion

Über die grundlegende Extraktion hinaus unterstützen die Bildbearbeitungsfunktionen von IronWord mehrere fortgeschrittene Szenarien, die Entwicklern in Produktionsanwendungen häufig begegnen:

Batch-Verarbeitung mehrerer Dokumente: Bei der Verarbeitung großer Dokumentensammlungen können Sie eine parallele Verarbeitung implementieren, um Bilder aus mehreren Word-Dateien gleichzeitig zu extrahieren. Dieser Ansatz verkürzt die Bearbeitungszeit für Dokumentenarchive oder Projekte zur Migration von Inhalten erheblich.

Bildformatkonvertierung: Die extrahierten Bildobjekte unterstützen die Konvertierung zwischen Formaten. Sie könnten ein JPEG aus einem Word-Dokument extrahieren und zur Weboptimierung als PNG speichern oder für die Kompatibilität mit modernen Browsern in WebP konvertieren.

Erhalt der Metadaten: Jedes extrahierte Bild enthält wichtige Metadaten wie Abmessungen, Auflösung und Farbtiefe. Diese Informationen erweisen sich als wertvoll bei der Implementierung von Bildoptimierungs-Pipelines oder der Einhaltung von Qualitätsstandards in Ihrer Anwendung.

Für Unternehmensanwendungen, die laufenden Support und regelmäßige Updates erfordern, sollten Sie Lizenzerweiterungen in Betracht ziehen, die kontinuierlichen Zugriff auf neue Funktionen und vorrangigen Support bieten. Wenn sich Ihr Projektumfang erweitert, ermöglichen Upgrade-Optionen eine nahtlose Skalierung, um zusätzliche Entwickler oder Einsatzorte abzudecken.

Integration mit Dokumenten-Workflows

Die Bildextraktion ist oft Teil größerer Arbeitsabläufe in der Dokumentenverarbeitung. Berücksichtigen Sie diese gängigen Integrationsmuster:

Inhaltsverwaltungssysteme: Extrahieren Sie Bilder beim Hochladen von Dokumenten, um Miniaturvorschauen zu erstellen, Bildergalerien zu erstellen oder Mediatheken aufzufüllen. Die extrahierten Bilder können für die Suchfunktionalität indiziert oder mit Dokument-Metadaten versehen werden.

Dokumentenkonvertierungs-Pipelines: Bei der Konvertierung von Word-Dokumenten in andere Formate können die extrahierten Bilder separat verarbeitet werden, um eine optimale Qualität zu erzielen. Diese Trennung ermöglicht eine formatspezifische Optimierung, z. B. die Anwendung unterschiedlicher Komprimierungseinstellungen für Web- und Druckausgabe.

Qualitätssicherungs-Workflows: Die automatisierte Extraktion ermöglicht die systematische Überprüfung eingebetteter Bilder auf die Einhaltung von Markenrichtlinien, Auflösungsanforderungen oder Dateigrößenbeschränkungen. Sie können Dokumente, die niedrig aufgelöste Bilder oder falsche Formate enthalten, vor der Veröffentlichung kennzeichnen.

Um über die neuesten Funktionen und Verbesserungen der Dokumentverarbeitungsfunktionen auf dem Laufenden zu bleiben, sollten Sie regelmäßig das Produktänderungsprotokoll lesen. Neue Versionen enthalten oft Leistungsverbesserungen und erweiterte Formatunterstützung, die Ihren Bildextraktions-Workflows zugute kommen können.

Erwägungen zur Leistung

Wenn Sie mit Dokumenten arbeiten, die zahlreiche oder hochauflösende Bilder enthalten, sollten Sie diese Strategien zur Leistungsoptimierung berücksichtigen:

Speichermanagement: Verarbeiten Sie Bilder in Stapeln, anstatt alle Bilder gleichzeitig in den Speicher zu laden. Dieser Ansatz verhindert die Erschöpfung des Arbeitsspeichers bei großen Dokumenten oder hochauflösenden Bildern.

Asynchrone Verarbeitung: Implementieren Sie async/await-Muster für E/A-Operationen, insbesondere beim Speichern von extrahierten Bildern auf Festplatte oder im Netzwerk. So bleibt Ihre Anwendung auch bei langwierigen Extraktionsvorgängen reaktionsschnell.

Selektive Extraktion: Wenn Sie nur bestimmte Bilder benötigen, sollten Sie Filter auf der Grundlage von Bildeigenschaften oder der Dokumentstruktur implementieren, um die Verarbeitung unnötiger Inhalte zu vermeiden.

Das robuste API-Design sorgt für ein konsistentes Verhalten bei verschiedenen Dokumenttypen und Bildformaten, so dass es einfach ist, zuverlässige Bildextraktionsfunktionen in Ihre .NET-Anwendungen zu integrieren.

Häufig gestellte Fragen

Wie kann ich in C# Bilder aus einer DOCX-Datei extrahieren?

Mit der ExtractImages()-Methode von IronWord können Sie Bilder aus DOCX-Dateien extrahieren. Laden Sie einfach Ihr Word-Dokument mit WordDocument doc = new WordDocument("document.docx") und rufen Sie dann doc.ExtractImages() auf, um alle eingebetteten Bilder zu erhalten. Jedes Bild kann mit der SaveAs()-Methode unter dem von Ihnen gewünschten Format und Dateinamen gespeichert werden.

Auf welche Bildeigenschaften kann ich zugreifen, wenn ich Bilder aus Word-Dokumenten extrahiere?

IronWord ermöglicht den Zugriff auf wichtige Bild-Metadaten, einschließlich der Abmessungen von Breite und Höhe. Die Methode ExtractImages() gibt eine Sammlung von Bildobjekten zurück, die sowohl Rohbilddaten als auch diese Metadateneigenschaften enthalten, so dass Sie Bilder auf der Grundlage ihrer Merkmale programmatisch analysieren oder verarbeiten können.

Kann ich die extrahierten Bilder in verschiedenen Formaten speichern?

Ja, IronWord ermöglicht es Ihnen, extrahierte Bilder in verschiedenen Formaten zu speichern. Verwenden Sie die SaveAs()-Methode für jedes Bildobjekt und geben Sie den gewünschten Dateinamen mit der entsprechenden Erweiterung an (z. B. .png, .jpg). Die Bibliothek führt die Formatkonvertierung automatisch auf der Grundlage der von Ihnen angegebenen Dateierweiterung durch.

Wie installiere ich die Bibliothek zum Extrahieren von Bildern aus Word-Dokumenten?

Installieren Sie IronWord über den NuGet Package Manager mit folgendem Befehl Install-Package IronWord. Fügen Sie nach der Installation "using IronWord;" zu Ihrer C#-Datei hinzu, um auf die Bildextraktionsfunktionalität und andere Dokumentverarbeitungsfunktionen zuzugreifen.

Ist es möglich, Bilder aus mehrseitigen Word-Dokumenten zu extrahieren?

Ja, die Methode ExtractImages() von IronWord extrahiert alle Bilder aus dem gesamten Word-Dokument, unabhängig davon, wie viele Seiten es enthält. Die Methode gibt eine vollständige Sammlung aller eingebetteten Bilder zurück, die sich im gesamten Dokument befinden, unabhängig davon, ob sie auf einer Seite oder über mehrere Seiten verteilt sind.

Ahmad Sohail
Full-Stack-Entwickler

Ahmad ist ein Full-Stack-Entwickler mit einer soliden Grundlage in C#, Python und Webtechnologien. Er hat ein großes Interesse am Aufbau skalierbarer Softwarelösungen und genießt es, zu erkunden, wie Design und Funktionalität in realen Anwendungen aufeinandertreffen.

Bevor er dem Iron Software Team beitrat, arbeitete ...

Weiterlesen
Bereit anzufangen?
Nuget Downloads 28,054 | Version: 2025.12 gerade veröffentlicht