Comment lire un document Word avec formatage en C#

Publié février 22, 2024

Les documents Microsoft Word contiennent souvent un formatage riche tel que des polices, des styles et divers éléments qui les rendent visuellement attrayants. IronWord est une puissante bibliothèque deIron Software qui dispose d'une API intuitive pour les documents Word et Docx en C# et VB.NET. Il n'est pas nécessaire d'installer Microsoft Office ou Word Interop pour créer, modifier et exporter des documents Word. IronWord est entièrement compatible avec .NET 8, 7, 6, Framework, Core et Azure. Cela signifie que la bibliothèque ne nécessite pas que Word soit installé sur la machine et qu'elle lit les fichiers de manière indépendante. Si vous travaillez avec C# et que vous avez besoin de lire des documents Word tout en préservant leur formatage, ce tutoriel vous guidera tout au long du processus à l'aide de la fonctionIronWord bibliothèque.

Comment (en C# ;) lire un document Word avec formatage

  1. Installer la bibliothèque IronWord pour lire les documents Word.

  2. Chargez 'sample.docx', le document Word d'entrée en utilisant la classe WordDocument de la bibliothèque IronWord.

  3. Lisez les paragraphes avec formatage en utilisant un document Word chargé.

  4. Afficher les données extraites avec les informations de format dans la sortie de la console.

Conditions préalables

  1. Visual Studio: Assurez-vous que Visual Studio ou tout autre environnement de développement C# est installé.

  2. NuGet Package Manager: Assurez-vous que vous pouvez utiliser NuGet pour gérer les paquets dans votre projet

Étape 1 : Créer un nouveau projet C

Créez une nouvelle application console C# ou utilisez un projet existant dans lequel vous souhaitez lire des documents Word.

Sélectionnez le modèle d'application de la console et cliquez sur suivant.

Comment lire un document Word avec formatage en C# : Figure 1 - Création d'un nouveau projet C#

Cliquez sur le bouton "Suivant" pour indiquer le nom de la solution, le nom du projet et le chemin d'accès au code.

Comment lire un document Word avec formatage en C# : Figure 2 - Configuration du nouveau projet

Sélectionnez ensuite la version .NET souhaitée. La meilleure pratique consiste toujours à choisir la dernière version disponible, mais si votre projet a des exigences spécifiques, utilisez la version .NET nécessaire.

Comment lire un document Word avec formatage en C# : Figure 3 - Choix du type de version .NET nécessaire

Étape 2 : Installation de la bibliothèque IronWord

Ouvrez votre projet C# et installez la bibliothèque IronWord à l'aide de la console du gestionnaire de paquets NuGet :

Install-Package IronWord

Le paquet NuGet peut également être installé à l'aide du gestionnaire de paquets NuGet de Visual Studio, comme indiqué ci-dessous.

Comment lire un document Word avec formatage en C# : Figure 4 - Installation d'IronWord via le gestionnaire de paquets NuGet

Étape 3 : Lire le document Word avec formatage

Pour lire un fichier Word, nous devons tout d'abord créer un nouveau document et y ajouter du contenu, comme indiqué ci-dessous.

Comment lire un document Word avec formatage en C# : Figure 5 - Exemple de document créé

Enregistrez maintenant le fichier dans le répertoire du projet et modifiez les propriétés du fichier pour le copier dans le répertoire de sortie

Comment lire un document Word avec formatage en C# : Figure 6 - A quoi devraient ressembler les propriétés du fichier

Ajoutez maintenant l'extrait de code suivant au fichier program.cs

using IronWord;
class Program
    static void Main()
            // Load existing docx
            var sampleDoc = new WordDocument("sample.docx");
            var paragraphs = sampleDoc.Paragraphs;
            foreach (var paragraph in paragraphs)
                var textRun = paragraph.FirstTextRun;
                var text = textRun.Text; // read the text
                // Extract Formatting details
                if (textRun.Style != null)
                    var fontSize = textRun.Style.FontSize; // font size
                    var isBold = textRun.Style.IsBold;
                    Console.WriteLine($"\tText: {text}, FontSize: {fontSize}, Bold: {isBold}");
                    // Print text without formatting details
                    Console.WriteLine($"\tText: {text}");
        catch (Exception ex)
            Console.WriteLine($"An error occurred: {ex.Message}");
VB   C#

Le code ci-dessus lit le document Word en utilisant la méthode du constructeur de la classe WordDocument de la bibliothèque IronWord


Comment lire un document Word avec formatage en C# : Figure 7 - Sortie console du code précédent


  1. Ouvrir le document Word : Chargez le document Word en utilisant WordDocument d'IronWord.

  2. Itérer à travers les paragraphes et les séries : Utilisez des boucles imbriquées pour parcourir les paragraphes et les séries. Les séries représentent des portions de texte avec une mise en forme spécifique.

  3. Extraire le texte et le formatage : Extraire le contenu textuel de chaque exécution et vérifier les propriétés de formatage. Dans cet exemple, nous avons montré comment extraire la taille de la police et le formatage en gras.

  4. Gérer les exceptions : Un bloc "try-and-catch" est utilisé pour gérer les exceptions et les imprimer.

    Le fichier chargé peut être utilisé pour imprimer des documents, nous pouvons également modifier la couleur de la police dans l'objet style.

Lire des tableaux à partir de fichiers Word

Nous pouvons également lire des tableaux à partir de documents Word. Ajoutez l'extrait de code ci-dessous au programme.

using IronWord;
class Program
    static void Main()
            // Load existing docx
            var sampleDoc = new WordDocument("sample.docx");
            var paragraphs = sampleDoc.Paragraphs;
            // Read Tables
            var tables = sampleDoc.Tables;
            foreach (var table in tables)
                var rows = table.Rows;
                foreach (var row in rows)
                    foreach (var cell in row.Cells)
                        var contents = cell.Contents;
                        contents.ForEach(x => Console.WriteLine(x)); 
                        // print cell contents
        catch (Exception ex)
            Console.WriteLine($"An error occurred: {ex.Message}");
VB   C#

Ici, nous utilisons la méthode get/set Tables de la classe WordDocument pour récupérer toutes les tables du document, les parcourir et en imprimer le contenu.

Ajouter un style à un texte existant

Nous pouvons ajouter de nouvelles informations de style à un document Word existant à l'aide de la bibliothèque IronWord, comme le montre l'extrait de code ci-dessous.

using IronWord;
using IronWord.Models;
class Program
    static void Main()
            // Load existing docx
            var sampleDoc = new WordDocument("sample.docx");
            var paragraphs = sampleDoc.Paragraphs;
            foreach (var paragraph in paragraphs)
                var textRun = paragraph.FirstTextRun;
                var text = textRun.Text; // read the text
                // Extract Formatting details
                if (textRun.Style != null)
                    var fontSize = textRun.Style.FontSize; // font size
                    var isBold = textRun.Style.IsBold;
                    Console.WriteLine($"\tText: {text}, FontSize: {fontSize}, Bold: {isBold}");
                    // Print text without formatting details
                    Console.WriteLine($"\tText: {text}");
            //Change the formating of the text
            var style = new TextStyle()
                FontFamily = "Caveat",
                FontSize = 72,
                TextColor = new IronColor(Color.Blue), // blue color
                IsBold = true,
                IsItalic = true,
                IsUnderline = true,
                IsSuperscript = false,
                IsStrikethrough = true,
                IsSubscript = false
            paragraphs [1].FirstTextRun.Style = style;
        catch (Exception ex)
            Console.WriteLine($"An error occurred: {ex.Message}");
VB   C#

Ici, nous créons un TextStyle et l'ajoutons à l'objet paragraphe existant

Ajout d'un nouveau contenu stylé au document Word

Nous pouvons ajouter un nouveau contenu à un document Word chargé, comme le montre l'extrait de code ci-dessous.

using IronWord;
using IronWord.Models;
class Program
    static void Main()
            // Load Word Document
            var sampleDoc = new WordDocument("sample.docx");
            var paragraphs = sampleDoc.Paragraphs;
            foreach (var paragraph in paragraphs)
                var textRun = paragraph.FirstTextRun;
                var text = textRun.Text; // read the text
                // Extract the formatting details
                if (textRun.Style != null)
                    var fontSize = textRun.Style.FontSize; // font size
                    var isBold = textRun.Style.IsBold;
                    Console.WriteLine($"\tText: {text}, FontSize: {fontSize}, Bold: {isBold}");
                    // Print text without formatting details
                    Console.WriteLine($"\tText: {text}");
            // Add TextRun with Style to Paragraph
            TextRun blueTextRun = new TextRun();
            blueTextRun.Text = "Add text using IronWord";
            blueTextRun.Style = new TextStyle()
                FontFamily = "Caveat",
                FontSize = 72,
                TextColor = new IronColor(Color.Blue), // blue color
                IsBold = true,
                IsItalic = true,
                IsUnderline = true,
                IsSuperscript = false,
                IsStrikethrough = true,
                IsSubscript = false
            paragraphs [1].AddTextRun(blueTextRun); 
            // Add New Content to the Word file and save
            Paragraph newParagraph = new Paragraph();
            TextRun newTextRun = new TextRun("New Add Information");
            // Configure the text
            TextRun introText = new TextRun("This is an example newParagraph with italic and bold styling.");
            TextStyle italicStyle = new TextStyle()
                IsItalic = true
            TextRun italicText = new TextRun("Italic example sentence.", italicStyle);
            TextStyle boldStyle = new TextStyle()
                IsBold = true
            TextRun boldText = new TextRun("Bold example sentence.", boldStyle);
            // Add the text
        catch (Exception ex)
            Console.WriteLine($"An error occurred: {ex.Message}");
VB   C#

Ici, nous créons de nouveaux objets TextRun et Paragraphe avec des informations de style et nous les ajoutons au document Word chargé.

Licence (essai gratuit disponible)

IronWord. Cette clé doit être placée dans appsettings.json.


Indiquez votre adresse électronique pour obtenir une licence d'essai. Une fois que vous avez indiqué votre adresse électronique, la clé vous sera envoyée par courrier électronique.

Comment lire un document Word avec formatage en C# : Figure 8 - Formulaire d'essai soumis avec succès


IronWord offre un moyen pratique de lire des documents Word avec formatage en C#. Étendez le code fourni en fonction de vos besoins spécifiques et de la complexité des documents avec lesquels vous travaillez. Ce tutoriel sert de point de départ à l'intégration de l'applicationIronWord dans vos applications C# pour le traitement des documents Word.

