NOUVELLES DE L'ACADéMIE

Rejoignez l'Iron Academy

Mis à jour:28 juin 2026

Si vous construisez des applications .NET qui traitent de grands volumes de données, de documents, de catalogues de produits, de dossiers clients ou de fichiers scannés, la recherche est toujours un défi. La recherche par mots-clés manque de contexte. La recherche en texte intégral a ses limites. Mais la recherche vectorielle change complètement l'équation.

Nous avons récemment découvert un excellent guide par Milan Jovanović, l'une des voix les plus respectées dans la communauté .NET et un MVP Microsoft, qui explique exactement comment implémenter la recherche vectorielle en .NET à l'aide de PgVector, une extension PostgreSQL qui apporte des capacités de recherche sémantique directement dans votre base de données existante.

Qu'est-ce que la recherche vectorielle et comment fonctionne-t-elle ?

La recherche traditionnelle correspond à des mots ou des phrases exacts. Si un utilisateur recherche "facture en retard", une recherche par mot-clé ne trouvera que des documents contenant exactement ces mots. Elle ne fera pas apparaître un document qui dit "paiement en attente" ou "solde dû", même s'ils signifient la même chose.

La recherche vectorielle fonctionne différemment. Au lieu de faire correspondre des mots, elle fait correspondre le sens.

Voici comment le pipeline fonctionne en pratique :

Premièrement, le texte est converti en une représentation numérique appelée un embedding, un tableau de grande dimension de nombres flottants qui capture la signification sémantique du contenu. Par exemple, les phrases "facture en retard" et "paiement en attente" produiraient des embeddings mathématiquement proches les uns des autres dans l'espace vectoriel, même s'ils ne partagent pas de mots communs.

Ces embeddings sont générés par un modèle d'apprentissage automatique, généralement via une API comme les modèles d'embeddings textuels d'OpenAI et stockés avec vos données dans la base de données.

Lorsqu'un utilisateur exécute une requête de recherche, cette requête est également convertie en un embedding à l'aide du même modèle. La base de données calcule ensuite la distance entre l'embedding de la requête et chaque embedding stocké, retournant les résultats les plus proches dans l'espace vectoriel, c'est-à-dire les plus similaires sémantiquement, pas seulement ceux qui correspondent aux mots-clés.

PgVector permet cela directement à l'intérieur de PostgreSQL, en prenant en charge les recherches de similarité efficaces juste à côté de vos données relationnelles, sans nécessiter une base de données vectorielle dédiée.

Initialisation de la base de données

Avant de stocker les vecteurs, activez l'extension PgVector et configurez la table.


var builder = DistributedApplication.CreateBuilder(args);

var ollama = builder.AddOllama("ollama")
    .WithLifetime(ContainerLifetime.Persistent)
    .WithDataVolume()
    .WithGPUSupport();

var embeddingModel = ollama.AddModel("qwen3-embedding:0.6b");

var postgres = builder.AddPostgres("postgres", port: 6432)
    .WithLifetime(ContainerLifetime.Persistent)
    .WithDataVolume()
    .WithImage("pgvector/pgvector", "pg17")
    .AddDatabase("articles");

builder.AddProject<Projects.PgVector_Articles>("pgvector-articles")
    .WithReference(embeddingModel)
    .WithReference(postgres)
    .WaitFor(embeddingModel)
    .WaitFor(postgres);

builder.Build().Run();


var builder = DistributedApplication.CreateBuilder(args);

var ollama = builder.AddOllama("ollama")
    .WithLifetime(ContainerLifetime.Persistent)
    .WithDataVolume()
    .WithGPUSupport();

var embeddingModel = ollama.AddModel("qwen3-embedding:0.6b");

var postgres = builder.AddPostgres("postgres", port: 6432)
    .WithLifetime(ContainerLifetime.Persistent)
    .WithDataVolume()
    .WithImage("pgvector/pgvector", "pg17")
    .AddDatabase("articles");

builder.AddProject<Projects.PgVector_Articles>("pgvector-articles")
    .WithReference(embeddingModel)
    .WithReference(postgres)
    .WaitFor(embeddingModel)
    .WaitFor(postgres);

builder.Build().Run();

Si vous n'utilisez pas Aspire, vous pouvez exécuter la même image pgvector/pgvector:pg17 via docker-compose et y faire référence avec une chaîne de connexion classique.

Cette section est basée sur l'article original de Milan Jovanović. Des exemples de code complet et des détails de mise en œuvre sont disponibles là.

Pourquoi cela importe pour les clients d'Iron Software

Beaucoup de nos clients utilisent IronPDF, IronOCR, et IronBarcode pour traiter de grands volumes de documents ; factures, rapports, dossiers scannés, étiquettes d'expédition.

Un flux de travail pratique combinant les bibliothèques d'Iron Software avec PgVector pourrait ressembler à ceci :

Extract – Utilisez IronOCR pour extraire du texte des PDF scannés ou des images
Embed – Envoyez le texte extrait à un modèle d'embedding pour générer des représentations vectorielles
Store – Enregistrez les embeddings avec les métadonnées du document dans PostgreSQL en utilisant Pgvector
Search – Interrogez par signification pour retourner les documents les plus pertinents sémantiquement plutôt que par concordance exacte des mots-clés

Le résultat est un système de recherche de documents plus intelligent entièrement construit dans votre infrastructure existante .NET et PostgreSQL, sans infrastructure additionnelle requise.

Ce que couvre le guide de Milan

L'article de Milan explique l'implémentation complète en C#: configurer l'extension PgVector dans PostgreSQL, configurer Entity Framework Core avec Npgsql, générer des embeddings, créer des index vectoriels pour la performance, et exécuter des requêtes de similarité. Il est pratique, orienté production, et immédiatement applicable pour tout développeur .NET.

L'équipe de développement d'Iron Software partage régulièrement des ressources .NET, des tutoriels, et des insights en ingénierie avec notre communauté.

Construire des flux de travail de documents en .NET ? Iron Suite a tout ce dont vous avez besoin.

Sur cette page

Mise en avant du client :

Projecteur sur les Développeurs:

Webinaires:

Rejoignez l'Iron Academy

Qu'est-ce que la recherche vectorielle et comment fonctionne-t-elle ?

Initialisation de la base de données

Pourquoi cela importe pour les clients d'Iron Software

Ce que couvre le guide de Milan

Sur cette page

Votre clé de licence a été livrée dans votre boîte de réception

Votre demande de démo est en cours.

Équipe de soutien Iron

Rejoignez l'Iron Academy

Qu'est-ce que la recherche vectorielle et comment fonctionne-t-elle ?

Initialisation de la base de données

Pourquoi cela importe pour les clients d'Iron Software

Ce que couvre le guide de Milan

Sur cette page

Étape suivante : Commencer l'essai gratuit de 30 jours

Vous voulez déployer IronSuite sur un projet en direct GRATUITEMENT ?

Qu'est-ce qui est inclus ?

Votre clé de licence a été livrée dans votre boîte de réception

Votre demande de démo est en cours.

Équipe de soutien Iron