Passer au contenu du pied de page

Prétraitement

Améliorez l'entrée à partir de scans et de photos de mauvaise qualité. Utilisez nos filtres de prétraitement pour nettoyer, redresser et améliorer les images difficiles pour une précision OCR maximale.

Icon Main related to Prétraitement
Filtres de correction des couleurs d'entrée

1

Binarisé

Binarisez facilement vos entrées directement dans IronOCR, en transformant les images en versions noir et blanc nettes. Ce filtre isole efficacement le texte des arrière-plans complexes, en réduisant le bruit et en rendant l'extraction de texte plus facile et plus fiable.

Apprenez à :Fixer les couleurs des images pour la lecture en .NET C#
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");

// Apply binarize affect
imageInput.Binarize();

// Export the modified image
imageInput.SaveAsImages("binarize.jpg");
C#
2

Grayscale

Convertir une image couleur en niveaux de gris - une étape cruciale dans la préparation des images pour des filtres de prétraitement plus avancés.

Apprenez à :Fixer les couleurs des images pour la lecture en .NET C#
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");

// Apply grayscale affect
imageInput.ToGrayScale();

// Export the modified image
imageInput.SaveAsImages("grayscale.jpg");
C#
3

Modifier les couleurs des pixels

Remplacer des gammes de couleurs spécifiques dans une image, ce qui permet de supprimer les filigranes, les arrière-plans colorés ou d'autres éléments gênants avant l'OCR.

Apprenez à :Fixer les couleurs des images pour la lecture en .NET C#
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");
IronSoftware.Drawing.Color currentColor = new IronSoftware.Drawing.Color("#DB645C");
IronSoftware.Drawing.Color newColor = IronSoftware.Drawing.Color.DarkCyan;

// Replace color
imageInput.ReplaceColor(currentColor, newColor, 80);

// Export the modified image
imageInput.SaveAsImages("replaceColor");
C#

Icon Main related to Prétraitement
Opérations morphologiques en entrée

1

Dilates

La traduction doit rester professionnelle et préserver la précision technique tout en expliquant les caractéristiques et les avantages de ces outils de développement.

Apprenez à :Corriger l'image à l'aide de filtres de lecture
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");

// Apply Dilate filter
imageInput.Dilate();

// Export filtered image
imageInput.SaveAsImages("dilate.jpg");
C#
2

Erodes

La traduction doit rester professionnelle et préserver la précision technique tout en expliquant les caractéristiques et les avantages de ces outils de développement.

Apprenez à :Corriger l'image à l'aide de filtres de lecture
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");

// Apply Erode filter
imageInput.Erode();

// Export filtered image
imageInput.SaveAsImages("erode.jpg");
C#
3

Modifier les couleurs des pixels

Remplacer des gammes de couleurs spécifiques dans une image, ce qui permet de supprimer les filigranes, les arrière-plans colorés ou d'autres éléments gênants avant l'OCR.

Apprenez à :Fixer les couleurs des images pour la lecture en .NET C#
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");
IronSoftware.Drawing.Color currentColor = new IronSoftware.Drawing.Color("#DB645C");
IronSoftware.Drawing.Color newColor = IronSoftware.Drawing.Color.DarkCyan;

// Replace color
imageInput.ReplaceColor(currentColor, newColor, 80);

// Export the modified image
imageInput.SaveAsImages("replaceColor");
C#

Icon Main related to Prétraitement
Manipulation de l'orientation des entrées

1

Deskew

Détecter et redresser automatiquement les images de travers ou inclinées, ce qui améliore considérablement la précision de l'OCR sur les scans imparfaits.

Apprenez à :Fixer l'orientation de l'image pour la lecture en .NET C#
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("paragraph_skewed.png");

// Apply Deskew filter
imageInput.Deskew();
C#
2

Rotation

Faire pivoter les images de manière programmée afin de s'assurer que le texte est correctement orienté pour le moteur d'OCR.

Apprenez à :Fixer l'orientation de l'image pour la lecture en .NET C#
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("paragraph_skewed.png");

// Rotate the image 180 degrees clockwise
imageInput.Rotate(180);

// Export the modified image
imageInput.SaveAsImages("rotate");
C#
3

Détecter l'orientation

Détermine automatiquement l'orientation de la page (0, 90, 180, 270 degrés), ce qui est utile pour la correction de l'orientation avant l'OCR. Garantit une grande précision même lorsque les documents sont numérisés à l'envers.

Apprenez à :Détecter la rotation de la page
using IronOcr;

using var input = new OcrInput();

// Load PDF document
input.LoadPdf("Clockwise90.pdf");

// Detect page rotation
var results = input.DetectPageOrientation();

// Ouput result
foreach(var result in results)
{
    Console.WriteLine(result.PageNumber);
    Console.WriteLine(result.HighConfidence);
    Console.WriteLine(result.RotationAngle);
}
C#

Icon Main related to Prétraitement
Contrôle de la résolution d'entrée

1

Échelle

Redimensionner une image à une résolution optimale pour l'OCR, ce qui améliore considérablement la précision sur les fichiers sources à faible résolution.

Apprenez à :Fixer l'orientation de l'image pour la lecture en .NET C#
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("paragraph_skewed.png");

// Apply scale
imageInput.Scale(70);

// Export the modified image
imageInput.SaveAsImages("rotate");
C#
2

Paramètres DPI

Définir manuellement le nombre de points par pouce (DPI) pour les images à faible résolution ou les scans pour lesquels il manque des métadonnées. L'indication d'une valeur de DPI guide le moteur d'OCR et améliore considérablement la qualité de la reconnaissance.

Apprenez à :C# Tesseract Image DPI
using IronOcr;
using System;

var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
ocrInput.TargetDPI = 300;
ocrInput.LoadImage(@"images\image.png");
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
C#
3

Résolution améliorée

Améliorer algorithmiquement la netteté et la clarté des images à faible résolution pour sauver le texte des entrées floues ou pixélisées.

Apprenez à :Corriger l'image à l'aide de filtres de lecture
using IronOcr;

// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();

// Add image
using var imageInput = new OcrImageInput("sample.jpg");

// Apply enhance resolution filter
imageInput.EnhanceResolution();

// Export filtered image
imageInput.SaveAsImages("sharpen.jpg");
C#
4

Assistant de filtre

Appliquez une chaîne de filtres de prétraitement à l'aide d'une méthode unique et intelligente. L'assistant de filtrage analyse automatiquement l'image d'entrée et applique une séquence optimale de corrections pour obtenir les meilleurs résultats possibles en matière d'OCR.

Apprenez à :Assistant de filtre
using IronOcr;

var ocrTesseract = new IronTesseract();

// WIZARD - If you are unsure which filters to use,
// use the debug-wizard to test all combinations:
string codeToRun = OcrInputFilterWizard.Run(@"images\image.png", out double confidence, ocrTesseract);
Console.WriteLine($"Confidence: {confidence}");
Console.WriteLine(codeToRun);
C#
5

OCR d'une région d'une image

Gagnez du temps en ciblant uniquement la zone spécifique d'une image qui contient du texte. Il suffit de définir une région rectangulaire pour isoler et extraire le texte des formulaires, des tableaux ou des arrière-plans encombrés.

Apprenez à :Tesseract OCR Specifc Area of an Image in C#
using IronOcr;
using IronSoftware.Drawing;

var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
var ContentArea = new Rectangle(x: 215, y: 1250, width: 1335, height: 280);
ocrInput.LoadImage("img/example.png", ContentArea);
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
C#
Prêt à commencer?
Nuget Téléchargements 5,167,857 | Version: 2025.11 vient de sortir