How to set DPI Setting in OCR

This article was translated from English: Does it need improvement?
Translated
View the article in English

Dots Per Inch (DPI) ist ein grundlegendes Maß für die Bildqualität, das den Detaillierungsgrad eines gescannten Dokuments oder digitalen Fotos bestimmt. Obwohl das Scannen von Dokumenten eine schnelle und effiziente Methode zur Digitalisierung physischer Akten ist, kann der Prozess oft zu Dateien mit niedriger Auflösung führen, insbesondere bei Verwendung von Standard- oder "Schnellscan"-Einstellungen. Dieser Mangel an Details lässt den Text verschwommen oder pixelig erscheinen, und stellt ein erhebliches Hindernis für die Datenerfassung dar.

Hier wird die OCR-Leistung direkt beeinträchtigt. OCR-Engines funktionieren, indem sie die genauen Formen und Muster von Zeichen analysieren, um sie in maschinenlesbaren Text umzuwandeln. Wenn ein Bild eine niedrige DPI hat, gibt es nicht genug Pixel, um jeden Buchstaben klar zu definieren, was dazu führt, dass feine Details verloren gehen und zu ungenauen Ergebnissen führen.

IronOCR ist jedoch darauf ausgelegt, diese häufigen Herausforderungen zu überwinden. Es wurde fein abgestimmt, um eine hohe Genauigkeit bei Scans mit einer Auflösung von nur 225 DPI zu erreichen.

als-Überschrift:2(Schnellstart: TargetDPI für schärfere OCR-Ergebnisse einstellen)

In einer einfachen Zeile können Sie IronOCR so konfigurieren, dass niedrige Auflösungen hochskaliert werden – die Textklarheit und -erkennung ist mit minimalem Aufwand verbessert. Entwickler können sofort mit dem sauberen API von IronOCR beginnen.

Nuget IconGet started making PDFs with NuGet now:

  1. Install IronOCR with NuGet Package Manager

    PM > Install-Package IronOcr

  2. Copy and run this code snippet.

    var result = new IronOcr.IronTesseract().Read(new IronOcr.OcrInput { TargetDPI = 300 }.LoadImage("low-res.png"));
  3. Deploy to test on your live environment

    Start using IronOCR in your project today with a free trial
    arrow pointer
class="hsg-featured-snippet">

Minimaler Workflow (5 Schritte)

  1. Laden Sie eine C#-Bibliothek herunter, um die DPI-Einstellungen für OCR festzulegen
  2. Erstellen Sie eine neue OcrInput
  3. Stellen Sie den TargetDPI ein, um Ihren Anforderungen zu entsprechen
  4. Laden Sie das gewünschte Bild
  5. Lesen und extrahieren Sie Daten aus dem Bild mit Read

DPI-Einstellung Beispiel

Dieses Beispiel verwendet ein Beispielbild mit einer niedrigen Auflösung von etwa 100 DPI und fügt künstliches Rauschen hinzu, um die Wirksamkeit des TargetDPI-Features zu demonstrieren.

Der tatsächliche Text im Bild lautet: "Testing testing testing verschwommener Text Beispiel Beispiel Beispiel".

class="content-img-align-center">
class="center-image-wrapper"> Verschwommenes Textbild

Codebeispiel

In diesem Beispiel stellen wir den TargetDPI auf 300 ein, um die Bildauflösung auf 300 DPI hochzuskalieren. Anschließend laden wir das Eingabebild von oben und drucken den extrahierten Test mit Text und das Vertrauensniveau mit Confidence aus.

:path=/static-assets/ocr/content-code-examples/how-to/dpi-setting.cs
using IronOcr;
using System;

var ocrTesseract = new IronTesseract();

using var ocrInput = new OcrInput();
// Set the target DPI to 300 for better OCR accuracy
ocrInput.TargetDPI = 300;

ocrInput.LoadImage(@"images\image.png");

// Perform OCR on the image with the specified DPI
var ocrResult = ocrTesseract.Read(ocrInput);
// Display the text extracted from the image
Console.WriteLine(ocrResult.Text);
// Display the confidence level of the OCR result
Console.WriteLine(ocrResult.Confidence);
IRON VB CONVERTER ERROR developers@ironsoftware.com
$vbLabelText   $csharpLabel

Ausgabe

class="content-img-align-center">
class="center-image-wrapper"> Textausgabe

Wie die Ausgabe zeigt, erreicht IronOCR eine Konfidenzbewertung von 85%. Trotz des signifikanten Rauschens und der geringen anfänglichen DPI des Quellbildes ist das Ergebnis außergewöhnlich genau und zeigt die Leistung der Hochskalierungsfunktion.

IronOCR enthält integrierte Funktionen, die automatisch Bilder mit niedriger Auflösung verbessern, indem sie sie hochskalieren, alles innerhalb einer einzigen Bibliothek.

DPI-Einstellung Vergleich

Um den Unterschied zu veranschaulichen, hier das Ergebnis des Verarbeitens des gleichen Bildes mit niedriger Auflösung ohne Einstellen der TargetDPI-Eigenschaft.

Das richtige DPI zu finden ist eine Balance. Hohe DPI sind genauer, aber langsamer; niedrige DPI sind schneller, aber weniger zuverlässig. Im Zweifelsfall lassen Sie die automatische Vorverarbeitung von Iron Tesseract die optimalen Einstellungen bestimmen. Sie können auch das automatische Upscaling deaktivieren, indem Sie die TargetDPI Eigenschaft auf 0 setzen.

Ausgabe

class="content-img-align-center">
class="center-image-wrapper"> Textausgabe

Ohne Upscaling sinkt die Konfidenzbewertung auf 79%, und der extrahierte Text ist deutlich weniger genau. Dieser Vergleich zeigt deutlich, wie das Einstellen eines TargetDPI die OCR-Ergebnisse auf qualitativ minderwertigen Bildern dramatisch verbessern kann.

DPI-Einstellung für PDF

Beim Verarbeiten eines PDF skaliert IronOCR das gesamte Dokument auf das Ziel-DPI, nicht nur die darin enthaltenen Bilder.

Während eine höhere DPI oft zu besseren OCR-Ergebnissen führen kann, kann die optimale Einstellung zwischen verschiedenen PDFs erheblich variieren. Angenommen, Sie sind unsicher, welchen Wert Sie verwenden sollen. In diesem Fall ist es am besten, die DPI auf der Standardeinstellung zu belassen und IronOCR die beste Konfiguration für Ihr Dokument automatisch bestimmen zu lassen.

Warnung Der maximale Wert für TargetDPI ist 32.766. Wenn ein höheres DPI als dieses Limit eingestellt wird, tritt eine Ausnahme auf. Dies geschieht, weil die resultierenden Bildabmessungen Tesseracts maximal unterstützte Größe von 32.767 x 32.767 Pixeln überschreiten würden. Wenn das Limit überschritten wird, erhalten Sie folgende Fehlermeldung: 'TargetDPI ist zu hoch und würde zu einem Bild führen, das zu groß ist ({new_width} x {new_height}) für Tesseract. Die maximale Bildgröße für Tesseract ist 32767 x 32767'

Häufig gestellte Fragen

Was ist DPI im Kontext von OCR?

DPI steht für Punkte pro Zoll und misst die Auflösung eines Bildes. In der OCR kann die Einstellung des geeigneten DPI die Genauigkeit der Texterkennung verbessern, insbesondere bei niedrig aufgelösten Bildern.

Wie beeinflusst die DPI-Einstellung die OCR-Genauigkeit in IronOCR?

Die richtige DPI-Einstellung in IronOCR kann die Genauigkeit der Texterkennung erheblich verbessern, indem klarere Bildeingaben bereitgestellt werden, was die Fehlerquote bei der Identifizierung von Zeichen reduziert, insbesondere bei niedrig aufgelösten Bildern.

Was sind die empfohlenen DPI-Einstellungen für optimale OCR-Ergebnisse?

Für optimale OCR-Ergebnisse wird empfohlen, Bilder mit einer DPI von mindestens 300 zu verwenden. IronOCR bietet jedoch Funktionen zum Hochskalieren von Bildern, wodurch eine effektive OCR auf Bildern mit niedrigerer DPI ermöglicht wird.

Kann ich in IronOCR niedrig aufgelöste Bilder hochskalieren, um bessere Ergebnisse zu erzielen?

Ja, IronOCR bietet eine Funktion zur Bildhochskalierung, die die Auflösung von minderwertigen Bildern verbessern kann, wodurch die OCR-Genauigkeit erhöht wird.

Unterstützt IronOCR die automatische DPI-Anpassung?

IronOCR ermöglicht anpassbare DPI-Einstellungen, die automatische Anpassungen zur Optimierung der OCR-Leistung basierend auf der Bildqualität der Eingabe erlauben.

Wie stelle ich DPI in IronOCR mit C# ein?

Sie können die DPI in IronOCR einstellen, indem Sie den gewünschten DPI-Wert in Ihrem C#-Code angeben. Die Dokumentation enthält Codebeispiele, die Sie durch diesen Prozess führen.

Curtis Chau
Technischer Autor

Curtis Chau hat einen Bachelor-Abschluss in Informatik von der Carleton University und ist spezialisiert auf Frontend-Entwicklung mit Expertise in Node.js, TypeScript, JavaScript und React. Leidenschaftlich widmet er sich der Erstellung intuitiver und ästhetisch ansprechender Benutzerschnittstellen und arbeitet gerne mit modernen Frameworks sowie der Erstellung gut strukturierter, optisch ansprechender ...

Weiterlesen
Bereit anzufangen?
Nuget Downloads 5,044,537 | Version: 2025.11 gerade veröffentlicht