Test in einer Live-Umgebung
Test in der Produktion ohne Wasserzeichen.
Funktioniert überall, wo Sie es brauchen.
using IronOcr;
string imageText = new IronTesseract().Read(@"images\image.png").Text;
Imports IronOcr
Private imageText As String = (New IronTesseract()).Read("images\image.png").Text
<p>IronOCR ist einzigartig in seiner Fähigkeit, automatisch Text aus unvollkommen gescannten Bildern und PDF-Dokumenten zu erkennen und zu lesen. Die Klasse <code>IronTesseract</code> bietet die einfachste API.</p> <p>Probieren Sie andere Code-Beispiele aus, um Ihre C#-OCR-Vorgänge genauestens zu steuern.</p> <p>IronOCR bietet die fortschrittlichste Version von Tesseract, die es gibt, auf jeder Plattform. Mit erhöhter Geschwindigkeit, Genauigkeit und einer nativen DLL und API.</p> <p>Unterstützt Tesseract 3, Tesseract 4 und Tesseract 5 für .NET-Framework, Standard, Core, Xamarin und Mono.</p> <div class="hsg-featured-snippet examples__featured-snippet"> <h2>Wie OCR in VB.NET</h2> <ol> <li><a class="js-modal-open" data-modal-id="trial-license-after-download" href="https://nuget.org/packages/IronOcr/" target="_blank" rel="nofollow noopener noreferrer">Installieren Sie die VB.NET-Bibliothek, um OCR auf Bildern oder PDFs durchzuführen</a></li> <li>Instanziieren Sie <code>EisenTesserakt</code> intuitive APIs zu verwenden</li> <li>Nutzen Sie <code>Lesen Sie</code> methode zur Durchführung von OCR in VB.NET</li> <li>Rufen Sie das OCR-Ergebnis ab, indem Sie darauf zugreifen <code>Text</code> eigenschaft</li> <li>Ausführen von 2, 3 und 4 Aktionen in einer einzigen Codezeile.</li> </ol> </div>
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
ocrTesseract.Language = OcrLanguage.Arabic;
using (var ocrInput = new OcrInput())
{
ocrInput.LoadImage(@"images\arabic.gif");
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
}
// Example with a Custom Trained Font Being used:
var ocrTesseractCustomerLang = new IronTesseract();
ocrTesseractCustomerLang.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata");
ocrTesseractCustomerLang.AddSecondaryLanguage(OcrLanguage.EnglishBest);
using (var ocrInput = new OcrInput())
{
ocrInput.LoadPdf(@"images\mixed-lang.pdf");
var ocrResult = ocrTesseractCustomerLang.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
}
Imports IronOcr
Imports System
Private ocrTesseract = New IronTesseract()
ocrTesseract.Language = OcrLanguage.Arabic
Using ocrInput As New OcrInput()
ocrInput.LoadImage("images\arabic.gif")
Dim ocrResult = ocrTesseract.Read(ocrInput)
Console.WriteLine(ocrResult.Text)
End Using
' Example with a Custom Trained Font Being used:
Dim ocrTesseractCustomerLang = New IronTesseract()
ocrTesseractCustomerLang.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata")
ocrTesseractCustomerLang.AddSecondaryLanguage(OcrLanguage.EnglishBest)
Using ocrInput As New OcrInput()
ocrInput.LoadPdf("images\mixed-lang.pdf")
Dim ocrResult = ocrTesseractCustomerLang.Read(ocrInput)
Console.WriteLine(ocrResult.Text)
End Using
<p>IronOCR unterstützt 125 internationale Sprachen.</p> <p>Abgesehen von Englisch, das standardmäßig installiert ist, können Sprachpakete über NuGet zu Ihrem .NET-Projekt hinzugefügt werden oder als Download von unserer<a href="/csharp/ocr/languages/" target="_blank" rel="nofollow noopener noreferrer">Sprachen Seite</a>.</p> <p>Die meisten Sprachen sind in Schnell, Standard(empfohlen) und beste Qualität. Die beste Methode ist zwar genauer, aber auch langsamer.</p>
using IronOcr;
using IronSoftware.Drawing;
// We can delve deep into OCR results as an object model of
// Pages, Barcodes, Paragraphs, Lines, Words and Characters
// This allows us to explore, export and draw OCR content using other APIs/
var ocrTesseract = new IronTesseract();
ocrTesseract.Configuration.ReadBarCodes = true;
using var ocrInput = new OcrInput();
var pages = new int[] { 1, 2 };
ocrInput.LoadImageFrames("example.tiff", pages);
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
foreach (var page in ocrResult.Pages)
{
// Page object
int PageNumber = page.PageNumber;
string PageText = page.Text;
int PageWordCount = page.WordCount;
// null if we dont set Ocr.Configuration.ReadBarCodes = true;
OcrResult.Barcode[] Barcodes = page.Barcodes;
AnyBitmap PageImage = page.ToBitmap(ocrInput);
double PageWidth = page.Width;
double PageHeight = page.Height;
double PageRotation = page.Rotation; // angular correction in degrees from OcrInput.Deskew()
foreach (var paragraph in page.Paragraphs)
{
// Pages -> Paragraphs
int ParagraphNumber = paragraph.ParagraphNumber;
string ParagraphText = paragraph.Text;
AnyBitmap ParagraphImage = paragraph.ToBitmap(ocrInput);
int ParagraphX_location = paragraph.X;
int ParagraphY_location = paragraph.Y;
int ParagraphWidth = paragraph.Width;
int ParagraphHeight = paragraph.Height;
double ParagraphOcrAccuracy = paragraph.Confidence;
OcrResult.TextFlow paragrapthText_direction = paragraph.TextDirection;
foreach (var line in paragraph.Lines)
{
// Pages -> Paragraphs -> Lines
int LineNumber = line.LineNumber;
string LineText = line.Text;
AnyBitmap LineImage = line.ToBitmap(ocrInput);
int LineX_location = line.X;
int LineY_location = line.Y;
int LineWidth = line.Width;
int LineHeight = line.Height;
double LineOcrAccuracy = line.Confidence;
double LineSkew = line.BaselineAngle;
double LineOffset = line.BaselineOffset;
foreach (var word in line.Words)
{
// Pages -> Paragraphs -> Lines -> Words
int WordNumber = word.WordNumber;
string WordText = word.Text;
AnyBitmap WordImage = word.ToBitmap(ocrInput);
int WordX_location = word.X;
int WordY_location = word.Y;
int WordWidth = word.Width;
int WordHeight = word.Height;
double WordOcrAccuracy = word.Confidence;
foreach (var character in word.Characters)
{
// Pages -> Paragraphs -> Lines -> Words -> Characters
int CharacterNumber = character.CharacterNumber;
string CharacterText = character.Text;
AnyBitmap CharacterImage = character.ToBitmap(ocrInput);
int CharacterX_location = character.X;
int CharacterY_location = character.Y;
int CharacterWidth = character.Width;
int CharacterHeight = character.Height;
double CharacterOcrAccuracy = character.Confidence;
// Output alternative symbols choices and their probability.
// Very useful for spellchecking
OcrResult.Choice[] Choices = character.Choices;
}
}
}
}
}
Imports IronOcr
Imports IronSoftware.Drawing
' We can delve deep into OCR results as an object model of
' Pages, Barcodes, Paragraphs, Lines, Words and Characters
' This allows us to explore, export and draw OCR content using other APIs/
Private ocrTesseract = New IronTesseract()
ocrTesseract.Configuration.ReadBarCodes = True
Dim ocrInput As New OcrInput()
Dim pages = New Integer() { 1, 2 }
ocrInput.LoadImageFrames("example.tiff", pages)
Dim ocrResult As OcrResult = ocrTesseract.Read(ocrInput)
For Each page In ocrResult.Pages
' Page object
Dim PageNumber As Integer = page.PageNumber
Dim PageText As String = page.Text
Dim PageWordCount As Integer = page.WordCount
' null if we dont set Ocr.Configuration.ReadBarCodes = true;
Dim Barcodes() As OcrResult.Barcode = page.Barcodes
Dim PageImage As AnyBitmap = page.ToBitmap(ocrInput)
Dim PageWidth As Double = page.Width
Dim PageHeight As Double = page.Height
Dim PageRotation As Double = page.Rotation ' angular correction in degrees from OcrInput.Deskew()
For Each paragraph In page.Paragraphs
' Pages -> Paragraphs
Dim ParagraphNumber As Integer = paragraph.ParagraphNumber
Dim ParagraphText As String = paragraph.Text
Dim ParagraphImage As AnyBitmap = paragraph.ToBitmap(ocrInput)
Dim ParagraphX_location As Integer = paragraph.X
Dim ParagraphY_location As Integer = paragraph.Y
Dim ParagraphWidth As Integer = paragraph.Width
Dim ParagraphHeight As Integer = paragraph.Height
Dim ParagraphOcrAccuracy As Double = paragraph.Confidence
Dim paragrapthText_direction As OcrResult.TextFlow = paragraph.TextDirection
For Each line In paragraph.Lines
' Pages -> Paragraphs -> Lines
Dim LineNumber As Integer = line.LineNumber
Dim LineText As String = line.Text
Dim LineImage As AnyBitmap = line.ToBitmap(ocrInput)
Dim LineX_location As Integer = line.X
Dim LineY_location As Integer = line.Y
Dim LineWidth As Integer = line.Width
Dim LineHeight As Integer = line.Height
Dim LineOcrAccuracy As Double = line.Confidence
Dim LineSkew As Double = line.BaselineAngle
Dim LineOffset As Double = line.BaselineOffset
For Each word In line.Words
' Pages -> Paragraphs -> Lines -> Words
Dim WordNumber As Integer = word.WordNumber
Dim WordText As String = word.Text
Dim WordImage As AnyBitmap = word.ToBitmap(ocrInput)
Dim WordX_location As Integer = word.X
Dim WordY_location As Integer = word.Y
Dim WordWidth As Integer = word.Width
Dim WordHeight As Integer = word.Height
Dim WordOcrAccuracy As Double = word.Confidence
For Each character In word.Characters
' Pages -> Paragraphs -> Lines -> Words -> Characters
Dim CharacterNumber As Integer = character.CharacterNumber
Dim CharacterText As String = character.Text
Dim CharacterImage As AnyBitmap = character.ToBitmap(ocrInput)
Dim CharacterX_location As Integer = character.X
Dim CharacterY_location As Integer = character.Y
Dim CharacterWidth As Integer = character.Width
Dim CharacterHeight As Integer = character.Height
Dim CharacterOcrAccuracy As Double = character.Confidence
' Output alternative symbols choices and their probability.
' Very useful for spellchecking
Dim Choices() As OcrResult.Choice = character.Choices
Next character
Next word
Next line
Next paragraph
Next page
<p>IronOCR liefert für jede Seite, die mit Tesseract 5\ gescannt wird, ein erweitertes Ergebnisobjekt. Diese enthält <strong>Standortdaten, Bilder, Text, statistische Zuverlässigkeit, alternative Symbolwahlen, Schriftnamen, Schriftgrößen, Schriftschnitte und Position</strong> für jedes Symbol:</p> <ul> <li>Seite</li> <li>Absatz</li> <li>Textzeile</li> <li>Wort</li> <li>Individueller Charakter</li> <li>und Barcode</li> </ul>
Ob es sich um Produkt-, Integrations- oder Lizenzierungsfragen handelt, das Iron Produktentwicklungsteam steht Ihnen für alle Fragen zur Verfügung. Setzen Sie sich mit uns in Verbindung und beginnen Sie einen Dialog mit Iron, um das Beste aus unserer Bibliothek für Ihr Projekt herauszuholen.
Eine Frage stellenDie IronOCR (Optical Character Recognition) Bibliothek ermöglicht Entwicklern schnelle und effiziente Ergebnisse bei der Umwandlung von Bildern in Text. IronOCR arbeitet mit .NET, VB .NET und C#. Unsere Top .NET-Anwendungen für .NET-Frameworks, die speziell für Sie - den Entwickler - entwickelt wurden, um Sie bei der Erzielung einer optimalen Leistung für Ihre Projekte zu unterstützen.
OCR empfängt und erkennt Textdateien, Barcodes, QR-Inhalte und vieles mehr. IronOCR bietet jedoch auch zahlreiche Methoden, mit denen Sie OCR-Lesung und Text aus Bildern in Web-, Windows-Desktop- oder Konsolen-.NET-Projekte einfügen können, mit Unterstützung für praktisch unbegrenzte Bildformate und -dateien, wie JPG, PNG, GIF, TIFF, BMP, JPEG oder PDF.
Obwohl die Erkennungsergebnisse von Text, Zeichen, Zeilen und Absätzen aus der Bildausgabe nicht gerade einfach erscheinen, werden Sie feststellen, dass die Ergebnisse unter der Haube von IronOCR tatsächlich einfacher sind, als Sie vielleicht zunächst dachten. IronOCR überprüft das Bild auf seine Ausrichtung, setzt seine Rauschunterdrückung und Filter ein, um Qualität und Auflösung zu prüfen. Es prüft die Eigenschaften des Bildes, optimiert die OCR-Engine und verwendet ein trainiertes Netzwerk künstlicher Intelligenz, um Text (aus Bildern) so gut wie ein Mensch zu erkennen.
OCR ist selbst für einen Computer kein einfacher Prozess. IronOCR macht jedoch den gesamten Prozess der Erstellung durchsuchbarer Dokumente schneller und einfacher, mit 100 % Genauigkeit und minimalen Codezeilen.
Lesen Sie die AnleitungSoftware ist nicht auf geografische Grenzen beschränkt - Unternehmen arbeiten grenzüberschreitend und sind auf mehrere Sprachen angewiesen, um ihre Ergebnisse zu erzielen. Entsprechend ist ein OCR-Tool, das Dokumente nur in einer einzigen Sprache erkennt, in jeder Hinsicht ein großes NEIN!
Mit einer mehrsprachigen OCR-Bibliothek, die mehrere OCR-Funktionen bietet, profitieren Sie von der Erstellung eines durchsuchbaren PDF-Dokuments aus einem gescannten PDF oder gescannten Bild in mehreren Sprachen (von Französisch bis Chinesisch!). Mit einem dynamischen, nach Wörtern durchsuchbaren PDF-Dokument, das Sie, Ihre Kunden oder Ihr Unternehmen uneingeschränkt nutzen und wiederverwenden können, werden Ihre Zeit und Ihr Aufwand rationalisiert.
Mit einem starken Fokus auf Sie, Ihr Unternehmen und Ihre OCR-Bedürfnisse, ob integriert oder auf Anfrage, bietet die IronOCR-Bibliothek eine breite Palette an unterstützten Sprachen. Ihr nächstes .NET-Projekt kann frei von Sorgen um die Sprachkompatibilität sein!
Ob Arabisch, Spanisch, Französisch, Deutsch, Hebräisch, Italienisch, Japanisch, Vereinfachtes Chinesisch, Traditionelles Chinesisch (Mandarin), Dänisch, Englisch, Finnisch, Portugiesisch, Russisch, Spanisch oder Schwedisch, Sie nennen uns einfach die Sprachen und wir stellen sie Ihnen zur Verfügung! Sie können Ihre bevorzugte Sprache herunterladen sprachpakete oder kontaktieren Sie unseren 24/7-Support für weitere Sprachen.
Der erste Schritt ist die Verwendung unseres NuGet-Paketinstallationsprogramms für Windows Visual Studio.
Sprachpakete herunterladenWie unterscheidet sich IronOCR von seinen Mitbewerbern? IronOCR ermöglicht nicht nur das einfache Hinzufügen von OCR-Funktionen, das Extrahieren von Text und das Scannen von gedrehten Bildern, sondern bietet auch die Möglichkeit, OCR von unvollkommenen Scans durchzuführen! Im Gegensatz dazu sind viele der verschiedenen gebrauchsfertigen Produkte, die heute auf dem Markt sind, oft starr und ungenau und dazu bestimmt, in realen Einzel- und Unternehmensanwendungen zu versagen, da die meisten von ihnen mit maschinell gedrucktem, hochauflösendem und perfekt angepasstem Text arbeiten.
IronOCR erweitert die Fähigkeiten von Google Tesseract mit seiner leistungsstarken IronTesseract DLL - einer nativen C# OCR-Bibliothek mit verbesserter Stabilität und höherer Genauigkeit als die kostenlose Tesseract-Bibliothek.
Mit dem besten Werkzeug in der Hand, selbst wenn Sie ein nicht ganz perfektes gescanntes Bild oder ein gespeichertes Bild in Ihrem Speicherordner haben - IronOCRs Bildverarbeitungsbibliothekskonvertierung bereinigt Rauschen, dreht, reduziert Verzerrungen und schiefe Ausrichtung und verbessert Auflösung und Kontrast. Die fortschrittlichen OCR-Einstellungen (Optical Character Recognition) geben Ihnen - den Codierern - die Werkzeuge und den Code an die Hand, um immer wieder die bestmöglichen durchsuchbaren Ergebnisse zu erzielen.
Suchen Sie nach den Wörtern, die Sie benötigen, und seien Sie nicht enttäuscht von den 99,8-100% genauen Ergebnissen und der uneingeschränkten Unterstützung für PDF-Dokumente, MultiFrame-TIFF-Dateien, JPEG & JPEG2000, GIF, PNG, BMP, WBMP, System.Drawing.Image, System.Drawing.Bitmap, System.IO.Streams von Bildern, binäre Bilddaten (byte[]) und alles darüber hinaus!
Eine Alternative zu TesseractIm Gegensatz zu anderen .NET-Anwendungen im .NET-Framework bietet die fortschrittliche optische Zeichenerkennung in der Konsole des Paketmanagers und in der Konsole für erkannten Text von IronOCR Ihren Benutzern die Möglichkeit, mehrere Schriftarten (von Times New Roman bis hin zu ausgefallenen oder vermeintlich schwer verständlichen Schriftarten), Gewichtungen und Stile für das genaue Lesen von Text aus einem ganzen Bild oder gescannten Bildern zu verwenden. Unsere Fähigkeit, bestimmte Bereiche eines Bildes auszuwählen, trägt zur Verbesserung von Geschwindigkeit und Genauigkeit bei. Multithreading von einigen Zeilen bis zu einigen Absätzen beschleunigt die OCR-Engine und ermöglicht das Lesen mehrerer Dokumente auf Multicore-Rechnern.
Unsere Ansprüche an Geschwindigkeit und Genauigkeit beschränken sich nicht auf den Prozess der Zeichenerkennung. Vielmehr beginnen die Verbesserungen bereits bei der Installation, denn die IronOCR for .NET OCR-Engine ist eine einfach zu installierende, vollständige und gut dokumentierte .NET-Softwarebibliothek. Es gibt eine einzige NuGet-Paketmanager-Installation für Visual Studio und Multithreading-Kompatibilität mit MVC-, WebApp-, Desktop-, Konsolen- und Server-Anwendungen.
Sie können eine OCR-Genauigkeit von 99,8-100 % erreichen, ohne dass Sie externe Webdienste nutzen, laufende Gebühren zahlen oder vertrauliche Dokumente über das Internet versenden müssen. Ohne umständliche C++-Codierung ist IronOCR die erste Wahl, wenn Sie eine vollständige PDF-OCR-Unterstützung für mehrere Zeichen, Wörter, Zeilen, Absätze, Text und Dokumente benötigen.
Wir bieten die besten Optionen für Entwickler, die ihre Programmierung perfektionieren wollen, denn IronOCR funktioniert sofort, ohne dass Leistungsoptimierungen oder umfangreiche Änderungen an den Eingabebildern erforderlich sind. Die neueste IronOCR-Version arbeitet erstaunlich schnell - bis zu zehnmal schneller und macht über 250 % weniger Fehler als frühere Builds. Wir aktualisieren unsere eigenen Builds, um Ihre Ziele zu unterstützen, indem wir die perfekte Plattform für OCR bereitstellen!
Siehe vollständige FunktionslisteSelbst bei der Verwendung mobiler Geräte ermöglicht unsere perfekte .NET OCR-Bibliothek Entwicklern eine sorgenfreie Programmierung, da IronOCR den Export von Inhalten als einfache und komplexe Texte, maschinell kodierte Texte, Barcodedaten oder strukturierte Objektmodelldaten unterstützt. Sie können die Inhalte in Absätze, Zeilen, Wörter, Zeichen und Bildstrings aufteilen und direkt in Ihren .NET-Anwendungen verwenden.
Vom Quellcode bis zum Endergebnis - die resultierenden Daten wären nutzlos, wenn Sie sie nicht in Ihre Anwendung exportieren könnten. IronOCR versteht dies und ermöglicht es Ihnen, das OCR-Ergebnis nach XHTML zu exportieren, um mit einem nachhaltigen Format in einer breiteren Palette von Anwendungen und mit der Integration in komplexe Websites arbeiten zu können, ganz zu schweigen von schnelleren Ladezeiten!
Doch damit ist die Unterstützung noch nicht zu Ende. Die Möglichkeit, OCR in durchsuchbare PDF-Dokumente zu exportieren, macht es Ihnen, Ihren Kunden und Organisationen leicht, PDF-Dokumente zu speichern und bei Bedarf wiederzufinden! Dies ist besonders vorteilhaft, wenn Sie einen 30-seitigen Vertrag haben, den Sie in Ihrer Datenbank mit ein paar Stichwörtern suchen können. Außerdem können Sie Ihr Unternehmen als Compliance-freundlich präsentieren, da durchsuchbare PDF-Dokumente nachweislich für Sehbehinderte von Vorteil sind.
Darüber hinaus können Sie Ihre Ergebnisse in das OCR-Format exportieren, das Ihre OCR-Ausgabe, Layoutinformationen und Stilinformationen darstellt und die entsprechenden Informationen in Standard-HTML einbettet.
Mehr erfahrenKostenlos lizenzen für die Gemeindeentwicklung. Kommerzielle Lizenzen ab 749 $.
C# Tesserakt OCR
Jim war eine führende Persönlichkeit bei der Entwicklung von IronOCR. Jim entwirft und entwickelt Bildverarbeitungsalgorithmen und Lesemethoden für OCR.
Siehe VergleichC# OCR ASP.NET
Erfahren Sie, wie Gemmas Team IronOCR verwendet, um Text aus Bildern für ihre Archivierungssoftware zu lesen. Gemma teilt ihre eigenen Code-Beispiele.
Bild zu Text .NET TutorialDas Team von Iron verfügt über mehr als 10 Jahre Erfahrung auf dem Markt für .NET-Softwarekomponenten.
10 .NET API-Produkte für Ihre Bürodokumente