OCR-WERKZEUGE

Microsoft OCR-Tools (Alternativen in C#)

Veröffentlicht 30. März 2023
Teilen Sie:

OCR (Optische Zeichenerkennung) ist eine wichtige Technologie für Unternehmen jeder Größe. Es ermöglicht das effiziente Scannen, Speichern und Analysieren von Daten, die sonst zeitaufwändig und komplex zu handhaben wären.

Die OCR-Tools von Microsoft bieten zuverlässige Optionen zur Vereinfachung Ihres digitalen Transformationsprozesses. Diese Tools ermöglichen eine schnellere und effizientere Dokumentenverarbeitung, so dass Sie mehr Zeit für die wichtige Aufgabe haben, Ihr Unternehmen auszubauen. In diesem Artikel erfahren Sie, wie Sie die leistungsstarken OCR-Tools von Microsoft nutzen können, um Ihre Abläufe zu optimieren.

OneNote: Microsoft-Werkzeug

Wenn Sie Text aus einem Bild extrahieren müssen, ist Microsoft OneNote ein hilfreiches Werkzeug. OneNote ist eine vielseitige Anwendung zum Erstellen von Notizen, die eine Plattform zum Erfassen, Speichern und Organisieren von Informationen in verschiedenen Formen wie Text, Bilder, Audio und Video bietet. Es ist auch ein wertvolles Werkzeug zum Kopieren von Text aus Bildern oder Dateiausdrucken, das Ihnen Zeit und Mühe erspart, da Sie den Text nicht mehr manuell eingeben müssen.

Text mit OneNote extrahieren

Führen Sie die folgenden Schritte aus, um mit OneNote Text aus einem Bild zu extrahieren:

  1. Starten Sie die Anwendung OneNote.

  2. Fügen Sie die Bilddatei mit der Option "Einfügen" ein oder ziehen Sie die Bilddatei einfach per Drag & Drop in das OneNote-Fenster.

    OneNote-Farbband einfügen

    OneNote-Farbband einfügen

  3. Klicken Sie mit der rechten Maustaste auf das Bild und wählen Sie im Menü "Text aus Bild kopieren".

    Text aus Bild kopieren im Kontextmenü

    Text aus Bild kopieren im Kontextmenü

  4. Fügen Sie schließlich den kopierten Text an einer beliebigen Stelle ein, um auf den extrahierten Text des gescannten Bildes zuzugreifen.
    Text, der von einem aus einem Bild kopierten Text stammt

    Text, der von einem aus einem Bild kopierten Text stammt

    So können Sie OneNote zum Scannen beliebiger Bilder verwenden.

Microsoft Vision Studio

Microsoft Cognitive Services bietet die Funktion "Text aus Bildern extrahieren", die KI nutzt, um Bilder zu scannen und Text genau zu erkennen. Dieser Dienst ist benutzerfreundlich und erfordert lediglich das Hochladen eines Bildes oder einer PDF-Datei. Die Informationen werden dann mit hoher Genauigkeit transkribiert, um sicherzustellen, dass der extrahierte Text den Inhalt des Bildes oder der PDF-Datei genau wiedergibt.

Darüber hinaus kann der extrahierte Text in verschiedenen Sprachen vorliegen, so dass der Dienst für Nutzer aus aller Welt zugänglich ist. Mit "Extract Text from Images" von Microsoft Cognitive Services wird das Extrahieren wertvoller Daten aus Bildern einfach und ermöglicht eine effiziente Analyse und effektive Aufgabenerledigung.

Text extrahieren mit Microsoft Vision Studio

Um die Funktion "Text aus Bildern extrahieren" zu nutzen, können Sie die Microsoft Azure's Website von Vision Studio. Für diesen Dienst ist jedoch ein Abonnement von Azure erforderlich. Sobald Sie ein Abonnement erworben haben, haben Sie Zugriff auf den extrahierten Text aus gescannten Dokumenten. Nachfolgend finden Sie ein Beispiel für ein Ausgabebild als Referenz.

Bild gescannt für seinen Text

Bild gescannt für seinen Text

A9T9 Microsoft Kostenlose OCR-Software

A9T9 Free OCR Software ist ein vielseitiges Tool, mit dem Windows-Benutzer mühelos Papierdokumente in digitalen Text umwandeln können. Die unkomplizierte Drag-and-Drop-Funktion ermöglicht die sofortige Erkennung von Text in mehreren Sprachen, darunter Englisch, Deutsch, Chinesisch, Koreanisch und Indisch. Diese Software kann Daten aus gescannten Bildern oder PDF-Dokumenten extrahieren und sie in ein bearbeitbares, durchsuchbares Format umwandeln.

Diese Software unterstützt verschiedene Ausgabeformate wie Rich Text, TXT oder CSV und Bildformate wie BMP, TIF oder PDF. Außerdem verfügt es über eine Funktion zum automatischen Geraderücken von Dokumenten. Diese Software erkennt schnell und präzise Text in Bildern verschiedener Sprachen, auch in solchen mit transparentem Hintergrund. Die hohe Genauigkeitsrate, der günstige Preis und die einfache Installation machen A9T9 zur ersten Wahl für Windows-Anwender, die eine kostenlose OCR-Softwarelösung suchen.

Text kopieren mit A9T9

Sie können die A9T9-Software von der Website Microsoft Store. Nach der Installation öffnen Sie die A9T9-Software und laden die Bilder oder PDF-Dateien hoch.

Bild gescannt für seinen Text

Text kopieren mit A9T9

Sobald das Bild oder Dokument geladen ist, klicken Sie auf die Schaltfläche "OCR starten". Dies extrahiert den Text aus dem gescannten Dokument oder Bild und zeigt ihn im Textbereich auf der rechten Seite an.

Der Text wird auf der rechten Seite angezeigt

Der Text wird auf der rechten Seite angezeigt

Sie können die OCR-Sprache auswählen und den Text kopieren oder als Word-Dokument speichern.

Bürolinse

Office Lens ist ein hochentwickeltes Werkzeug zur Erfassung und Organisation von Notizen, Whiteboards, Menüs, Schildern und anderen Arten von schriftlichen oder visuellen Informationen. Diese App bietet eine hervorragende Alternative zu herkömmlichen Notizen, da sie handschriftliche Notizen überflüssig macht und die Gefahr des Verlusts wichtiger Informationen vermeidet.

Mit Office Lens lassen sich Skizzen, handschriftliche Notizen, Zeichnungen und Gleichungen mühelos erfassen und Bilder auf Schatten und schiefe Winkel korrigieren, um die Lesbarkeit zu verbessern. Außerdem bietet es OCR (optische Zeichenerkennung)und ermöglicht es den Benutzern, Text in Bildern zu digitalisieren und zu bearbeiten.

Leider hat Microsoft die Windows-Version von Office Lens eingestellt. Sie ist jetzt nur noch auf mobilen Geräten verfügbar. Außerdem wurde Microsoft Office Document Imaging aus Microsoft Word 2010 entfernt.

IronOCR: C# OCR-Bibliothek

IronOCR ist eine leistungsstarke OCR-Bibliothek in C# für .NET-Entwickler. Sie ermöglicht vollständige OCR-Funktionen für gescannte Dokumente und Bilder und erleichtert Entwicklern die Automatisierung von dokumentenbasierten Arbeitsabläufen. Mit seiner einfachen API und minimalen Konfiguration lässt sich IronOCR problemlos in bestehende Systeme integrieren.

Die Bibliothek bietet eine einfache API, so dass sie mit minimaler Konfiguration leicht in bestehende Systeme integriert werden kann. Es unterstützt eine Vielzahl von Eingabedateiformaten, darunter JPEG, TIFF, GIF, BMP, PDF, mehrseitige TIFFs und Scans mehrerer Dokumente, und kann Text aus Bildern mit unterschiedlichen Ausrichtungen lesen.

Zu den fortschrittlichen Funktionen von IronOCR gehört die Rauschunterdrückung, die dazu beiträgt, Bildverzerrungen zu reduzieren und die Genauigkeit der Textextraktionsergebnisse zu verbessern. Mit der Unterstützung von über 125 Sprachen, darunter Englisch, Französisch, Deutsch, Spanisch und Japanisch, eignet sich die Bibliothek für nahezu jede Anwendung, die hochwertige OCR-Ergebnisse ohne manuelle Eingriffe erfordert.

Text mit IronOCR extrahieren

Mit der Fähigkeit, Text aus PDF-Dateien zu extrahieren, ist es möglich, bestimmte Seitenzahlen anzugeben oder Text aus allen Seiten des Dokuments zu extrahieren. Der Prozess der Textextraktion kann mit den richtigen Tools rationalisiert und effizienter gestaltet werden.

using IronOcr;
using System;

var ocrTesseract = new IronTesseract();

using (var ocrInput = new OcrInput())
{
    // OCR entire document
    ocrInput.AddPdf("example.pdf");

    // Alternatively OCR selected page numbers
    ocrInput.AddPdfPages("example.pdf", new [] { 1, 2, 3 }, "password");

    var ocrResult = ocrTesseract.Read(ocrInput);
    Console.WriteLine(ocrResult.Text);
}
using IronOcr;
using System;

var ocrTesseract = new IronTesseract();

using (var ocrInput = new OcrInput())
{
    // OCR entire document
    ocrInput.AddPdf("example.pdf");

    // Alternatively OCR selected page numbers
    ocrInput.AddPdfPages("example.pdf", new [] { 1, 2, 3 }, "password");

    var ocrResult = ocrTesseract.Read(ocrInput);
    Console.WriteLine(ocrResult.Text);
}
Imports IronOcr
Imports System

Private ocrTesseract = New IronTesseract()

Using ocrInput As New OcrInput()
	' OCR entire document
	ocrInput.AddPdf("example.pdf")

	' Alternatively OCR selected page numbers
	ocrInput.AddPdfPages("example.pdf", { 1, 2, 3 }, "password")

	Dim ocrResult = ocrTesseract.Read(ocrInput)
	Console.WriteLine(ocrResult.Text)
End Using
VB   C#

Hier ist die Ausgabe:

Die Ausgabe in der Debug-Konsole von Visual Studio

Die Ausgabe in der Debug-Konsole von Visual Studio

Neben der Textextraktion aus PDF-Dateien können Sie auch Barcodes problemlos lesen. Die Bibliothek bietet eine einfache Code-Implementierung zum Lesen von Barcodes, was sie zu einem vielseitigen Werkzeug für verschiedene dokumentenbasierte Arbeitsabläufe macht. Siehe den folgenden Code:

using IronOcr;
using System;

var ocrTesseract = new IronTesseract();
ocrTesseract.Configuration.ReadBarCodes = true;
using (var ocrInput = new OcrInput(@"images\imageWithBarcode.png"))
{
    var ocrResult = ocrTesseract.Read(ocrInput);
    foreach (var barcode in ocrResult.Barcodes)
    {
        Console.WriteLine(barcode.Value);
    }
}
using IronOcr;
using System;

var ocrTesseract = new IronTesseract();
ocrTesseract.Configuration.ReadBarCodes = true;
using (var ocrInput = new OcrInput(@"images\imageWithBarcode.png"))
{
    var ocrResult = ocrTesseract.Read(ocrInput);
    foreach (var barcode in ocrResult.Barcodes)
    {
        Console.WriteLine(barcode.Value);
    }
}
Imports IronOcr
Imports System

Private ocrTesseract = New IronTesseract()
ocrTesseract.Configuration.ReadBarCodes = True
Using ocrInput As New OcrInput("images\imageWithBarcode.png")
	Dim ocrResult = ocrTesseract.Read(ocrInput)
	For Each barcode In ocrResult.Barcodes
		Console.WriteLine(barcode.Value)
	Next barcode
End Using
VB   C#
Eingabe/Ausgabe des Codes

Eingabe/Ausgabe des Codes

IronOCR ist in der Lage, niedrige DPI-Werte und verrauschte Bilder zu unterstützen.

using IronOcr;
using System;

var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput(@"images\image.png"))
{
    ocrInput.Deskew();
    ocrInput.DeNoise();
    var ocrResult = ocrTesseract.Read(ocrInput);
    Console.WriteLine(ocrResult.Text);
}
using IronOcr;
using System;

var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput(@"images\image.png"))
{
    ocrInput.Deskew();
    ocrInput.DeNoise();
    var ocrResult = ocrTesseract.Read(ocrInput);
    Console.WriteLine(ocrResult.Text);
}
Imports IronOcr
Imports System

Private ocrTesseract = New IronTesseract()
Using ocrInput As New OcrInput("images\image.png")
	ocrInput.Deskew()
	ocrInput.DeNoise()
	Dim ocrResult = ocrTesseract.Read(ocrInput)
	Console.WriteLine(ocrResult.Text)
End Using
VB   C#

Schlussfolgerung

Zusammenfassend lässt sich sagen, dass die optische Zeichenerkennung (OCR) ist ein unverzichtbares Werkzeug, von dem Unternehmen aller Größenordnungen profitieren können. Es ermöglicht ihnen, Informationen effizient zu scannen, zu speichern und zu verarbeiten, die andernfalls komplex und zeitaufwändig manuell zu verwalten wären. Microsoft bietet verschiedene OCR-Tools an, darunter OneNote, Microsoft Vision Studio und A9T9 Free OCR Software, mit denen sich Prozesse rationalisieren und Zeit sparen lassen.

IronOCR, eine gut ausgestattete OCR-Bibliothek, ist eine herausragende Option unter den verfügbaren OCR-Tools. Es lässt sich leicht in C#- und VB.NET-Anwendungen integrieren, bietet hervorragende Genauigkeit und Erkennung mehrerer Sprachen und Bildformate und verfügt über eine kostenloser Test zeitraum, mit Lizenzkosten ab $749. IronOCR ist eine wertvolle Investition für Unternehmen, die ihre digitale Transformation verbessern wollen. Jedes dieser OCR-Tools bietet einzigartige Funktionen und kann unterschiedliche Anforderungen erfüllen, was sie zu wertvollen Hilfsmitteln für Unternehmen macht, die ihre digitale Transformation verbessern wollen.

< PREVIOUS
Beste OCR-Software für Windows 10 (Vergleichsliste)
NÄCHSTES >
Tesseract installieren (Schritt-für-Schritt-Anleitung mit Bildern)

Sind Sie bereit, loszulegen? Version: 2024.10 gerade veröffentlicht

Gratis NuGet-Download Downloads insgesamt: 2,561,036 Lizenzen anzeigen >