Zum Fußzeileninhalt springen
OCR-WERKZEUGE

Microsoft OCR-Tools (Alternativen in C#)

OCR (Optische Zeichenerkennung) ist eine entscheidende Technologie für Unternehmen jeder Größe. Sie ermöglicht effizientes Scannen, Speichern und Analysieren von Daten, die ansonsten zeitaufwendig und komplex zu handhaben wären.

Microsoft OCR-Tools bieten robuste Optionen, um Ihren digitalen Transformationsprozess zu vereinfachen. Diese Tools ermöglichen eine schnellere und effizientere Dokumentenverarbeitung und geben Ihnen die Zeit, sich auf die wichtige Aufgabe des Wachstums Ihres Unternehmens zu konzentrieren. In diesem Artikel werden wir herausfinden, wie Sie die leistungsstarken Microsoft OCR-Tools nutzen können, um Ihre Abläufe zu optimieren.

OneNote: Microsoft Tool

Wenn Sie Text aus einem Bild extrahieren müssen, ist Microsoft OneNote ein hilfreiches Tool. OneNote ist eine vielseitige Notizanwendung, die eine Plattform zum Erfassen, Speichern und Organisieren von Informationen in verschiedenen Formen wie Texten, Bildern, Audios und Videos bietet. Es ist auch ein wertvolles Werkzeug zum Kopieren von Texten aus Bildern oder Dateiausdrucken, was Ihnen Zeit und Mühe spart, indem Sie den Text nicht manuell eintippen müssen.

Text mit OneNote extrahieren

Um Text mit OneNote aus einem Bild zu extrahieren, folgen Sie diesen Schritten:

  1. Starten Sie die OneNote-Anwendung.
  2. Fügen Sie die Bilddatei mit der Option 'Einfügen' ein oder ziehen Sie einfach die Bilddatei in das OneNote-Fenster.

    class="content-img-align-center"> OneNote Insert ribbon

    class="content__image-caption">OneNote-Einfügeraster

  3. Klicken Sie mit der rechten Maustaste auf das Bild und wählen Sie im Menü 'Text aus Bild kopieren' aus.

    class="content-img-align-center"> Text aus Bild im Kontextmenü kopieren

    class="content__image-caption">Text aus Bild im Kontextmenü kopieren

  4. Fügen Sie schließlich den kopierten Text an einer beliebigen Stelle ein, um auf den aus dem gescannten Bild extrahierten Text zuzugreifen.

    class="content-img-align-center"> Text stammt aus Bild

    class="content__image-caption">Text stammt aus Bild

So können Sie jedes Bild mit OneNote scannen.

Microsoft Vision Studio

Microsoft Cognitive Services bietet eine Funktion 'Text aus Bildern extrahieren', die KI verwendet, um Bilder zu scannen und Textt genau zu erkennen. Dieser Dienst ist benutzerfreundlich und erfordert lediglich das Hochladen einer Bild- oder PDF-Datei. Die Informationen werden dann mit hoher Genauigkeit transkribiert, wodurch sichergestellt wird, dass der extrahierte Text den Inhalt des Bildes oder der PDF-Datei genau darstellt.

Darüber hinaus kann der extrahierte Text in verschiedenen Sprachen vorliegen und diesen Dienst so für Benutzer weltweit zugänglich machen. Mit Microsoft Cognitive Services 'Text aus Bildern extrahieren' wird das Extrahieren wertvoller Daten aus Bildern vereinfacht und eine effiziente Analyse und effektive Aufgabenbewältigung ermöglicht.

Text mit Microsoft Vision Studio extrahieren

Um die Funktion 'Text aus Bildern extrahieren' zu nutzen, können Sie die Vision Studio-Website von Microsoft Azure besuchen. Dieser Dienst erfordert jedoch ein Abonnement von Azure. Sobald Sie ein Abonnement erworben haben, haben Sie Zugriff auf den extrahierten Text aus gescannten Dokumenten. Das folgende ist ein Referenzbild mit einem Beispielausgang.

class="content-img-align-center"> Bild für seinen Text gescannt

class="content__image-caption">Bild für seinen Text gescannt

A9T9 Microsoft Free OCR Software

A9T9 Free OCR Software ist ein vielseitiges Tool, das Windows-Benutzern ermöglicht, Papierdokumente mühelos in digitalen Text zu konvertieren. Seine einfache Drag-and-Drop-Funktion ermöglicht die sofortige Erkennung von Text in mehreren Sprachen, einschließlich Englisch, Deutsch, Chinesisch, Koreanisch und Indisch. Diese Software kann Daten aus gescannten Bildern oder PDF-Dokumenten extrahieren und in ein bearbeitbares, durchsuchbares Format konvertieren.

Diese Software unterstützt verschiedene Ausgabeformate wie Rich Text, TXT oder CSV und Bildformate wie BMP, TIF oder PDF. Es verfügt auch über eine automatische Dokumentenentfaltung. Diese Software erkennt Text in Bildern verschiedener Sprachen, sogar solchen mit transparenten Hintergründen, schnell und genau. Dank der hohen Genauigkeit, der Erschwinglichkeit und der einfachen Installation von A9T9 ist es die erste Wahl für Windows-Benutzer, die eine kostenlose OCR-Softwarelösung suchen.

Text mit A9T9 kopieren

Sie können die A9T9-Software aus dem Microsoft Store herunterladen. Nach der Installation öffnen Sie die A9T9-Software und laden die Bilder oder PDF-Dateien hoch.

class="content-img-align-center"> Bild für seinen Text gescannt

class="content__image-caption">Text mit A9T9 kopieren

Wenn das Bild oder Dokument geladen ist, klicken Sie auf die Schaltfläche 'OCR starten'. Dadurch wird der Text aus dem gescannten Dokument oder Bild extrahiert und im Textbereich auf der rechten Seite angezeigt.

class="content-img-align-center"> Der Text wird auf der rechten Seite angezeigt

class="content__image-caption">Der Text wird auf der rechten Seite angezeigt

Sie können die OCR-Sprache auswählen und den Text kopieren oder als Word-Dokument speichern.

Office Lens

Office Lens ist ein raffiniertes Tool, das zum Erfassen und Organisieren von Notizen, Whiteboards, Menüs, Schildern und anderen Arten schriftlicher oder visueller Informationen entwickelt wurde. Diese App bietet eine überlegene Alternative zu herkömmlichem Notieren, indem sie das Schreiben von Notizen und die Möglichkeit des Verlusts wichtiger Informationen überflüssig macht.

Office Lens ermöglicht es Benutzern, Skizzen, handschriftliche Notizen, Zeichnungen und Gleichungen einfach zu erfassen und Bilder für Schatten und verzerrte Winkel zu korrigieren, um die Lesbarkeit zu verbessern. Es verfügt auch über OCR (Optische Zeichenerkennung), wodurch Benutzer Text innerhalb von Bildern digitalisieren und bearbeiten können.

Leider hat Microsoft die Windows-Version von Office Lens eingestellt. Es ist jetzt nur noch auf mobilen Geräten verfügbar. Zusätzlich wurde Microsoft Office Document Imaging aus Microsoft Word 2010 entfernt.

IronOCR: C# OCR-Bibliothek

IronOCR ist eine leistungsstarke OCR-Bibliothek in C# für .NET-Entwickler. Es ermöglicht vollständige OCR-Funktionen auf gescannten Dokumenten und Bildern, was es Entwicklern erleichtert, dokumentenbasierte Workflows zu automatisieren. Mit seiner einfachen API und minimalen Konfiguration ist IronOCR unkompliziert in vorhandene Systeme zu integrieren.

Die Bibliothek bietet eine einfache API, was die Integration in bestehende Systeme mit minimaler Konfiguration erleichtert. Es unterstützt eine große Auswahl an Eingabedateiformaten, einschließlich JPEG, TIFF, GIF, BMP, PDF, mehrseitiger TIFFs und mehrere Dokumentenscans, und kann Text aus Bildern mit unterschiedlichen Ausrichtungen lesen.

Die fortgeschrittenen Features von IronOCR umfassen Rauschunterdrückung, die hilft, Bildverzerrungen zu reduzieren und die Genauigkeit der Textextraktionsergebnisse zu verbessern. Mit Unterstützung für über 125 Sprachen, einschließlich Englisch, Französisch, Deutsch, Spanisch und Japanisch, eignet sich die Bibliothek für fast jede Anwendung, die hochqualitative OCR-Ergebnisse ohne manuelle Intervention erfordert.

Text mit IronOCR extrahieren

Mit der Möglichkeit, Text aus PDF-Dateien einfach zu extrahieren, ist es möglich, bestimmte Seitenzahlen anzugeben oder Text aus allen Seiten des Dokuments zu extrahieren. Der Prozess kann mit den richtigen Werkzeugen optimiert und effizienter gestaltet werden.

using IronOcr;
using System;

var ocrTesseract = new IronTesseract();

using (var ocrInput = new OcrInput())
{
    // Add the entire PDF for OCR processing
    ocrInput.AddPdf("example.pdf");

    // Alternatively, OCR selected page numbers from a password-protected PDF
    ocrInput.AddPdfPages("example.pdf", new [] { 1, 2, 3 }, "password");

    // Perform OCR and get the result
    var ocrResult = ocrTesseract.Read(ocrInput);

    // Output the extracted text
    Console.WriteLine(ocrResult.Text);
}
using IronOcr;
using System;

var ocrTesseract = new IronTesseract();

using (var ocrInput = new OcrInput())
{
    // Add the entire PDF for OCR processing
    ocrInput.AddPdf("example.pdf");

    // Alternatively, OCR selected page numbers from a password-protected PDF
    ocrInput.AddPdfPages("example.pdf", new [] { 1, 2, 3 }, "password");

    // Perform OCR and get the result
    var ocrResult = ocrTesseract.Read(ocrInput);

    // Output the extracted text
    Console.WriteLine(ocrResult.Text);
}
Imports IronOcr
Imports System

Private ocrTesseract = New IronTesseract()

Using ocrInput As New OcrInput()
	' Add the entire PDF for OCR processing
	ocrInput.AddPdf("example.pdf")

	' Alternatively, OCR selected page numbers from a password-protected PDF
	ocrInput.AddPdfPages("example.pdf", { 1, 2, 3 }, "password")

	' Perform OCR and get the result
	Dim ocrResult = ocrTesseract.Read(ocrInput)

	' Output the extracted text
	Console.WriteLine(ocrResult.Text)
End Using
$vbLabelText   $csharpLabel

Hier ist die Ausgabe:

class="content-img-align-center"> Der Ausgang in der Visual Studio Debug Console

class="content__image-caption">Der Ausgang in der Visual Studio Debug Console

Sie können auch Barcodes einfach lesen, zusätzlich zur Extraktion von Texten aus PDF-Dateien. Die Bibliothek bietet eine einfache Codeimplementierung zum Lesen von Barcodes, wodurch es ein vielseitiges Werkzeug für verschiedene dokumentenbasierte Workflows ist. Sehen Sie den folgenden Code:

using IronOcr;
using System;

var ocrTesseract = new IronTesseract();
ocrTesseract.Configuration.ReadBarCodes = true;

// Read barcodes from an image file
using (var ocrInput = new OcrInput(@"images\imageWithBarcode.png"))
{
    var ocrResult = ocrTesseract.Read(ocrInput);

    // Iterate through the detected barcodes and print their values
    foreach (var barcode in ocrResult.Barcodes)
    {
        Console.WriteLine(barcode.Value);
    }
}
using IronOcr;
using System;

var ocrTesseract = new IronTesseract();
ocrTesseract.Configuration.ReadBarCodes = true;

// Read barcodes from an image file
using (var ocrInput = new OcrInput(@"images\imageWithBarcode.png"))
{
    var ocrResult = ocrTesseract.Read(ocrInput);

    // Iterate through the detected barcodes and print their values
    foreach (var barcode in ocrResult.Barcodes)
    {
        Console.WriteLine(barcode.Value);
    }
}
Imports IronOcr
Imports System

Private ocrTesseract = New IronTesseract()
ocrTesseract.Configuration.ReadBarCodes = True

' Read barcodes from an image file
Using ocrInput As New OcrInput("images\imageWithBarcode.png")
	Dim ocrResult = ocrTesseract.Read(ocrInput)

	' Iterate through the detected barcodes and print their values
	For Each barcode In ocrResult.Barcodes
		Console.WriteLine(barcode.Value)
	Next barcode
End Using
$vbLabelText   $csharpLabel
class="content-img-align-center"> Eingabe/Ausgabe des Codes

class="content__image-caption">Eingabe/Ausgabe des Codes

IronOCR kann niedrige DPI- und rauschende Bilder unterstützen, indem es sie vor der Verarbeitung verbessert.

using IronOcr;
using System;

var ocrTesseract = new IronTesseract();

// Process a noisy image by deskewing and denoising it
using (var ocrInput = new OcrInput(@"images\image.png"))
{
    ocrInput.Deskew(); // Corrects for skewness in the image
    ocrInput.DeNoise(); // Reduces visual noise for better recognition

    // Perform OCR and print the text
    var ocrResult = ocrTesseract.Read(ocrInput);
    Console.WriteLine(ocrResult.Text);
}
using IronOcr;
using System;

var ocrTesseract = new IronTesseract();

// Process a noisy image by deskewing and denoising it
using (var ocrInput = new OcrInput(@"images\image.png"))
{
    ocrInput.Deskew(); // Corrects for skewness in the image
    ocrInput.DeNoise(); // Reduces visual noise for better recognition

    // Perform OCR and print the text
    var ocrResult = ocrTesseract.Read(ocrInput);
    Console.WriteLine(ocrResult.Text);
}
Imports IronOcr
Imports System

Private ocrTesseract = New IronTesseract()

' Process a noisy image by deskewing and denoising it
Using ocrInput As New OcrInput("images\image.png")
	ocrInput.Deskew() ' Corrects for skewness in the image
	ocrInput.DeNoise() ' Reduces visual noise for better recognition

	' Perform OCR and print the text
	Dim ocrResult = ocrTesseract.Read(ocrInput)
	Console.WriteLine(ocrResult.Text)
End Using
$vbLabelText   $csharpLabel

Abschluss

Abschließend ist die optische Zeichenerkennung (OCR) ein unverzichtbares Tool, das Unternehmen jeder Größe erheblich nutzen kann, indem es ihnen ermöglicht, Informationen effizient zu scannen, zu speichern und zu verarbeiten, die andernfalls komplex und zeitaufwendig manuell zu verwalten wären. Microsoft bietet verschiedene OCR-Tools an, darunter OneNote, Microsoft Vision Studio und A9T9 Free OCR Software, die Prozesse optimieren und Zeit sparen können.

IronOCR, eine gut ausgestattete OCR-Bibliothek, ist eine herausragende Option unter den verfügbaren OCR-Tools. Es ist leicht in C# und VB.NET-Anwendungen integrierbar, bietet hervorragende Genauigkeit und Erkennung von mehreren Sprachen und Bildformaten und hat eine kostenlose Testphase, wobei die Lizenzkosten bei $799 beginnen. IronOCR ist eine wertvolle Investition für Unternehmen, die ihre digitale Transformation verbessern möchten. Jedes dieser OCR-Tools bietet einzigartige Funktionen und kann unterschiedlichen Anforderungen gerecht werden, was sie zu wertvollen Assets für Unternehmen macht, die ihre digitale Transformation verbessern möchten.

Kannaopat Udonpant
Software Ingenieur
Bevor er Software-Ingenieur wurde, absolvierte Kannapat ein PhD in Umweltressourcen an der Hokkaido University in Japan. Während seines Studiums wurde Kannapat auch Mitglied des Vehicle Robotics Laboratory, das Teil der Fakultät für Bioproduktionstechnik ist. Im Jahr 2022 nutzte er seine C#-Kenntnisse, um dem Engineering-Team von Iron Software ...
Weiterlesen