Optische Zeichenerkennung ist die Technologie, die Text aus Bildern, gescannten Dokumenten und PDF-Dokumenten scannt, um ihn in maschinenlesbaren Text umzuwandeln. OCR ermöglicht es Computern, verschiedene Formate zu identifizieren - Bücher, Belege, Formulare und Fotografien -, die digitalisiert und automatisiert für die PDF-Datenauswertung werden können. Es analysiert die Zeichen in einem Bild sowie Muster und ordnet sie dann dem Text zu. Diese optische Zeichenerkennungstechnologie wird in Anwendungen zur Dokumentendigitalisierung, automatisierten PDF-Datenerfassung und -eingabe, Rechnungsbearbeitung und zur Durchsuchbarkeit gescannter PDFs eingesetzt.
OCRs haben sich dramatisch verbessert und können verschiedene Sprachen erkennen und lesen, die heutzutage in der Layout-Verständnis komplex sind, wie Tabellen und Spalten. Software mit fortschrittlichen OCR-Fähigkeiten verwendet auch Vorverarbeitungstechniken für Bilder. Es umfasst Rauschunterdrückung und Kontrasteinstellung, wodurch die Genauigkeit von OCR-Software beim Lesen von Bildern niedriger Qualität verbessert wird. Drei der beliebtesten OCR-Tools sind die Tesseract OCR-Engine, Power Automate und IronOCR mit hoher Genauigkeit und Flexibilität. OCR sind unverzichtbare Werkzeuge für Unternehmen, Forscher und Entwickler geworden, um das Verwalten von Dokumentation und die Texterkennung auszulagern.
Was ist Microsoft Power Automate OCR?
Optische Zeichenerkennung von Microsoft Power Automate: Mit dieser Funktion können Unternehmen die Extraktion von Text aus Bildern, gescannten Dokumenten und PDFs automatisieren, um sie in leicht bearbeitbare und maschinenlesbare Formate zu konvertieren. Als Teil der Microsoft Power Platform bietet Power Automate sowohl Desktop- als auch Online-Nutzern die Möglichkeit, Flows zu erstellen, ohne unbedingt Programmierkenntnisse zu benötigen. Sie können lästige Dateneingaben automatisieren, Rechnungen verarbeiten und Dokumente digitalisieren durch die Integration von OCR in Workflows.
-->
Dies spart ihnen mehr Zeit und minimiert Fehler. Es ist tatsächlich ein leistungsstarkes Suchwerkzeug, das verwendet werden kann, um Unterstützung für viele verschiedene Formate und Sprachen in der OCR-Funktion von Power Automate zu bieten, die mit AI Builder erstellt wurde und die Verwendung von Texterkennung in verschiedenen Branchen unterstützt. Es integriert sich nahtlos mit anderen Microsoft-Diensten, einschließlich Excel, SharePoint und OneDrive, um eine End-to-End-Automatisierung zu ermöglichen, die mit dem Scannen des Dokuments beginnt und es dann speichert oder sogar teilt. In dieser Hinsicht hilft es Organisationen, die Effizienz zu steigern, das Dokumentenmanagement zu optimieren und die betriebliche Genauigkeit in ihren Aktivitäten zu verbessern.
Vorteile der Implementierung von OCR in Power Automate
Die Implementierung von OCR in Power Automate hat folgende Vorteile:
Zeit- und Arbeitseinsparung: Die Automatisierung der Dokumententextextraktion spart viel Zeit und Mühe, die sonst für die manuelle Dateneingabe verwendet würden.
Kosteneffektiv: Da es sowohl benutzerfreundlich als auch zugänglich ist, besteht wenig bis kein Bedarf an teuren kundenspezifischen Softwarelösungen.
Integration: Microsoft Power Automate bietet nahtlose Integration mit anderen Microsoft 365-Diensten wie SharePoint, OneDrive und sogar Excel.
Skalierbarkeit: Mit der Fähigkeit, tausende Dokumente gleichzeitig zu verarbeiten, ist seine Viabilität für große Unternehmen geeignet.
Fehlerreduzierung: Da es die Dateneingabeprozesse automatisiert, ist die Wahrscheinlichkeit menschlicher Fehler auf ein Minimum reduziert.
So arbeiten Sie mit OCR in Power Automate
Power Automate unterstützt OCR-Funktionalität über mehrere verschiedene Verbindungen, einschließlich AI Builder und OneDrive. Hier ist eine Schritt-für-Schritt-Anleitung, wie man Power Automate online erhält oder das Power Automate-Desktop-Programm verwenden kann, um einen OCR-fähigen Workflow zu erstellen:
1. Power Automate einrichten
Um zu beginnen, melden Sie sich in Ihrem Power Automate-Konto an oder registrieren Sie sich, wenn Sie noch keines haben. Power Automate ist Teil von Microsoft 365, was bedeutet, dass Sie bereits Zugriff haben, wenn Sie Office 365 oder Dynamics 365 verwenden.
-->
2: Einen neuen Flow erstellen
Öffnen Sie die Registerkarte "Erstellen" und klicken Sie auf "Sofortiger Flow", um einen neuen Flow zu erstellen, der manuell gestartet werden kann.
-->
Benennen Sie Ihren Flow. Zum Beispiel, benennen Sie es Vor Genehmigung und wählen Sie den folgenden Auslöser: Wenn eine Datei in einem Ordner (SharePoint oder OneDrive) erstellt wird oder einen Flow manuell auslösen.
-->
Ein neuer Power-Automatisierungsablauf wurde wie der untenstehende erstellt.
3: Laden Sie eine Datei auf OneDrive oder SharePoint hoch
Fügen Sie eine Aktion hinzu, um Ihr Dokument (Bild oder andere PDF-Dateien) zu OneDrive for Business oder SharePoint hochzuladen. Diese Aktion wird den OCR-Prozess auslösen, um Daten zu extrahieren. Für diese Demo verwenden wir eine SharePoint-Dokumentbibliothek.
4. Nutzen Sie die OCR-Aktion des AI Builders
Nutzen Sie den AI Builder, um die Aktion Text aus Bildern extrahieren zu entwickeln. AI Builder ist eine tief integrierte Funktion für maschinelles Lernen in Power Automate und verfügt über vortrainierte OCR-Modelle, mit denen Benutzer Text aus Bildern oder PDFs einfach erkennen können.
Wählen Sie die Bilddatei aus, aus der der Text extrahiert werden soll.
5. Verarbeitung extrahierter Daten
Sobald die Sprachdaten durch OCR als Text extrahiert wurden, können sie zur weiteren Verarbeitung weitergeleitet werden. Zum Beispiel:
Speichern Sie den extrahierten Text imExcel-Format: Verwenden Sie die Aktion "Zeile hinzufügen", um den extrahierten Text in eine Excel-Datei hinzuzufügen.
Text per E-Mail übermitteln: Verwenden Sie die Aktion, um eine E-Mail zu senden, um den extrahierten Text an bestimmte Empfänger weiterzuleiten.
In Datenbank speichern: Verwenden von Konnektoren, um Daten in SQL Server, SharePoint-Listen oder andere Datenbanken zur Speicherung zu übertragen.
Was ist IronOCR?
IronOCR ist eine leistungsstarke .NET OCR-Bibliothek, die Ihnen ermöglicht, mithilfe von OCR Text korrekt aus Bildern, PDFs und Scans zu extrahieren. Es wird dort glänzen, wo andere Bibliotheken bei der Texterkennung aufgrund schlechter Bildqualität oder verrauschter Bilder versagen, und es unterstützt über 125 Sprachen, was es perfekt für mehrsprachige Anwendungsfälle mit Vielfalt macht. IronOCR umfasst eine Vielzahl fortschrittlicher Funktionen wie die automatische Erkennung von Sprache und die Vorverarbeitung von Bildrauschen sowie Schräglagenkorrektur, ähnlich wie das gleiche Layoutdokument einschließlich aller Stile sowie der Strukturdetails und Bild-zu-Text sowie PDF-zu-Text mit durchsuchbarem PDF.
Das Produkt kann mühelos über einfache .NET-Projekt-APIs integriert werden, die es den Entwicklern ermöglichen, OCR in einer von ihnen entwickelten Anwendung zu nutzen. Die Bibliothek ist nützlich bei der Dokumentendigitalisierung, bei automatisierten Workflows für die Dateneingabe und bei Textextraktionsaufgaben mit hoher Genauigkeit und Skalierbarkeit für Anwendungen auf Unternehmensebene. Seine Stärke liegt darin, dass die Bibliothek Benutzerfreundlichkeit findet und leistungsstarke OCR-Fähigkeiten bietet.
Merkmale von IronOCR
Es hat eine hervorragende Genauigkeit bei dem Text, den es extrahiert, selbst aus Bildern mit niedriger Auflösung und verrauschten gescannten Dokumenten.
Es unterstützt mehr als 125 Sprachen mit automatischer Spracherkennung, was dadurch OCR in verschiedenen sprachlichen Umgebungen ermöglicht.
Die Vorverarbeitung eines Bildes erfordert Werkzeuge wie Rauschunterdrückung, Schiefkorrektur, Kontrastverstärkung und Schärfung, die alle die Leistung bei unvollkommenen Bildern verbessern.
Erstellen Sie durchsuchbare PDF-Dokumente mit Volltextsuche. Die gescannten Papierdokumente oder Bilder werden in vollständig durchsuchbare PDFs mit dem ursprünglichen Layout umgewandelt, um die Suche und Organisation zu erleichtern.
Layout und Formatierung beibehalten: Dieses Tool behält die Struktur, Schriftarten sowie die Formatierung des Quelldokuments bei, da Layouts wie Tabellen und Spalten komplex sind und bei der Digitalisierung beibehalten werden müssen.
Stapelverarbeitung: Dies ermöglicht die Stapelverarbeitung mehrerer Bilder oder Dokumente in einem Vorgang. Die Technologie unterstützt die Bearbeitung von Dokumenten mit großem Volumen.
Einfache Integration mit .NET: Da es eine einfache API unterstützt, kann es problemlos in .NET-Anwendungen integriert werden, was einen einfach zu implementierenden Mechanismus für OCR ohne großen Aufwand von den Entwicklern bietet.
Beispielcode zur Durchführung von OCR
using IronOcr;
class Program
{
static void Main(string[] args)
{
// Initialize Iron Tesseract OCR engine variable
var Ocr = new IronTesseract();
// Add multiple languages
Ocr.Language = OcrLanguage.English;
// Image file path
var inputFile = @"path\to\your\image.png";
// Read the image and perform OCR
using (var input = new OcrInput(inputFile))
{
// Perform OCR
var result = Ocr.Read(input);
// Display the result
Console.WriteLine("Text:");
Console.WriteLine(result.Text);
}
}
}
using IronOcr;
class Program
{
static void Main(string[] args)
{
// Initialize Iron Tesseract OCR engine variable
var Ocr = new IronTesseract();
// Add multiple languages
Ocr.Language = OcrLanguage.English;
// Image file path
var inputFile = @"path\to\your\image.png";
// Read the image and perform OCR
using (var input = new OcrInput(inputFile))
{
// Perform OCR
var result = Ocr.Read(input);
// Display the result
Console.WriteLine("Text:");
Console.WriteLine(result.Text);
}
}
}
Imports IronOcr
Friend Class Program
Shared Sub Main(ByVal args() As String)
' Initialize Iron Tesseract OCR engine variable
Dim Ocr = New IronTesseract()
' Add multiple languages
Ocr.Language = OcrLanguage.English
' Image file path
Dim inputFile = "path\to\your\image.png"
' Read the image and perform OCR
Using input = New OcrInput(inputFile)
' Perform OCR
Dim result = Ocr.Read(input)
' Display the result
Console.WriteLine("Text:")
Console.WriteLine(result.Text)
End Using
End Sub
End Class
$vbLabelText $csharpLabel
Schlussfolgerung
Obwohl sowohl IronOCR als auch Power Automate OCR in Bezug auf die Texterkennung sehr leistungsstark sind, ist IronOCR erheblich robuster und vielseitiger in seiner Lösung für Entwickler oder Unternehmen, die ernsthafte OCR-Fähigkeiten benötigen, die über die einfachen Fälle hinausgehen, die von Power Automate OCR unterstützt werden. Im Gegensatz dazu ist die OCR-Engine von Power Automate für einfache Workflows konzipiert und erfordert möglicherweise ein zusätzliches Abonnement.
Im Gegensatz dazu zeichnet sich IronOCR dadurch aus, dass es sehr hochwertige Ergebnisse liefert, selbst wenn es mit Eingabebildern von geringer Qualität arbeitet. Es unterstützt über 125 Sprachen mit einer kraftvollen Formatierung und Layout-Beibehaltung. Seine komplexe Dokumentenverarbeitung und umfangreiche Stapelverarbeitung sind gut geeignet für fortschrittliche Bildvorverarbeitungskapazitäten. Dennoch ist es in .NET-Anwendungen äußerst anpassbar.
Während Power Automate OCR für kleinere Automatisierungen oder für Integrationen, die streng in Microsoft aufgebaut sind, ausreichend ist, hat IronOCR die Nase vorn durch den Grad der Benutzerkontrolle, maximale Genauigkeit und sogar Funktionen wie die Erstellung durchsuchbarer PDFs, die mehrere Formate unterstützen.
In Organisationen, die eine leistungsstarke, anpassbare OCR-Lösung ohne Plattformbeschränkungen suchen, IronOCR. Iron Software bietet verschiedene Arten von Bibliotheken für Entwickler an. Besuchen Sie die Seite der Bibliothekensuite, um mehr zu erfahren.
Bevor er Software-Ingenieur wurde, promovierte Kannapat an der Universität Hokkaido in Japan im Bereich Umweltressourcen. Während seines Studiums wurde Kannapat auch Mitglied des Vehicle Robotics Laboratory, das Teil der Abteilung für Bioproduktionstechnik ist. Im Jahr 2022 wechselte er mit seinen C#-Kenntnissen zum Engineering-Team von Iron Software, wo er sich auf IronPDF konzentriert. Kannapat schätzt an seiner Arbeit, dass er direkt von dem Entwickler lernt, der den Großteil des in IronPDF verwendeten Codes schreibt. Neben dem kollegialen Lernen genießt Kannapat auch den sozialen Aspekt der Arbeit bei Iron Software. Wenn er nicht gerade Code oder Dokumentationen schreibt, kann man Kannapat normalerweise beim Spielen auf seiner PS5 oder beim Wiedersehen mit The Last of Us antreffen.
NÄCHSTES > Easyocr vs Tesseract (Vergleich der OCR-Funktionen)