Test in einer Live-Umgebung
Test in der Produktion ohne Wasserzeichen.
Funktioniert überall, wo Sie es brauchen.
Optische Zeichenerkennung ist die Technologie, die gedruckten oder handgeschriebenen Text aus Bildern, gescannten Dokumenten und PDF-Dokumenten scannt, um ihn in maschinenlesbaren Text umzuwandeln. OCRermöglicht es Computern, verschiedene Formate - Bücher, Belege, Formulare und Fotografien - zu erkennen, die digitalisiert und für die PDF-Datenextraktion automatisiert werden können. Es analysiert die Zeichen in einem Bild sowie Muster und ordnet sie dann dem Text zu. Diese optische Zeichenerkennungstechnologie wird in Anwendungen zur Dokumentendigitalisierung, automatisierten PDF-Datenerfassung und -eingabe, Rechnungsbearbeitung und zur Durchsuchbarkeit gescannter PDFs eingesetzt.
OCRs haben sich dramatisch verbessert und können verschiedene Sprachen erkennen und lesen, die heutzutage in der Layout-Verständnis komplex sind, wie Tabellen und Spalten. Software mit fortschrittlichen OCR-Fähigkeiten verwendet auch Vorverarbeitungstechniken für Bilder. Es umfasst Rauschunterdrückung und Kontrasteinstellung, wodurch die Genauigkeit von OCR-Software beim Lesen von Bildern niedriger Qualität verbessert wird. Drei der beliebtesten OCR-Tools sind die Tesseract OCR-Engine, Power Automate und IronOCR mit hoher Genauigkeit und Flexibilität. OCR sind unverzichtbare Werkzeuge für Unternehmen, Forscher und Entwickler geworden, um das Verwalten von Dokumentation und die Texterkennung auszulagern.
Optische Zeichenerkennung durchMicrosoft Power Automate: Mit dieser Funktion können Unternehmen ihre Kompetenz zur automatisierten Extraktion von Texten aus Bildern, gescannten Dokumenten und PDFs in leicht bearbeitbare und maschinenlesbare Formate stärken. Als Teil der Microsoft Power Platform bietet Power Automate sowohl Desktop- als auch Online-Nutzern die Möglichkeit, Flows zu erstellen, ohne unbedingt Programmierkenntnisse zu benötigen. Sie können lästige Dateneingaben automatisieren, Rechnungen verarbeiten und Dokumente digitalisieren durch die Integration von OCR in Workflows.
Defektes Bild Von Pixabay hinzufügen, aus Ihren Dateien auswählen oder ein Bild hierher ziehen.
Dies spart ihnen mehr Zeit und minimiert Fehler. Es ist tatsächlich ein leistungsstarkes Suchwerkzeug, das verwendet werden kann, um Unterstützung für viele verschiedene Formate und Sprachen in der OCR-Funktion von Power Automate zu bieten, die mit AI Builder erstellt wurde und die Verwendung von Texterkennung in verschiedenen Branchen unterstützt. Es integriert sich nahtlos mit anderen Microsoft-Diensten, einschließlich Excel, SharePoint und OneDrive, um eine End-to-End-Automatisierung zu ermöglichen, die mit dem Scannen des Dokuments beginnt und es dann speichert oder sogar teilt. In dieser Hinsicht hilft es Organisationen, die Effizienz zu steigern, das Dokumentenmanagement zu optimieren und die betriebliche Genauigkeit in ihren Aktivitäten zu verbessern.
Die Implementierung von OCR in Power Automate hat folgende Vorteile:
Zeit- und Arbeitseinsparung: Die Automatisierung der Dokumententextextraktion spart erheblich viel Zeit und Mühe, die sonst beim manuellen Eingeben von Daten aufgewendet werden müssten.
Kostenwirksam: Da es benutzerfreundlich und zugänglich ist, besteht kaum oder gar kein Bedarf an teuren, maßgeschneiderten Softwarelösungen.
Integration: Microsoft Power Automate bietet nahtlose Integration mit anderen Microsoft 365-Diensten wie SharePoint, OneDrive und sogar Excel.
Skalierbarkeit: Durch die Fähigkeit, Tausende von Dokumenten auf einmal zu verarbeiten, macht seine Viabilität es geeignet für große Unternehmen.
Reduzierung von Fehlern: Da es die Dateneingabeprozesse automatisiert, ist die Wahrscheinlichkeit menschlicher Fehler auf ein Minimum reduziert.
Power Automate unterstützt OCR-Funktionalität über mehrere verschiedene Verbindungen, einschließlich AI Builder und OneDrive. Hier ist eine Schritt-für-Schritt-Anleitung, wie man Power Automate online erhält oder das Power Automate-Desktop-Programm verwenden kann, um einen OCR-fähigen Workflow zu erstellen:
Um zu beginnen, melden Sie sich in Ihrem Power Automate-Konto an oder registrieren Sie sich, wenn Sie noch keines haben. Power Automate ist Teil von Microsoft 365, was bedeutet, dass Sie bereits Zugriff haben, wenn Sie Office 365 oder Dynamics 365 verwenden.
Defektes Bild Von Pixabay hinzufügen, aus Ihren Dateien auswählen oder ein Bild hierher ziehen.
Öffnen Sie die Registerkarte "Erstellen" und klicken Sie auf "Sofortiger Flow", um einen neuen Flow zu erstellen, der manuell gestartet werden kann.
Defektes Bild Von Pixabay hinzufügen, aus Ihren Dateien auswählen oder ein Bild hierher ziehen.
Benennen Sie Ihren Flow. Zum Beispiel benennen Sie es Vor Genehmigung und wählen Sie den folgenden Auslöser aus: Wenn eine Datei in einem Ordner erstellt wird(SharePoint oder OneDrive)oder einen Flow manuell auslösen.
Defektes Bild Von Pixabay hinzufügen, aus Ihren Dateien auswählen oder ein Bild hierher ziehen.
Ein neuer Power-Automatisierungsablauf wurde wie der untenstehende erstellt.
Fügen Sie eine Aktion zum Hochladen Ihres Dokuments hinzu(Bild- oder andere PDF-Dateien)zu OneDrive for Business oder SharePoint. Diese Aktion wird den OCR-Prozess auslösen, um Daten zu extrahieren. Für diese Demo verwenden wir eine SharePoint-Dokumentbibliothek.
Nutzen Sie den AI Builder, um die Aktion Text aus Bildern extrahieren zu entwickeln. AI Builder ist eine tief integrierte Funktion für maschinelles Lernen in Power Automate und verfügt über vortrainierte OCR-Modelle, mit denen Benutzer Text aus Bildern oder PDFs einfach erkennen können.
Wählen Sie die Bilddatei aus, aus der der Text extrahiert werden soll.
Sobald die Sprachdaten durch OCR als Text extrahiert wurden, können sie zur weiteren Verarbeitung weitergeleitet werden. Zum Beispiel:
Speichern Sie den extrahierten Text im Excel-Format: Verwenden Sie die Aktion "Zeile hinzufügen", um den extrahierten Text in einer Excel-Datei hinzuzufügen.
Den Text per E-Mail weiterleiten: Verwenden Sie die Aktion, um eine E-Mail zu senden und den extrahierten Text an bestimmte Empfänger weiterzuleiten.
In der Datenbank speichern: Verwenden von Connectors, um Daten in SQL Server, SharePoint-Listen oder andere Datenbanken zur Speicherung zu übertragen.
IronOCRist eine leistungsstarke .NET OCR-Bibliothek, die es Ihnen ermöglicht, Text korrekt mit OCR aus Bildern, PDFs und Scans zu extrahieren. Es wird dort glänzen, wo andere Bibliotheken bei der Texterkennung aufgrund schlechter Bildqualität oder verrauschter Bilder versagen, und es unterstützt über 125 Sprachen, was es perfekt für mehrsprachige Anwendungsfälle mit Vielfalt macht. IronOCR umfasst eine Vielzahl fortschrittlicher Funktionen wie die automatische Erkennung von Sprache und die Vorverarbeitung von Bildrauschen sowie Schräglagenkorrektur, ähnlich wie das gleiche Layoutdokument einschließlich aller Stile sowie der Strukturdetails und Bild-zu-Text sowie PDF-zu-Text mit durchsuchbarem PDF.
Das Produkt kann mühelos über einfache .NET-Projekt-APIs integriert werden, die es den Entwicklern ermöglichen, OCR in einer von ihnen entwickelten Anwendung zu nutzen. Die Bibliothek ist nützlich bei der Dokumentendigitalisierung, bei automatisierten Workflows für die Dateneingabe und bei Textextraktionsaufgaben mit hoher Genauigkeit und Skalierbarkeit für Anwendungen auf Unternehmensebene. Seine Stärke liegt darin, dass die Bibliothek Benutzerfreundlichkeit findet und leistungsstarke OCR-Fähigkeiten bietet.
Einfache Integration mit .NET: Da es eine einfache API unterstützt, kann es problemlos in .NET-Anwendungen integriert werden, was einen leicht zu implementierenden Mechanismus für OCR darstellt, ohne großen Aufwand seitens der Entwickler.
Beispielcode zur Durchführung von OCR
using IronOcr;
class Program
{
static void Main(string[] args)
{
// Initialize Iron Tesseract OCR engine variable
var Ocr = new IronTesseract();
// Add multiple languages
Ocr.Language = OcrLanguage.English;
// Image file path
var inputFile = @"path\to\your\image.png";
// Read the image and perform OCR
using (var input = new OcrInput(inputFile))
{
// Perform OCR
var result = Ocr.Read(input);
// Display the result
Console.WriteLine("Text:");
Console.WriteLine(result.Text);
}
}
}
using IronOcr;
class Program
{
static void Main(string[] args)
{
// Initialize Iron Tesseract OCR engine variable
var Ocr = new IronTesseract();
// Add multiple languages
Ocr.Language = OcrLanguage.English;
// Image file path
var inputFile = @"path\to\your\image.png";
// Read the image and perform OCR
using (var input = new OcrInput(inputFile))
{
// Perform OCR
var result = Ocr.Read(input);
// Display the result
Console.WriteLine("Text:");
Console.WriteLine(result.Text);
}
}
}
Imports IronOcr
Friend Class Program
Shared Sub Main(ByVal args() As String)
' Initialize Iron Tesseract OCR engine variable
Dim Ocr = New IronTesseract()
' Add multiple languages
Ocr.Language = OcrLanguage.English
' Image file path
Dim inputFile = "path\to\your\image.png"
' Read the image and perform OCR
Using input = New OcrInput(inputFile)
' Perform OCR
Dim result = Ocr.Read(input)
' Display the result
Console.WriteLine("Text:")
Console.WriteLine(result.Text)
End Using
End Sub
End Class
Obwohl sowohl IronOCR als auch Power Automate OCR in Bezug auf die Texterkennung sehr leistungsstark sind, ist IronOCR erheblich robuster und vielseitiger in seiner Lösung für Entwickler oder Unternehmen, die ernsthafte OCR-Fähigkeiten benötigen, die über die einfachen Fälle hinausgehen, die von Power Automate OCR unterstützt werden. Im Gegensatz dazu ist die OCR-Engine von Power Automate für einfache Workflows konzipiert und erfordert möglicherweise ein zusätzliches Abonnement.
Im Gegensatz dazu zeichnet sich IronOCR dadurch aus, dass es sehr hochwertige Ergebnisse liefert, selbst wenn es mit Eingabebildern von geringer Qualität arbeitet. Es unterstützt über 125 Sprachen mit einer kraftvollen Formatierung und Layout-Beibehaltung. Seine komplexe Dokumentenverarbeitung und umfangreiche Stapelverarbeitung sind gut geeignet für fortschrittliche Bildvorverarbeitungskapazitäten. Dennoch ist es in .NET-Anwendungen äußerst anpassbar.
Während Power Automate OCR für kleinere Automatisierungen oder für Integrationen, die streng in Microsoft aufgebaut sind, ausreichend ist, hat IronOCR die Nase vorn durch den Grad der Benutzerkontrolle, maximale Genauigkeit und sogar Funktionen wie die Erstellung durchsuchbarer PDFs, die mehrere Formate unterstützen.
In Organisationen, die nach einer leistungsstarken, anpassbaren OCR-Lösung ohne Plattformbeschränkungen suchen,IronOCR. Iron Software bietet Entwicklern verschiedene Arten von Bibliotheken an, um dieBibliothekssuite-Seite um mehr zu erfahren.
9 .NET API-Produkte für Ihre Bürodokumente