OCR-WERKZEUGE

Power Automate OCR (Entwickler-Tutorial)

Veröffentlicht 15. Dezember 2024
Teilen Sie:

Einführung

Optische Zeichenerkennung ist die Technologie, die gedruckten oder handgeschriebenen Text aus Bildern, gescannten Dokumenten und PDF-Dokumenten scannt, um ihn in maschinenlesbaren Text umzuwandeln. OCRermöglicht es Computern, verschiedene Formate - Bücher, Belege, Formulare und Fotografien - zu erkennen, die digitalisiert und für die PDF-Datenextraktion automatisiert werden können. Es analysiert die Zeichen in einem Bild sowie Muster und ordnet sie dann dem Text zu. Diese optische Zeichenerkennungstechnologie wird in Anwendungen zur Dokumentendigitalisierung, automatisierten PDF-Datenerfassung und -eingabe, Rechnungsbearbeitung und zur Durchsuchbarkeit gescannter PDFs eingesetzt.

OCRs haben sich dramatisch verbessert und können verschiedene Sprachen erkennen und lesen, die heutzutage in der Layout-Verständnis komplex sind, wie Tabellen und Spalten. Software mit fortschrittlichen OCR-Fähigkeiten verwendet auch Vorverarbeitungstechniken für Bilder. Es umfasst Rauschunterdrückung und Kontrasteinstellung, wodurch die Genauigkeit von OCR-Software beim Lesen von Bildern niedriger Qualität verbessert wird. Drei der beliebtesten OCR-Tools sind die Tesseract OCR-Engine, Power Automate und IronOCR mit hoher Genauigkeit und Flexibilität. OCR sind unverzichtbare Werkzeuge für Unternehmen, Forscher und Entwickler geworden, um das Verwalten von Dokumentation und die Texterkennung auszulagern.

Was ist Microsoft Power Automate OCR?

Optische Zeichenerkennung durchMicrosoft Power Automate: Mit dieser Funktion können Unternehmen ihre Kompetenz zur automatisierten Extraktion von Texten aus Bildern, gescannten Dokumenten und PDFs in leicht bearbeitbare und maschinenlesbare Formate stärken. Als Teil der Microsoft Power Platform bietet Power Automate sowohl Desktop- als auch Online-Nutzern die Möglichkeit, Flows zu erstellen, ohne unbedingt Programmierkenntnisse zu benötigen. Sie können lästige Dateneingaben automatisieren, Rechnungen verarbeiten und Dokumente digitalisieren durch die Integration von OCR in Workflows.

Defektes Bild Von Pixabay hinzufügen, aus Ihren Dateien auswählen oder ein Bild hierher ziehen.

Dies spart ihnen mehr Zeit und minimiert Fehler. Es ist tatsächlich ein leistungsstarkes Suchwerkzeug, das verwendet werden kann, um Unterstützung für viele verschiedene Formate und Sprachen in der OCR-Funktion von Power Automate zu bieten, die mit AI Builder erstellt wurde und die Verwendung von Texterkennung in verschiedenen Branchen unterstützt. Es integriert sich nahtlos mit anderen Microsoft-Diensten, einschließlich Excel, SharePoint und OneDrive, um eine End-to-End-Automatisierung zu ermöglichen, die mit dem Scannen des Dokuments beginnt und es dann speichert oder sogar teilt. In dieser Hinsicht hilft es Organisationen, die Effizienz zu steigern, das Dokumentenmanagement zu optimieren und die betriebliche Genauigkeit in ihren Aktivitäten zu verbessern.

Vorteile der Implementierung von OCR in Power Automate

Die Implementierung von OCR in Power Automate hat folgende Vorteile:

Zeit- und Arbeitseinsparung: Die Automatisierung der Dokumententextextraktion spart erheblich viel Zeit und Mühe, die sonst beim manuellen Eingeben von Daten aufgewendet werden müssten.

Kostenwirksam: Da es benutzerfreundlich und zugänglich ist, besteht kaum oder gar kein Bedarf an teuren, maßgeschneiderten Softwarelösungen.

Integration: Microsoft Power Automate bietet nahtlose Integration mit anderen Microsoft 365-Diensten wie SharePoint, OneDrive und sogar Excel.

Skalierbarkeit: Durch die Fähigkeit, Tausende von Dokumenten auf einmal zu verarbeiten, macht seine Viabilität es geeignet für große Unternehmen.

Reduzierung von Fehlern: Da es die Dateneingabeprozesse automatisiert, ist die Wahrscheinlichkeit menschlicher Fehler auf ein Minimum reduziert.

So arbeiten Sie mit OCR in Power Automate

Power Automate unterstützt OCR-Funktionalität über mehrere verschiedene Verbindungen, einschließlich AI Builder und OneDrive. Hier ist eine Schritt-für-Schritt-Anleitung, wie man Power Automate online erhält oder das Power Automate-Desktop-Programm verwenden kann, um einen OCR-fähigen Workflow zu erstellen:

1. Power Automate einrichten

Um zu beginnen, melden Sie sich in Ihrem Power Automate-Konto an oder registrieren Sie sich, wenn Sie noch keines haben. Power Automate ist Teil von Microsoft 365, was bedeutet, dass Sie bereits Zugriff haben, wenn Sie Office 365 oder Dynamics 365 verwenden.

Defektes Bild Von Pixabay hinzufügen, aus Ihren Dateien auswählen oder ein Bild hierher ziehen.

2: Einen neuen Flow erstellen

Öffnen Sie die Registerkarte "Erstellen" und klicken Sie auf "Sofortiger Flow", um einen neuen Flow zu erstellen, der manuell gestartet werden kann.

Defektes Bild Von Pixabay hinzufügen, aus Ihren Dateien auswählen oder ein Bild hierher ziehen.

Benennen Sie Ihren Flow. Zum Beispiel benennen Sie es Vor Genehmigung und wählen Sie den folgenden Auslöser aus: Wenn eine Datei in einem Ordner erstellt wird(SharePoint oder OneDrive)oder einen Flow manuell auslösen.

Defektes Bild Von Pixabay hinzufügen, aus Ihren Dateien auswählen oder ein Bild hierher ziehen.

Ein neuer Power-Automatisierungsablauf wurde wie der untenstehende erstellt.

Power Automate OCR(Entwickler-Tutorial): Abbildung 5 - Neuer Automatisierungsablauf

3: Laden Sie eine Datei auf OneDrive oder SharePoint hoch

Fügen Sie eine Aktion zum Hochladen Ihres Dokuments hinzu(Bild- oder andere PDF-Dateien)zu OneDrive for Business oder SharePoint. Diese Aktion wird den OCR-Prozess auslösen, um Daten zu extrahieren. Für diese Demo verwenden wir eine SharePoint-Dokumentbibliothek.

Power Automate OCR(Entwickler-Tutorial): Abbildung 6 - Datei hochladen

4. Nutzen Sie die OCR-Aktion des AI Builders

Nutzen Sie den AI Builder, um die Aktion Text aus Bildern extrahieren zu entwickeln. AI Builder ist eine tief integrierte Funktion für maschinelles Lernen in Power Automate und verfügt über vortrainierte OCR-Modelle, mit denen Benutzer Text aus Bildern oder PDFs einfach erkennen können.

Power Automate OCR(Entwickler-Tutorial): Abbildung 7 - AI Builder

Wählen Sie die Bilddatei aus, aus der der Text extrahiert werden soll.

Power Automate OCR(Entwickler-Tutorial): Abbildung 8 - Bild auswählen

5. Verarbeitung extrahierter Daten

Sobald die Sprachdaten durch OCR als Text extrahiert wurden, können sie zur weiteren Verarbeitung weitergeleitet werden. Zum Beispiel:

Speichern Sie den extrahierten Text im Excel-Format: Verwenden Sie die Aktion "Zeile hinzufügen", um den extrahierten Text in einer Excel-Datei hinzuzufügen.

Den Text per E-Mail weiterleiten: Verwenden Sie die Aktion, um eine E-Mail zu senden und den extrahierten Text an bestimmte Empfänger weiterzuleiten.

In der Datenbank speichern: Verwenden von Connectors, um Daten in SQL Server, SharePoint-Listen oder andere Datenbanken zur Speicherung zu übertragen.

Was ist IronOCR?

IronOCRist eine leistungsstarke .NET OCR-Bibliothek, die es Ihnen ermöglicht, Text korrekt mit OCR aus Bildern, PDFs und Scans zu extrahieren. Es wird dort glänzen, wo andere Bibliotheken bei der Texterkennung aufgrund schlechter Bildqualität oder verrauschter Bilder versagen, und es unterstützt über 125 Sprachen, was es perfekt für mehrsprachige Anwendungsfälle mit Vielfalt macht. IronOCR umfasst eine Vielzahl fortschrittlicher Funktionen wie die automatische Erkennung von Sprache und die Vorverarbeitung von Bildrauschen sowie Schräglagenkorrektur, ähnlich wie das gleiche Layoutdokument einschließlich aller Stile sowie der Strukturdetails und Bild-zu-Text sowie PDF-zu-Text mit durchsuchbarem PDF.

Power Automate OCR(Entwickler-Tutorial): Abbildung 9 - IronOCR

Das Produkt kann mühelos über einfache .NET-Projekt-APIs integriert werden, die es den Entwicklern ermöglichen, OCR in einer von ihnen entwickelten Anwendung zu nutzen. Die Bibliothek ist nützlich bei der Dokumentendigitalisierung, bei automatisierten Workflows für die Dateneingabe und bei Textextraktionsaufgaben mit hoher Genauigkeit und Skalierbarkeit für Anwendungen auf Unternehmensebene. Seine Stärke liegt darin, dass die Bibliothek Benutzerfreundlichkeit findet und leistungsstarke OCR-Fähigkeiten bietet.

Merkmale von IronOCR

  • Es hat eine hervorragende Genauigkeit bei dem Text, den es extrahiert, selbst aus Bildern mit niedriger Auflösung und verrauschten gescannten Dokumenten.
  • Es unterstützt mehr als 125 Sprachen mit automatischer Spracherkennung, wodurch OCR in unterschiedlichen sprachlichen Umgebungen ermöglicht wird.
  • Die Vorverarbeitung eines Bildes erfordert Werkzeuge wie Rauschunterdrückung, Schiefkorrektur, Kontrastverstärkung und Schärfung, die alle die Leistung bei unvollkommenen Bildern verbessern.
  • Erstellen Sie durchsuchbare PDFs im Volltext. Die gescannten Papierdokumente oder Bilder werden in vollständig durchsuchbare PDFs mit dem ursprünglichen Layout umgewandelt, um die Suche und Organisation zu erleichtern.
  • Layout und Formatierung bewahren: Dieses Tool erhält die Struktur, Schriftarten sowie die Formatierung des Quelldokuments bei, da Layouts wie Tabellen und Spalten komplex sind und bei der Digitalisierung erhalten bleiben müssen.
  • Stapelverarbeitung: Dies ermöglicht die Stapelverarbeitung mehrerer Bilder oder Dokumente in einem Arbeitsgang. Die Technologie unterstützt die Bearbeitung von Dokumenten mit großem Volumen.
  • Einfache Integration mit .NET: Da es eine einfache API unterstützt, kann es problemlos in .NET-Anwendungen integriert werden, was einen leicht zu implementierenden Mechanismus für OCR darstellt, ohne großen Aufwand seitens der Entwickler.

    Beispielcode zur Durchführung von OCR

using IronOcr;
class Program
{
    static void Main(string[] args)
    {
        // Initialize Iron Tesseract OCR engine variable
        var Ocr = new IronTesseract();
        // Add multiple languages
        Ocr.Language = OcrLanguage.English;
        // Image file path
        var inputFile = @"path\to\your\image.png";
        // Read the image and perform OCR
        using (var input = new OcrInput(inputFile))
        {
            // Perform OCR
            var result = Ocr.Read(input);
            // Display the result
            Console.WriteLine("Text:");
            Console.WriteLine(result.Text);
        }
    }
}
using IronOcr;
class Program
{
    static void Main(string[] args)
    {
        // Initialize Iron Tesseract OCR engine variable
        var Ocr = new IronTesseract();
        // Add multiple languages
        Ocr.Language = OcrLanguage.English;
        // Image file path
        var inputFile = @"path\to\your\image.png";
        // Read the image and perform OCR
        using (var input = new OcrInput(inputFile))
        {
            // Perform OCR
            var result = Ocr.Read(input);
            // Display the result
            Console.WriteLine("Text:");
            Console.WriteLine(result.Text);
        }
    }
}
Imports IronOcr
Friend Class Program
	Shared Sub Main(ByVal args() As String)
		' Initialize Iron Tesseract OCR engine variable
		Dim Ocr = New IronTesseract()
		' Add multiple languages
		Ocr.Language = OcrLanguage.English
		' Image file path
		Dim inputFile = "path\to\your\image.png"
		' Read the image and perform OCR
		Using input = New OcrInput(inputFile)
			' Perform OCR
			Dim result = Ocr.Read(input)
			' Display the result
			Console.WriteLine("Text:")
			Console.WriteLine(result.Text)
		End Using
	End Sub
End Class
VB   C#

Schlussfolgerung

Obwohl sowohl IronOCR als auch Power Automate OCR in Bezug auf die Texterkennung sehr leistungsstark sind, ist IronOCR erheblich robuster und vielseitiger in seiner Lösung für Entwickler oder Unternehmen, die ernsthafte OCR-Fähigkeiten benötigen, die über die einfachen Fälle hinausgehen, die von Power Automate OCR unterstützt werden. Im Gegensatz dazu ist die OCR-Engine von Power Automate für einfache Workflows konzipiert und erfordert möglicherweise ein zusätzliches Abonnement.

Im Gegensatz dazu zeichnet sich IronOCR dadurch aus, dass es sehr hochwertige Ergebnisse liefert, selbst wenn es mit Eingabebildern von geringer Qualität arbeitet. Es unterstützt über 125 Sprachen mit einer kraftvollen Formatierung und Layout-Beibehaltung. Seine komplexe Dokumentenverarbeitung und umfangreiche Stapelverarbeitung sind gut geeignet für fortschrittliche Bildvorverarbeitungskapazitäten. Dennoch ist es in .NET-Anwendungen äußerst anpassbar.

Während Power Automate OCR für kleinere Automatisierungen oder für Integrationen, die streng in Microsoft aufgebaut sind, ausreichend ist, hat IronOCR die Nase vorn durch den Grad der Benutzerkontrolle, maximale Genauigkeit und sogar Funktionen wie die Erstellung durchsuchbarer PDFs, die mehrere Formate unterstützen.

In Organisationen, die nach einer leistungsstarken, anpassbaren OCR-Lösung ohne Plattformbeschränkungen suchen,IronOCR. Iron Software bietet Entwicklern verschiedene Arten von Bibliotheken an, um dieBibliothekssuite-Seite um mehr zu erfahren.

NÄCHSTES >
Easyocr vs Tesseract (Vergleich der OCR-Funktionen)

Sind Sie bereit, loszulegen? Version: 2024.11 gerade veröffentlicht

Gratis NuGet-Download Downloads insgesamt: 2,791,504 Lizenzen anzeigen >