Przejdź do treści stopki
NARZęDZIA OCR

Power Automate OCR (samouczek dla programistów)

Optyczne rozpoznawanie znaków (OCR) to technologia, która skanuje tekst z obrazów, zeskanowanych dokumentów i plików PDF w celu przekształcenia go w tekst nadający się do odczytu maszynowego. OCR umożliwia komputerom identyfikację różnych formatów — książek, paragonów, formularzy i zdjęć — które można zdigitalizować i zautomatyzować w celu ekstrakcji danych do plików PDF. Analizuje znaki na obrazie i ich wzorce, a następnie przyporządkowuje je do tekstu. Ta technologia optycznego rozpoznawania znaków (OCR) jest wykorzystywana w aplikacjach do digitalizacji dokumentów, automatycznego wyodrębniania i wprowadzania danych z plików PDF, przetwarzania faktur oraz umożliwiania przeszukiwania zeskanowanych plików PDF.

Programy OCR znacznie się poprawiły i potrafią rozpoznawać oraz odczytywać różne języki, które obecnie są trudne do zrozumieniuiuiuiuia pod względem układu, takie jak tabele i kolumny. Oprogramowanie z zaawansowanymi funkcjami OCR wykorzystuje również techniki wstępnego przetwarzania obrazów. Obejmują one usuwanie szumów i regulację kontrastu, poprawiając dokładność oprogramowania OCR w odczytywaniu obrazów o niskiej jakości. Trzy najpopularniejsze narzędzia OCR to silnik Tesseract OCR, Power Automate oraz IronOCR, charakteryzujące się wysoką dokładnością i elastycznością. Programy OCR stały się niezbędnymi narzędziami dla firm, badaczy i programistów, umożliwiającymi outsourcing zarządzania dokumentacją i rozpoznawania tekstu.

Czym jest Microsoft Power Automate OCR?

Optyczne rozpoznawanie znaków w Microsoft Power Automate: Dzięki tej funkcji firmy mogą zautomatyzować proces wyodrębniania tekstu z obrazów, zeskanowanych dokumentów i plików PDF do formatów łatwych do edycji i czytelnych dla komputerów. Jako część platformy Microsoft Power Platform, aplikacja Power Automate na komputery stacjonarne i wersja online umożliwia użytkownikom tworzenie przepływów bez konieczności posiadania umiejętności programistycznych. Dzięki integracji OCR z procesami roboczymi mogą one zautomatyzować żmudne wprowadzanie danych, przetwarzać faktury i digitalizować dokumenty.

Pozwala to zaoszczędzić czas i zminimalizować liczbę błędów. Jest to rzeczywiście potężne narzędzie wyszukiwania, które obsługuje wiele różnych formatów i języków w funkcji OCR platformy Power Automate. Zbudowany przy użyciu AI Builder, wspiera wykorzystanie rozpoznawania tekstu w wielu branżach. Integruje się płynnie z innymi usługami Microsoftu, w tym Excelem, SharePointem i OneDrive, umożliwiając kompleksową automatyzację od skanowania dokumentu po jego przechowywanie, a nawet udostępnianie. Pomaga to organizacjom zwiększyć wydajność, usprawnić zarządzanie dokumentami i poprawić dokładność operacyjną w ich działaniach.

Korzyści z wdrożenia OCR w Power Automate

Wdrożenie OCR w Power Automate ma następujące zalety:

Oszczędność czasu i pracy: Automatyzacja wyodrębniania tekstu z dokumentów pozwala zaoszczędzić znaczną ilość czasu i wysiłku, które w przeciwnym razie zostałyby poświęcone na ręczne wprowadzanie danych.

Oszczędność: Przyjazne dla użytkownika i dostępne, co eliminuje potrzebę stosowania kosztownych, niestandardowych rozwiązań programowych.

Integracja: Microsoft Power Automate oferuje płynną integrację z innymi usługami Microsoft 365, takimi jak SharePoint, OneDrive, a nawet Excel.

Skalowalność: może obsługiwać tysiące dokumentów jednocześnie, dzięki czemu nadaje się dla dużych przedsiębiorstw.

Ograniczanie błędów: Automatyzacja procesów wprowadzania danych minimalizuje ryzyko wystąpienia błędu ludzkiego.

Jak korzystać z funkcji OCR w Power Automate

Power Automate obsługuje funkcję OCR poprzez kilka różnych połączeń, w tym AI Builder i OneDrive. Oto przewodnik krok po kroku, jak utworzyć przepływ pracy z obsługą OCR przy użyciu Power Automate online lub na komputerze stacjonarnym:

1. Skonfiguruj Power Automate

Aby rozpocząć, zaloguj się na swoje konto Power Automate lub zarejestruj się, jeśli jeszcze go nie masz. Power Automate jest częścią pakietu Microsoft 365, co oznacza, że masz już do niego dostęp, jeśli korzystasz z Office 365 lub Dynamics 365.

2. Utwórz nowy przepływ

Otwórz kartę Utwórz i kliknij opcję Natychmiastowy przepływ, aby utworzyć nowy przepływ, który można uruchomić ręcznie.

Nadaj nazwę swojemu przepływowi. Na przykład nazwij go "Przed zatwierdzeniem" i wybierz następujący wyzwalacz: Gdy plik zostanie utworzony w folderze (SharePoint lub OneDrive) lub Ręcznie uruchom przepływ.

Tworzony jest nowy przepływ Power Automation, podobny do tego pokazanego poniżej.

Power Automate OCR (samouczek dla programistów): Rysunek 5 — Nowy przepływ automatyzacji

3. Prześlij plik do OneDrive lub SharePoint

Dodaj akcję, aby przesłać swój dokument (obraz lub plik PDF) do OneDrive dla Firm lub SharePoint. Ta czynność uruchomi proces OCR w celu wyodrębnienia danych. W tym demo używamy biblioteki dokumentów SharePoint.

Power Automate OCR (samouczek dla programistów): Rysunek 6 — Prześlij plik

4. Wykorzystaj akcję OCR w AI Builder

Wykorzystaj Builder do opracowania akcji "Wyodrębnij tekst z obrazów". AI Builder to głęboko zintegrowana funkcja uczenia maszynowego w Power Automate, wyposażona w wstępnie wytrenowane modele OCR, które pozwalają użytkownikom łatwo identyfikować tekst z obrazów lub plików PDF.

Power Automate OCR (samouczek dla programistów): Rysunek 7 — AI Builder

Wybierz plik graficzny, z którego chcesz wyodrębnić tekst.

Power Automate OCR (samouczek dla programistów): Rysunek 8 — Wybierz obraz

5. Przetwarzanie wyodrębnionych danych

Po wyodrębnieniu tekstu za pomocą OCR można go dalej przetwarzać. Na przykład:

Zapisz wyodrębniony tekst w formacie Excel: użyj akcji "Dodaj wiersz", aby wstawić wyodrębniony tekst do pliku Excel.

Prześlij tekst e-mailem: Użyj opcji "Wyślij e-mail", aby przesłać wyodrębniony tekst do określonych odbiorców.

Przechowywanie w bazie danych: Użyj łączników, aby przesłać dane do serwera SQL, list SharePoint lub innych baz danych w celu przechowywania.

Czym jest IronOCR?

IronOCR to potężna biblioteka OCR dla platformy .NET, która pozwala na dokładne wyodrębnianie tekstu za pomocą OCR z obrazów, plików PDF i skanów. Wyróżnia się tam, gdzie inne biblioteki mogą mieć trudności z rozpoznawaniem tekstu z powodu słabej jakości obrazu lub zakłóceń, i obsługuje ponad 125 języków, co czyni ją idealną do zastosowań wielojęzycznych. IronOCR zawiera zaawansowane funkcje, takie jak automatyczne wykrywanie języka, wstępne przetwarzanie obrazów, usuwanie szumów, korekcja przekrzywienia oraz konwersja dokumentów do formatu PDF z możliwością wyszukiwania przy zachowaniu oryginalnego układu.

Power Automate OCR (samouczek dla programistów): Rysunek 9 — IronOCR

Produkt można łatwo włączyć za pomocą prostych interfejsów API projektu .NET, co pozwala programistom na wdrożenie OCR w tworzonych przez nich aplikacjach. Biblioteka jest szczególnie przydatna do digitalizacji dokumentów, automatycznych procesów wprowadzania danych oraz zadań związanych z ekstrakcją tekstu, zapewniając wysoką dokładność i skalowalność w aplikacjach na poziomie Enterprise. Jego zaletami są łatwość obsługi i zaawansowane możliwości OCR.

Funkcje IronOCR

  • Wyjątkowa precyzja wyodrębniania tekstu, nawet z obrazów o niskiej rozdzielczości i zaszumionych dokumentów zeskanowanych.
  • Obsługuje ponad 125 języków, z automatycznym wykrywaniem języka do użytku w zróżnicowanych środowiskach językowych.
  • Oferuje narzędzia do wstępnego przetwarzania obrazów, takie jak redukcja szumów, korekcja przekrzywienia, wzmocnienie kontrastu i wyostrzanie, w celu poprawy jakości obrazów o niskiej rozdzielczości.
  • Tworzy pliki PDF z możliwością wyszukiwania pełnotekstowego, konwertując zeskanowane dokumenty lub obrazy na pliki PDF z możliwością pełnego wyszukiwania, zachowując oryginalny układ.
  • Zachowuje układ i formatowanie, utrzymując strukturę, czcionki i formatowanie dokumentów źródłowych, co jest niezbędne w przypadku złożonych dokumentów zawierających tabele i kolumny.
  • Przetwarzanie wsadowe: Umożliwia przetwarzanie wsadowe wielu obrazów lub dokumentów w ramach jednej operacji, obsługując przetwarzanie dokumentów o dużej objętości.
  • Łatwa integracja z .NET: Obsługuje proste API umożliwiające łatwą integrację z aplikacjami .NET, co pozwala programistom na wdrożenie OCR bez większego wysiłku.

Przykładowy kod do wykonania OCR

using IronOcr;

class Program
{
    static void Main(string[] args)
    {
        // Initialize Iron Tesseract OCR engine
        var Ocr = new IronTesseract();

        // Set language
        Ocr.Language = OcrLanguage.English;

        // Path to the image file
        var inputFile = @"path\to\your\image.png";

        // Read the image and perform OCR
        using (var Input = new OcrInput(inputFile))
        {
            // Perform OCR
            var Result = Ocr.Read(Input);

            // Display the extracted text in the console
            Console.WriteLine("Extracted Text:");
            Console.WriteLine(Result.Text);
        }
    }
}
using IronOcr;

class Program
{
    static void Main(string[] args)
    {
        // Initialize Iron Tesseract OCR engine
        var Ocr = new IronTesseract();

        // Set language
        Ocr.Language = OcrLanguage.English;

        // Path to the image file
        var inputFile = @"path\to\your\image.png";

        // Read the image and perform OCR
        using (var Input = new OcrInput(inputFile))
        {
            // Perform OCR
            var Result = Ocr.Read(Input);

            // Display the extracted text in the console
            Console.WriteLine("Extracted Text:");
            Console.WriteLine(Result.Text);
        }
    }
}
Imports IronOcr

Friend Class Program
	Shared Sub Main(ByVal args() As String)
		' Initialize Iron Tesseract OCR engine
		Dim Ocr = New IronTesseract()

		' Set language
		Ocr.Language = OcrLanguage.English

		' Path to the image file
		Dim inputFile = "path\to\your\image.png"

		' Read the image and perform OCR
		Using Input = New OcrInput(inputFile)
			' Perform OCR
			Dim Result = Ocr.Read(Input)

			' Display the extracted text in the console
			Console.WriteLine("Extracted Text:")
			Console.WriteLine(Result.Text)
		End Using
	End Sub
End Class
$vbLabelText   $csharpLabel

Wnioski

Chociaż zarówno IronOCR, jak i Power Automate OCR są bardzo wydajne w rozpoznawaniu tekstu, IronOCR jest znacznie bardziej niezawodny i wszechstronny w swoich rozwiązaniach dla każdego programisty lub firmy potrzebującej poważnych możliwości OCR wykraczających poza proste przypadki obsługiwane przez Power Automate OCR. Silnik OCR w Power Automate jest przeznaczony do prostych przepływów pracy i może wymagać dodatkowej subskrypcji.

Natomiast IronOCR wyróżnia się wysoką jakością wyników, nawet w przypadku obrazów wejściowych o niskiej jakości. Obsługuje ponad 125 języków z zachowaniem formatowania i układu. Jego możliwości w zakresie przetwarzania złożonych dokumentów i operacji na dużych partiach są dobrze wspierane przez zaawansowane opcje wstępnego przetwarzania obrazów. Można go w dużym stopniu dostosować do potrzeb w aplikacjach .NET.

Power Automate OCR wystarcza do niewielkiej automatyzacji lub integracji wyłącznie w ekosystemie Microsoft, natomiast IronOCR wyróżnia się maksymalną dokładnością i kontrolą, obsługując funkcje takie jak tworzenie plików PDF z możliwością wyszukiwania, które obsługują wiele formatów.

Organizacjom poszukującym wydajnego, konfigurowalnego rozwiązania OCR bez ograniczeń platformowych zaleca się IronOCR. Iron Software oferuje programistom szeroki wybór bibliotek. Więcej szczegółów można znaleźć na stronie poświęconej Suite bibliotek.

Kannaopat Udonpant
Inżynier oprogramowania
Zanim stał się inżynierem oprogramowania, Kannapat ukończył doktorat z zasobów środowiskowych na Uniwersytecie Hokkaido w Japonii. W czasie studiowania, Kannapat również został członkiem Laboratorium Robotyki Pojazdów, które jest częścią Wydziału Inżynierii Bioprodukcji. W 2022 roku wykorzystał swoje umiejętności w ...
Czytaj więcej

Zespol wsparcia Iron

Jestesmy online 24 godziny, 5 dni w tygodniu.
Czat
Email
Zadzwon do mnie