BIAłE KSIęGI

Wydobywanie tekstu z obrazu za pomocą oprogramowania uczenia maszynowego

TECHNOLOGIA

Ekstrakcja tekstu z obrazów tekstowych lub zeskanowanych dokumentów przy użyciu uczenia maszynowego to rozwijająca się dziedzina na styku wizji komputerowej i przetwarzania języka naturalnego. Technologia ta wykorzystuje zaawansowane algorytmy uczenia maszynowego, rozpoznawania obiektów, zaawansowane oprogramowanie graficzne, dark i deep web oraz architektury sieci neuronowych do dokładnego identyfikowania i ekstrakcji informacji tekstowych z obrazów oraz zeskanowanych dokumentów papierowych. Dzięki zastosowaniu różnych technologii uczenia maszynowego, takich jak optyczne rozpoznawanie znaków (OCR) i uczenie głębokie, umożliwia ona automatyczną i efektywną konwersję wykrywania tekstu wizualnej sceny w edytowalne i przeszukiwalne dane strukturalne oraz wykrywanie obiektów.

W tej dynamicznie rozwijającej się dziedzinie badacze i praktycy nieustannie dążą do poprawy dokładności, szybkości i wszechstronności, co czyni wykrywanie i ekstrakcję tekstu z obrazów, danych maszynowo czytelnych i zeskanowanych dokumentów kluczowym komponentem zastosowań, takich jak cyfryzacja drukowanych dokumentów, indeksowanie treści, tłumaczenie i zwiększanie dostępności.

W tym artykułe omówimy, jak można wyodrębnić tekst z obrazów przy użyciu IronOCR, biblioteki OCR napędzanej potężnymi algorytmami uczącymi maszynowo oraz funkcjami związanymi z tekstem. Ekstrakcja tekstu, znana również jako ekstrakcja słów kluczowych, opiera się na uczeniu maszynowym, aby automatycznie skanować i wyciągać istotne lub podstawowe słowa i frazy z nieustrukturyzowanych danych lub centralnej bazy danych firmy.

Jak wyodrębnić tekst z obrazu za pomocą uczenia maszynowego?

  1. Pobierz bibliotekę C# do ekstrakcji tekstu z obrazów.
  2. Załaduj konkretny obraz, tworząc instancję obiektu OcrInput do rozpoznawania tekstu scen.
  3. Wyodrębnij dane z obrazu, używając metody ocrTesseract.Read.
  4. Wyświetl wyodrębniony tekst w konsoli, używając metody Console.WriteLine.
  5. Wykonaj OCR na regionie obrazu za pomocą obiektu CropRectangle.

IronOCR - Biblioteka OCR (Optical Character Recognition)

IronOCR, wyróżniające się i zaawansowane oprogramowanie do optycznego rozpoznawania znaków (OCR), stoi na czele technologii ekstrakcji tekstu z obrazów i dokumentów. Opracowana przez Iron Software, ten potężny silnik OCR został zaprojektowany, aby dokładnie i efektywnie konwertować zeskanowane obrazy, PDF-y czy nawet zdjęcia tekstu na edytowalną i przeszukiwalną zawartość cyfrową. Dzięki zręcznemu wykorzystaniu algorytmów uczenia maszynowego i sieci neuronowych IronOCR zapewnia solidne rozwiązanie dla różnych zastosowań, w tym ekstrakcji danych, indeksowania treści i procesów automatyzacji wymagających precyzyjnego rozpoznawania tekstu.

Jego zdolność do obsługi wielu języków i różnorodnych czcionek czyni go wszechstronnym narzędziem zarówno dla deweloperów, jak i firm poszukujących uproszczonych możliwości ekstrakcji algorytmów rozpoznawania tekstu w ich oprogramowaniu i aplikacjach. Możesz użyć IronOCR do automatycznego skanowania tekstu przy użyciu powszechnej techniki rozpoznawania tekstu, która konwertuje nieustrukturyzowane dane w doskonale zeskanowaną stronę przy użyciu algorytmów ekstrakcji tekstu.

Instalacja IronOCR

IronOCR można zainstalować za pomocą Menedżera pakietów NuGet. Oto kroki, aby zainstalować IronOCR:

  1. Najpierw stwórz nowy projekt C# w Visual Studio lub otwórz istniejący.

Visual Studio

  1. Gdy projekt zostanie utworzony, przejdź do menu Tools na górze i wybierz NuGet Package Manager, a następnie NuGet Package Manager for Solution.

Narzędzia Menu

  1. Na ekranie pojawi się nowe okno. Przejdź do zakładki Przeglądaj i wpisz IronOCR w pasku wyszukiwania.
  2. Pojawi się lista pakietów IronOCR. Wybierz najnowszy i kliknij zainstaluj.

IronOCR

  1. Zajmie to kilka sekund w zależności od Twojego internetu; po tym IronOCR jest gotowy do użycia w Twoim projekcie C#.

Wykrywanie tekstu z obrazów na edytowalne i przeszukiwalne dane

Używając IronOCR, można łatwo wyodrębnić tekst za pomocą technik przetwarzania obrazów i uczenia maszynowego. W tej sekcji omówimy, jak wydobywać tekst z obrazów przy użyciu IronOCR.

using IronOcr;
using System;

// Create a new instance of the IronTesseract class
var ocrTesseract = new IronTesseract();

// Specify the image path and perform OCR on the image
using (var ocrInput = new OcrInput(@"images\image.png"))
{
    var ocrResult = ocrTesseract.Read(ocrInput);

    // Print the extracted text to the console
    Console.WriteLine(ocrResult.Text);
}
using IronOcr;
using System;

// Create a new instance of the IronTesseract class
var ocrTesseract = new IronTesseract();

// Specify the image path and perform OCR on the image
using (var ocrInput = new OcrInput(@"images\image.png"))
{
    var ocrResult = ocrTesseract.Read(ocrInput);

    // Print the extracted text to the console
    Console.WriteLine(ocrResult.Text);
}
Imports IronOcr
Imports System

' Create a new instance of the IronTesseract class
Private ocrTesseract = New IronTesseract()

' Specify the image path and perform OCR on the image
Using ocrInput As New OcrInput("images\image.png")
	Dim ocrResult = ocrTesseract.Read(ocrInput)

	' Print the extracted text to the console
	Console.WriteLine(ocrResult.Text)
End Using
$vbLabelText   $csharpLabel

Ten kod C# demonstruje użycie IronOCR, biblioteki do optycznego rozpoznawania znaków (OCR). Oto wyjaśnienie krok po kroku:

  1. Importowanie bibliotek:

    using IronOcr;
    using System;
    using IronOcr;
    using System;
    Imports IronOcr
    Imports System
    $vbLabelText   $csharpLabel

    Kod rozpoczyna się od importowania niezbędnych bibliotek, w tym IronOcr, która dostarcza funkcji OCR oraz przestrzeni nazw System dla ogólnych funkcji.

  2. Inicjalizacja IronTesseract i ładowanie obrazu:

    var ocrTesseract = new IronTesseract();
    var ocrTesseract = new IronTesseract();
    Dim ocrTesseract As New IronTesseract()
    $vbLabelText   $csharpLabel

    Ta linia tworzy instancję IronTesseract, czyli silnika OCR dostarczanego przez IronOCR.

    using (var ocrInput = new OcrInput(@"images\image.png"))
    using (var ocrInput = new OcrInput(@"images\image.png"))
    Using ocrInput As New OcrInput("images\image.png")
    $vbLabelText   $csharpLabel

    Obiekt OcrInput jest inicjalizowany ścieżką do obrazu, który ma być przetworzony. W tym przypadku plik graficzny to "image.png" w katalogu "images".

  3. Wykonanie OCR i wyodrębnienie tekstu:

    var ocrResult = ocrTesseract.Read(ocrInput);
    var ocrResult = ocrTesseract.Read(ocrInput);
    Dim ocrResult = ocrTesseract.Read(ocrInput)
    $vbLabelText   $csharpLabel

    Ta linia wywołuje metodę Read instancji IronTesseract, przekazując obiekt OcrInput. Metoda ta wykonuje OCR na przekazanym obrazie i ekstraktu tekstu.

  4. Wyświetlanie wyodrębnionego tekstu:

    Console.WriteLine(ocrResult.Text);
    Console.WriteLine(ocrResult.Text);
    Console.WriteLine(ocrResult.Text)
    $vbLabelText   $csharpLabel

    Ostatecznie, wyodrębniony tekst zostaje wyświetlony w konsoli przy użyciu Console.WriteLine, prezentując wynik OCR uzyskany z obrazu.

Ten fragment kodu używa IronOCR do wykonania OCR na rozpoznawaniu tekstu z określonego obrazu i wyjście wyodrębnionego tekstu do konsoli.

Obraz wejściowy

Faktura

Wynik

Wynik faktury klienta

Wykonaj OCR na określonym regionie obrazu

Możesz również wykonywać OCR na określonych regionach na obrazie za pomocą IronOCR. Oto przykład kodu:

using IronOcr;
using IronSoftware.Drawing;
using System;

// Create a new instance of the IronTesseract class
var ocrTesseract = new IronTesseract();

// Specify the region on the image to be processed
using (var ocrInput = new OcrInput())
{
    var ContentArea = new CropRectangle(x: 20, y: 20, width: 400, height: 50);

    // Add the image with the defined content area
    ocrInput.AddImage("r3.png", ContentArea);

    // Perform OCR on the specified region and extract text
    var ocrResult = ocrTesseract.Read(ocrInput);

    // Print the extracted text to the console
    Console.WriteLine(ocrResult.Text);
}
using IronOcr;
using IronSoftware.Drawing;
using System;

// Create a new instance of the IronTesseract class
var ocrTesseract = new IronTesseract();

// Specify the region on the image to be processed
using (var ocrInput = new OcrInput())
{
    var ContentArea = new CropRectangle(x: 20, y: 20, width: 400, height: 50);

    // Add the image with the defined content area
    ocrInput.AddImage("r3.png", ContentArea);

    // Perform OCR on the specified region and extract text
    var ocrResult = ocrTesseract.Read(ocrInput);

    // Print the extracted text to the console
    Console.WriteLine(ocrResult.Text);
}
Imports IronOcr
Imports IronSoftware.Drawing
Imports System

' Create a new instance of the IronTesseract class
Private ocrTesseract = New IronTesseract()

' Specify the region on the image to be processed
Using ocrInput As New OcrInput()
	Dim ContentArea = New CropRectangle(x:= 20, y:= 20, width:= 400, height:= 50)

	' Add the image with the defined content area
	ocrInput.AddImage("r3.png", ContentArea)

	' Perform OCR on the specified region and extract text
	Dim ocrResult = ocrTesseract.Read(ocrInput)

	' Print the extracted text to the console
	Console.WriteLine(ocrResult.Text)
End Using
$vbLabelText   $csharpLabel

Ten kod w języku C# wykorzystuje bibliotekę IronOCR do optycznego rozpoznawania znaków (OCR). Najpierw importuje niezbędne biblioteki, w tym biblioteka IronOCR i System. Tworzona jest instancja IronTesseract, silnika OCR. Kod wyznacza konkretny obszar ContentArea na obrazie, który ma zostać przetworzony przy użyciu CropRectangle, skupiając się na zdefiniowanym regionie. Następnie obraz ("r3.png") znajdujący się w tym wyznaczonym obszarze jest dodawany do przetwarzania OCR. Silnik OCR odczytuje określony obszar treści, wyodrębnia tekst, a wynikowy tekst jest wyświetlany w konsoli za pomocą Console.WriteLine.

Wynik

Wynik

Wnioski

Wydobywanie tekstu z obrazów za pomocą uczenia maszynowego, w szczególności z wykorzystaniem bibliotek optycznego rozpoznawania znaków (OCR), takich jak IronOCR, stanowi przełomowy krok na styku wizji komputerowej i przetwarzania języka naturalnego. Zarówno technologia OCR, jak i techniki głębokiego uczenia się odgrywają kluczową rolę w skutecznym przekształcaniu tekstu wizualnego w dane edytowalne i przeszukiwalne, służąc istotnym celom, takim jak digitalizacja dokumentów, indeksowanie treści i poprawa dostępności.

IronOCR, jako czołowa biblioteka OCR, stanowi przykład potencjału tej fuzji, wyróżniając się precyzyjną konwersją zeskanowanych obrazów i plików PDF na cyfrową, edytowalną treść w wielu językach i stylach czcionek. Jego płynna integracja z językami programowania, takimi jak C#, pozwala na usprawnione wdrażanie, jeszcze bardziej wzmacniając transformacyjny wpływ ekstrakcji tekstu z obrazów w wielu aplikacjach i dziedzinach.

Aby dowiedzieć się więcej o IronOCR i wszystkich powiązanych funkcjach, kliknij ten link. Pełny samouczek dotyczący wyodrębniania tekstu z obrazów jest dostępny pod poniższym linkiem. Licencję IronOCR można nabyć pod tym linkiem.