Wydobywanie tekstu z obrazu za pomocą oprogramowania uczenia maszynowego
Ekstrakcja tekstu z obrazów tekstowych lub zeskanowanych dokumentów przy użyciu uczenia maszynowego to rozwijająca się dziedzina na styku wizji komputerowej i przetwarzania języka naturalnego. Technologia ta wykorzystuje zaawansowane algorytmy uczenia maszynowego, rozpoznawania obiektów, zaawansowane oprogramowanie graficzne, dark i deep web oraz architektury sieci neuronowych do dokładnego identyfikowania i ekstrakcji informacji tekstowych z obrazów oraz zeskanowanych dokumentów papierowych. Dzięki zastosowaniu różnych technologii uczenia maszynowego, takich jak optyczne rozpoznawanie znaków (OCR) i uczenie głębokie, umożliwia ona automatyczną i efektywną konwersję wykrywania tekstu wizualnej sceny w edytowalne i przeszukiwalne dane strukturalne oraz wykrywanie obiektów.
W tej dynamicznie rozwijającej się dziedzinie badacze i praktycy nieustannie dążą do poprawy dokładności, szybkości i wszechstronności, co czyni wykrywanie i ekstrakcję tekstu z obrazów, danych maszynowo czytelnych i zeskanowanych dokumentów kluczowym komponentem zastosowań, takich jak cyfryzacja drukowanych dokumentów, indeksowanie treści, tłumaczenie i zwiększanie dostępności.
W tym artykułe omówimy, jak można wyodrębnić tekst z obrazów przy użyciu IronOCR, biblioteki OCR napędzanej potężnymi algorytmami uczącymi maszynowo oraz funkcjami związanymi z tekstem. Ekstrakcja tekstu, znana również jako ekstrakcja słów kluczowych, opiera się na uczeniu maszynowym, aby automatycznie skanować i wyciągać istotne lub podstawowe słowa i frazy z nieustrukturyzowanych danych lub centralnej bazy danych firmy.
Jak wyodrębnić tekst z obrazu za pomocą uczenia maszynowego?
- Pobierz bibliotekę C# do ekstrakcji tekstu z obrazów.
- Załaduj konkretny obraz, tworząc instancję obiektu OcrInput do rozpoznawania tekstu scen.
- Wyodrębnij dane z obrazu, używając metody ocrTesseract.Read.
- Wyświetl wyodrębniony tekst w konsoli, używając metody Console.WriteLine.
- Wykonaj OCR na regionie obrazu za pomocą obiektu CropRectangle.
IronOCR - Biblioteka OCR (Optical Character Recognition)
IronOCR, wyróżniające się i zaawansowane oprogramowanie do optycznego rozpoznawania znaków (OCR), stoi na czele technologii ekstrakcji tekstu z obrazów i dokumentów. Opracowana przez Iron Software, ten potężny silnik OCR został zaprojektowany, aby dokładnie i efektywnie konwertować zeskanowane obrazy, PDF-y czy nawet zdjęcia tekstu na edytowalną i przeszukiwalną zawartość cyfrową. Dzięki zręcznemu wykorzystaniu algorytmów uczenia maszynowego i sieci neuronowych IronOCR zapewnia solidne rozwiązanie dla różnych zastosowań, w tym ekstrakcji danych, indeksowania treści i procesów automatyzacji wymagających precyzyjnego rozpoznawania tekstu.
Jego zdolność do obsługi wielu języków i różnorodnych czcionek czyni go wszechstronnym narzędziem zarówno dla deweloperów, jak i firm poszukujących uproszczonych możliwości ekstrakcji algorytmów rozpoznawania tekstu w ich oprogramowaniu i aplikacjach. Możesz użyć IronOCR do automatycznego skanowania tekstu przy użyciu powszechnej techniki rozpoznawania tekstu, która konwertuje nieustrukturyzowane dane w doskonale zeskanowaną stronę przy użyciu algorytmów ekstrakcji tekstu.
Instalacja IronOCR
IronOCR można zainstalować za pomocą Menedżera pakietów NuGet. Oto kroki, aby zainstalować IronOCR:
- Najpierw stwórz nowy projekt C# w Visual Studio lub otwórz istniejący.

- Gdy projekt zostanie utworzony, przejdź do menu Tools na górze i wybierz NuGet Package Manager, a następnie NuGet Package Manager for Solution.

- Na ekranie pojawi się nowe okno. Przejdź do zakładki Przeglądaj i wpisz IronOCR w pasku wyszukiwania.
- Pojawi się lista pakietów IronOCR. Wybierz najnowszy i kliknij zainstaluj.

- Zajmie to kilka sekund w zależności od Twojego internetu; po tym IronOCR jest gotowy do użycia w Twoim projekcie C#.
Wykrywanie tekstu z obrazów na edytowalne i przeszukiwalne dane
Używając IronOCR, można łatwo wyodrębnić tekst za pomocą technik przetwarzania obrazów i uczenia maszynowego. W tej sekcji omówimy, jak wydobywać tekst z obrazów przy użyciu IronOCR.
using IronOcr;
using System;
// Create a new instance of the IronTesseract class
var ocrTesseract = new IronTesseract();
// Specify the image path and perform OCR on the image
using (var ocrInput = new OcrInput(@"images\image.png"))
{
var ocrResult = ocrTesseract.Read(ocrInput);
// Print the extracted text to the console
Console.WriteLine(ocrResult.Text);
}
using IronOcr;
using System;
// Create a new instance of the IronTesseract class
var ocrTesseract = new IronTesseract();
// Specify the image path and perform OCR on the image
using (var ocrInput = new OcrInput(@"images\image.png"))
{
var ocrResult = ocrTesseract.Read(ocrInput);
// Print the extracted text to the console
Console.WriteLine(ocrResult.Text);
}
Imports IronOcr
Imports System
' Create a new instance of the IronTesseract class
Private ocrTesseract = New IronTesseract()
' Specify the image path and perform OCR on the image
Using ocrInput As New OcrInput("images\image.png")
Dim ocrResult = ocrTesseract.Read(ocrInput)
' Print the extracted text to the console
Console.WriteLine(ocrResult.Text)
End Using
Ten kod C# demonstruje użycie IronOCR, biblioteki do optycznego rozpoznawania znaków (OCR). Oto wyjaśnienie krok po kroku:
-
Importowanie bibliotek:
using IronOcr; using System;using IronOcr; using System;Imports IronOcr Imports System$vbLabelText $csharpLabelKod rozpoczyna się od importowania niezbędnych bibliotek, w tym IronOcr, która dostarcza funkcji OCR oraz przestrzeni nazw System dla ogólnych funkcji.
-
Inicjalizacja IronTesseract i ładowanie obrazu:
var ocrTesseract = new IronTesseract();var ocrTesseract = new IronTesseract();Dim ocrTesseract As New IronTesseract()$vbLabelText $csharpLabelTa linia tworzy instancję IronTesseract, czyli silnika OCR dostarczanego przez IronOCR.
using (var ocrInput = new OcrInput(@"images\image.png"))using (var ocrInput = new OcrInput(@"images\image.png"))Using ocrInput As New OcrInput("images\image.png")$vbLabelText $csharpLabelObiekt OcrInput jest inicjalizowany ścieżką do obrazu, który ma być przetworzony. W tym przypadku plik graficzny to "image.png" w katalogu "images".
-
Wykonanie OCR i wyodrębnienie tekstu:
var ocrResult = ocrTesseract.Read(ocrInput);var ocrResult = ocrTesseract.Read(ocrInput);Dim ocrResult = ocrTesseract.Read(ocrInput)$vbLabelText $csharpLabelTa linia wywołuje metodę Read instancji IronTesseract, przekazując obiekt OcrInput. Metoda ta wykonuje OCR na przekazanym obrazie i ekstraktu tekstu.
-
Wyświetlanie wyodrębnionego tekstu:
Console.WriteLine(ocrResult.Text);Console.WriteLine(ocrResult.Text);Console.WriteLine(ocrResult.Text)$vbLabelText $csharpLabelOstatecznie, wyodrębniony tekst zostaje wyświetlony w konsoli przy użyciu Console.WriteLine, prezentując wynik OCR uzyskany z obrazu.
Ten fragment kodu używa IronOCR do wykonania OCR na rozpoznawaniu tekstu z określonego obrazu i wyjście wyodrębnionego tekstu do konsoli.
Obraz wejściowy

Wynik

Wykonaj OCR na określonym regionie obrazu
Możesz również wykonywać OCR na określonych regionach na obrazie za pomocą IronOCR. Oto przykład kodu:
using IronOcr;
using IronSoftware.Drawing;
using System;
// Create a new instance of the IronTesseract class
var ocrTesseract = new IronTesseract();
// Specify the region on the image to be processed
using (var ocrInput = new OcrInput())
{
var ContentArea = new CropRectangle(x: 20, y: 20, width: 400, height: 50);
// Add the image with the defined content area
ocrInput.AddImage("r3.png", ContentArea);
// Perform OCR on the specified region and extract text
var ocrResult = ocrTesseract.Read(ocrInput);
// Print the extracted text to the console
Console.WriteLine(ocrResult.Text);
}
using IronOcr;
using IronSoftware.Drawing;
using System;
// Create a new instance of the IronTesseract class
var ocrTesseract = new IronTesseract();
// Specify the region on the image to be processed
using (var ocrInput = new OcrInput())
{
var ContentArea = new CropRectangle(x: 20, y: 20, width: 400, height: 50);
// Add the image with the defined content area
ocrInput.AddImage("r3.png", ContentArea);
// Perform OCR on the specified region and extract text
var ocrResult = ocrTesseract.Read(ocrInput);
// Print the extracted text to the console
Console.WriteLine(ocrResult.Text);
}
Imports IronOcr
Imports IronSoftware.Drawing
Imports System
' Create a new instance of the IronTesseract class
Private ocrTesseract = New IronTesseract()
' Specify the region on the image to be processed
Using ocrInput As New OcrInput()
Dim ContentArea = New CropRectangle(x:= 20, y:= 20, width:= 400, height:= 50)
' Add the image with the defined content area
ocrInput.AddImage("r3.png", ContentArea)
' Perform OCR on the specified region and extract text
Dim ocrResult = ocrTesseract.Read(ocrInput)
' Print the extracted text to the console
Console.WriteLine(ocrResult.Text)
End Using
Ten kod w języku C# wykorzystuje bibliotekę IronOCR do optycznego rozpoznawania znaków (OCR). Najpierw importuje niezbędne biblioteki, w tym biblioteka IronOCR i System. Tworzona jest instancja IronTesseract, silnika OCR. Kod wyznacza konkretny obszar ContentArea na obrazie, który ma zostać przetworzony przy użyciu CropRectangle, skupiając się na zdefiniowanym regionie. Następnie obraz ("r3.png") znajdujący się w tym wyznaczonym obszarze jest dodawany do przetwarzania OCR. Silnik OCR odczytuje określony obszar treści, wyodrębnia tekst, a wynikowy tekst jest wyświetlany w konsoli za pomocą Console.WriteLine.
Wynik

Wnioski
Wydobywanie tekstu z obrazów za pomocą uczenia maszynowego, w szczególności z wykorzystaniem bibliotek optycznego rozpoznawania znaków (OCR), takich jak IronOCR, stanowi przełomowy krok na styku wizji komputerowej i przetwarzania języka naturalnego. Zarówno technologia OCR, jak i techniki głębokiego uczenia się odgrywają kluczową rolę w skutecznym przekształcaniu tekstu wizualnego w dane edytowalne i przeszukiwalne, służąc istotnym celom, takim jak digitalizacja dokumentów, indeksowanie treści i poprawa dostępności.
IronOCR, jako czołowa biblioteka OCR, stanowi przykład potencjału tej fuzji, wyróżniając się precyzyjną konwersją zeskanowanych obrazów i plików PDF na cyfrową, edytowalną treść w wielu językach i stylach czcionek. Jego płynna integracja z językami programowania, takimi jak C#, pozwala na usprawnione wdrażanie, jeszcze bardziej wzmacniając transformacyjny wpływ ekstrakcji tekstu z obrazów w wielu aplikacjach i dziedzinach.
Aby dowiedzieć się więcej o IronOCR i wszystkich powiązanych funkcjach, kliknij ten link. Pełny samouczek dotyczący wyodrębniania tekstu z obrazów jest dostępny pod poniższym linkiem. Licencję IronOCR można nabyć pod tym linkiem.