Jak przekonwertować obraz na tekst
W obecnej erze cyfrowej przekształcanie treści opartych na obrazach w łatwy do odczytania, edytowalny i przeszukiwalny tekst ma kluczowe znaczenie. Jest to szczególnie ważne w takich sytuacjach, jak archiwizacja dokumentów papierowych, wyodrębnianie kluczowych informacji z obrazów lub digitalizacja materiałów drukowanych. Technologia optycznego rozpoznawania znaków (OCR) oferuje rozwiązanie pozwalające zautomatyzować ten proces konwersji. Jednym z wysoce niezawodnych i wydajnych narzędzi do osiągnięcia tego celu jest IronOCR, solidna biblioteka OCR dla platformy .NET.
W tym artykułe wyjaśnimy, jak przekonwertować obraz na tekst za pomocą IronOCR, oraz omówimy, w jaki sposób ta konwersja może zaoszczędzić czas, zmniejszyć liczbę błędów i usprawnić procesy, takie jak ekstrakcja danych, archiwizacja i przetwarzanie dokumentów.
Jak przekonwertować obraz na tekst
- Pobierz bibliotekę C# do pracy z OCR
- Utwórz nową instancję
IronTesseract - Załaduj obraz za pomocą
OcrImageInput - Odczytaj zawartość obrazu za pomocą
OcrRead - Eksportuj wyniki OCR do pliku tekstowego
Dłączego warto konwertować obraz na tekst?
Istnieje wiele powodów, dla których warto przekonwertować obraz na tekst, między innymi:
- Pobieranie danych: Pobieranie tekstu ze skanowanych dokumentów i obrazów w celu archiwizacji lub przetwarzania danych.
- Edycja zeskanowanych treści: edytuj lub aktualizuj tekst w wcześniej zeskanowanych dokumentach, oszczędzając czas związany z ręcznym przepisywaniem treści.
- Poprawa dostępności: Konwersja materiałów drukowanych na tekst cyfrowy, dzięki czemu stają się one dostępne dla czytników ekranu lub aplikacji zamieniających tekst na mowę.
- Automatyzacja: Zautomatyzuj wprowadzanie i przetwarzanie danych poprzez odczytywanie tekstu z faktur, paragonów lub wizytówek.
Jak rozpocząć konwersję obrazów na tekst
Zanim przyjrzymy się, jak można wykorzystać potężne możliwości IronOCR w zakresie zamiany obrazu na tekst do wyodrębniania tekstu z obrazów, przyjrzyjmy się najpierw ogólnemu procesówi krok po kroku przy użyciu narzędzia online Docsumo. Narzędzia OCR online są przydatną opcją dla osób, które chcą wykonywać sporadyczne, a nawet jednorazowe zadania OCR, ponieważ nie wymagają one żadnej ręcznej konfiguracji. Oczywiście, jeśli musisz regularnie wykonywać zadania OCR, lepszym rozwiązaniem może być dla Ciebie potężne narzędzie OCR, takie jak IronOCR.
- Przejdź do internetowego narzędzia OCR
- Prześlij obraz i rozpocznij proces wyodrębniania
- Pobierz uzyskane dane jako dokument tekstowy
Krok pierwszy: Przejdź do internetowego narzędzia OCR
Aby rozpocząć korzystanie z technologii OCR do wyodrębniania tekstu z plików graficznych, najpierw przechodzimy do internetowego narzędzia do OCR obrazów, z którego chcemy skorzystać.

Krok drugi: Prześlij obraz i rozpocznij proces ekstrakcji
Teraz, klikając przycisk "Prześlij plik", możemy przesłać plik graficzny, z którego chcemy wyodrębnić tekst. Narzędzie natychmiast rozpocznie przetwarzanie obrazu.

Krok trzeci: Pobierz uzyskane dane jako dokument tekstowy
Teraz, gdy przetwarzanie obrazu zostało zakończone, możemy pobrać wyodrębniony tekst jako nowy dokument tekstowy w celu dalszego wykorzystania lub edycji.

Możesz również wyświetlić plik, zaznaczając różne sekcje, aby wyświetlić zawarty w nim tekst. Może to być szczególnie pomocne, jeśli chcesz wyświetlić tylko tekst z określonych sekcji. Następnie nadal można pobrać tekst jako dokument tekstowy, plik XLS lub JSON.

Pierwsze kroki z IronOCR
IronOCR to wszechstronna biblioteka .NET, która umożliwia wykonywanie operacji OCR na obrazach. Dzięki szerokiej gamie funkcji może przetwarzać różne formaty plików (takie jak PNG, JPEG, TIFF i PDF), wykonywać korekcję obrazu, skanować dokumenty specjalistyczne (paszporty, tablice rejestracyjne itp.), dostarczać zaawansowane informacje o zeskanowanych plikach, konwertować zeskanowane dokumenty oraz zaznaczać tekst.
Zainstaluj bibliotekę IronOCR
Zanim zaczniesz odczytywać obrazy za pomocą IronOCR, musisz zainstalować tę bibliotekę, jeśli nie masz jej jeszcze w swoim projekcie. IronOCR można łatwo zainstalować za pomocą NuGet w Visual Studio. Otwórz konsolę menedżera pakietów NuGet i uruchom następujące polecenie:
Install-Package IronOcr
Alternatywnie można zainstalować IronOCR za pośrednictwem strony NuGet Package Manager for Solution, wyszukując IronOCR.

Aby użyć IronOCR w swoim kodzie, upewnij się, że na początku kodu znajduje się odpowiednia instrukcja importu:
using IronOcr;
using IronOcr;
Imports IronOcr
Konwersja obrazu na tekst: podstawowy przykład
Na początek przyjrzyjmy się podstawowemu przykładowi zamiany obrazu na tekst przy użyciu IronOCR. Jest to podstawowa funkcja każdego narzędzia OCR, a w tym przykładzie wykorzystamy plik PNG, którego użyliśmy w narzędziu online. W tym przykładzie najpierw utworzyliśmy instancję klasy IronTesseract i przypisaliśmy ją do zmiennej ocr. Następnie używamy klasy OcrImageInput do utworzenia nowego obiektu OcrImageInput na podstawie dostarczonego pliku obrazu. Wreszcie, metoda Read służy do odczytu tekstu z obrazu i zwraca obiekt OcrResult. Następnie możemy uzyskać dostęp do wyodrębnionego tekstu i wyświetlić go w konsoli za pomocą ocrResult.Text.
using IronOcr;
IronTesseract ocr = new IronTesseract();
// Load the image from which to extract text
using OcrImageInput image = new OcrImageInput("example.png");
// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);
// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
using IronOcr;
IronTesseract ocr = new IronTesseract();
// Load the image from which to extract text
using OcrImageInput image = new OcrImageInput("example.png");
// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);
// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
Imports IronOcr
Private ocr As New IronTesseract()
' Load the image from which to extract text
Private OcrImageInput As using
' Perform OCR to extract text
Private ocrResult As OcrResult = ocr.Read(image)
' Output the extracted text to the console
Console.WriteLine(ocrResult.Text)
Obraz wyjściowy

Obsługa różnych formatów obrazów
IronOCR obsługuje wiele formatów obrazów, takich jak PNG, JPEG, BMP, GIF i TIFF. Proces odczytu tekstu z różnych formatów obrazów pozostaje taki sam, wystarczy tylko załadować plik z odpowiednim rozszerzeniem.
using IronOcr;
IronTesseract ocr = new IronTesseract();
// Load a BMP image
using OcrImageInput image = new OcrImageInput("example.bmp");
// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);
// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
using IronOcr;
IronTesseract ocr = new IronTesseract();
// Load a BMP image
using OcrImageInput image = new OcrImageInput("example.bmp");
// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);
// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
Imports IronOcr
Private ocr As New IronTesseract()
' Load a BMP image
Private OcrImageInput As using
' Perform OCR to extract text
Private ocrResult As OcrResult = ocr.Read(image)
' Output the extracted text to the console
Console.WriteLine(ocrResult.Text)
Poprawa dokładności OCR
Wydajność OCR można poprawić poprzez optymalizację obrazu i konfigurację opcji, takich jak język, rozdzielczość obrazu oraz poziom szumu w obrazie. Oto jak można dostroić OCR, aby zwiększyć dokładność wyodrębniania tekstu z obrazu, którego jakość wymaga poprawy, za pomocą metod DeNoise() i Sharpen():
using IronOcr;
IronTesseract ocr = new IronTesseract();
// Load the image and apply image processing to improve accuracy
using OcrImageInput image = new OcrImageInput("example.png");
image.DeNoise();
image.Sharpen();
// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);
// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
using IronOcr;
IronTesseract ocr = new IronTesseract();
// Load the image and apply image processing to improve accuracy
using OcrImageInput image = new OcrImageInput("example.png");
image.DeNoise();
image.Sharpen();
// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);
// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
Imports IronOcr
Private ocr As New IronTesseract()
' Load the image and apply image processing to improve accuracy
Private OcrImageInput As using
image.DeNoise()
image.Sharpen()
' Perform OCR to extract text
Dim ocrResult As OcrResult = ocr.Read(image)
' Output the extracted text to the console
Console.WriteLine(ocrResult.Text)
Eksport wyodrębnionego tekstu
Teraz, gdy znamy już podstawy procesu przekształcania obrazu na tekst, przyjrzyjmy się, jak możemy wyeksportować uzyskany tekst do późniejszego wykorzystania. W tym przykładzie użyjemy tego samego procesu co poprzednio, aby załadować obraz i go zeskanować. Następnie, używając File.WriteAllText("output.txt", ocrResult.Text), tworzymy nowy plik tekstowy o nazwie output.txt i zapisujemy w nim wyodrębniony tekst.
using IronOcr;
using System.IO;
IronTesseract ocr = new IronTesseract();
// Load the image
using OcrImageInput image = new OcrImageInput("example.png");
// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);
// Save the extracted text to a file
File.WriteAllText("output.txt", ocrResult.Text);
using IronOcr;
using System.IO;
IronTesseract ocr = new IronTesseract();
// Load the image
using OcrImageInput image = new OcrImageInput("example.png");
// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);
// Save the extracted text to a file
File.WriteAllText("output.txt", ocrResult.Text);
Imports IronOcr
Imports System.IO
Private ocr As New IronTesseract()
' Load the image
Private OcrImageInput As using
' Perform OCR to extract text
Private ocrResult As OcrResult = ocr.Read(image)
' Save the extracted text to a file
File.WriteAllText("output.txt", ocrResult.Text)

Najważniejsze cechy IronOCR
- Wysoka dokładność: IronOCR wykorzystuje zaawansowane algorytmy OCR Tesseract i zawiera wbudowane narzędzia do obsługi złożonych obrazów, zapewniając wysoką dokładność.
- Obsługa wielu języków: Obsługuje ponad 125 języków, w tym różne systemy pisma, takie jak alfabet łaciński, cyrylicę, arabski i znaki azjatyckie. Należy jednak zauważyć, że wraz z IronOCR instalowany jest wyłącznie język angielski. Aby korzystać z innych języków, należy zainstalować dodatkowy pakiet językowy dla danego języka.
- OCR plików PDF: IronOCR może wyodrębniać tekst ze zeskanowanych plików PDF, co czyni go cennym narzędziem do digitalizacji dokumentów.
- Czyszczenie obrazów: Zapewnia narzędzia do wstępnego przetwarzania, takie jak prostowanie, usuwanie szumów i inwersja, w celu poprawy jakości obrazu i zwiększenia dokładności OCR.
- Łatwa integracja: API płynnie integruje się z każdym projektem .NET, niezależnie od tego, czy jest to aplikacja konsolowa, aplikacja internetowa czy oprogramowanie desktopowe.
Typowe zastosowania konwersji obrazów na tekst
- Automatyzacja wprowadzania danych: Firmy mogą wykorzystywać OCR do automatycznego wyodrębniania danych z formularzy, paragonów lub wizytówek.
- Archiwizacja dokumentów: Organizacje mogą digitalizować dokumenty fizyczne, dzięki czemu można je przeszukiwać i łatwiej przechowywać.
- Dostępność: Konwersja materiałów drukowanych na tekst do wykorzystania w czytnikach ekranu lub innych technologiach wspomagających.
- Badania i analiza: Szybka konwersja zeskanowanych materiałów badawczych na tekst w celu analizy lub integracji z innymi narzędziami programistycznymi.
- Study: Konwertuj zeskanowane notatki z zajęć na edytowalny tekst, który następnie możesz zapisać jako dokument WORDa w celu dalszej obróbki w narzędziach takich jak IronWord, Microsoft Word lub Google Docs.
Wnioski
Konwersja tekstu z obrazu za pomocą IronOCR to szybki, dokładny i wydajny sposób na realizację zadań związanych z przetwarzaniem dokumentów. Niezależnie od tego, czy pracujesz ze skanowanymi dokumentami, obrazami cyfrowymi czy dokumentami PDF, IronOCR upraszcza ten proces, zapewniając wysoką dokładność, obsługę wielu języków oraz potężne narzędzia do przetwarzania obrazów. To narzędzie jest idealne dla firm, które chcą usprawnić procesy zarządzania dokumentami, zautomatyzować pozyskiwanie danych lub zwiększyć dostępność.
Skorzystaj z bezpłatnej wersji próbnej, aby już dziś wypróbować zaawansowane funkcje IronOCR. Wystarczy kilka minut, aby w pełni uruchomić go w swoim środowisku pracy, dzięki czemu można natychmiast rozpocząć przetwarzanie zadań OCR!




