Przejdź do treści stopki
NARZęDZIA OCR

Jak przekonwertować obraz na tekst

W obecnej erze cyfrowej przekształcanie treści opartych na obrazach w łatwy do odczytania, edytowalny i przeszukiwalny tekst ma kluczowe znaczenie. Jest to szczególnie ważne w takich sytuacjach, jak archiwizacja dokumentów papierowych, wyodrębnianie kluczowych informacji z obrazów lub digitalizacja materiałów drukowanych. Technologia optycznego rozpoznawania znaków (OCR) oferuje rozwiązanie pozwalające zautomatyzować ten proces konwersji. Jednym z wysoce niezawodnych i wydajnych narzędzi do osiągnięcia tego celu jest IronOCR, solidna biblioteka OCR dla platformy .NET.

W tym artykułe wyjaśnimy, jak przekonwertować obraz na tekst za pomocą IronOCR, oraz omówimy, w jaki sposób ta konwersja może zaoszczędzić czas, zmniejszyć liczbę błędów i usprawnić procesy, takie jak ekstrakcja danych, archiwizacja i przetwarzanie dokumentów.

Jak przekonwertować obraz na tekst

  1. Pobierz bibliotekę C# do pracy z OCR
  2. Utwórz nową instancję IronTesseract
  3. Załaduj obraz za pomocą OcrImageInput
  4. Odczytaj zawartość obrazu za pomocą OcrRead
  5. Eksportuj wyniki OCR do pliku tekstowego

Dłączego warto konwertować obraz na tekst?

Istnieje wiele powodów, dla których warto przekonwertować obraz na tekst, między innymi:

  • Pobieranie danych: Pobieranie tekstu ze skanowanych dokumentów i obrazów w celu archiwizacji lub przetwarzania danych.
  • Edycja zeskanowanych treści: edytuj lub aktualizuj tekst w wcześniej zeskanowanych dokumentach, oszczędzając czas związany z ręcznym przepisywaniem treści.
  • Poprawa dostępności: Konwersja materiałów drukowanych na tekst cyfrowy, dzięki czemu stają się one dostępne dla czytników ekranu lub aplikacji zamieniających tekst na mowę.
  • Automatyzacja: Zautomatyzuj wprowadzanie i przetwarzanie danych poprzez odczytywanie tekstu z faktur, paragonów lub wizytówek.

Jak rozpocząć konwersję obrazów na tekst

Zanim przyjrzymy się, jak można wykorzystać potężne możliwości IronOCR w zakresie zamiany obrazu na tekst do wyodrębniania tekstu z obrazów, przyjrzyjmy się najpierw ogólnemu procesówi krok po kroku przy użyciu narzędzia online Docsumo. Narzędzia OCR online są przydatną opcją dla osób, które chcą wykonywać sporadyczne, a nawet jednorazowe zadania OCR, ponieważ nie wymagają one żadnej ręcznej konfiguracji. Oczywiście, jeśli musisz regularnie wykonywać zadania OCR, lepszym rozwiązaniem może być dla Ciebie potężne narzędzie OCR, takie jak IronOCR.

  1. Przejdź do internetowego narzędzia OCR
  2. Prześlij obraz i rozpocznij proces wyodrębniania
  3. Pobierz uzyskane dane jako dokument tekstowy

Krok pierwszy: Przejdź do internetowego narzędzia OCR

Aby rozpocząć korzystanie z technologii OCR do wyodrębniania tekstu z plików graficznych, najpierw przechodzimy do internetowego narzędzia do OCR obrazów, z którego chcemy skorzystać.

Jak przekonwertować obraz na tekst: Rysunek 1 – Narzędzie OCR Docsumo

Krok drugi: Prześlij obraz i rozpocznij proces ekstrakcji

Teraz, klikając przycisk "Prześlij plik", możemy przesłać plik graficzny, z którego chcemy wyodrębnić tekst. Narzędzie natychmiast rozpocznie przetwarzanie obrazu.

Jak przekonwertować obraz na tekst: Rysunek 2 – Docsumo – Przetwarzanie plików

Krok trzeci: Pobierz uzyskane dane jako dokument tekstowy

Teraz, gdy przetwarzanie obrazu zostało zakończone, możemy pobrać wyodrębniony tekst jako nowy dokument tekstowy w celu dalszego wykorzystania lub edycji.

Jak przekonwertować obraz na tekst: Rysunek 3 – Docsumo – Przetwarzanie obrazu zakończone

Możesz również wyświetlić plik, zaznaczając różne sekcje, aby wyświetlić zawarty w nim tekst. Może to być szczególnie pomocne, jeśli chcesz wyświetlić tylko tekst z określonych sekcji. Następnie nadal można pobrać tekst jako dokument tekstowy, plik XLS lub JSON.

Jak przekonwertować obraz na tekst: Rysunek 4

Pierwsze kroki z IronOCR

IronOCR to wszechstronna biblioteka .NET, która umożliwia wykonywanie operacji OCR na obrazach. Dzięki szerokiej gamie funkcji może przetwarzać różne formaty plików (takie jak PNG, JPEG, TIFF i PDF), wykonywać korekcję obrazu, skanować dokumenty specjalistyczne (paszporty, tablice rejestracyjne itp.), dostarczać zaawansowane informacje o zeskanowanych plikach, konwertować zeskanowane dokumenty oraz zaznaczać tekst.

Zainstaluj bibliotekę IronOCR

Zanim zaczniesz odczytywać obrazy za pomocą IronOCR, musisz zainstalować tę bibliotekę, jeśli nie masz jej jeszcze w swoim projekcie. IronOCR można łatwo zainstalować za pomocą NuGet w Visual Studio. Otwórz konsolę menedżera pakietów NuGet i uruchom następujące polecenie:

Install-Package IronOcr

Alternatywnie można zainstalować IronOCR za pośrednictwem strony NuGet Package Manager for Solution, wyszukując IronOCR.

Jak przekonwertować obraz na tekst: Rysunek 5

Aby użyć IronOCR w swoim kodzie, upewnij się, że na początku kodu znajduje się odpowiednia instrukcja importu:

using IronOcr;
using IronOcr;
Imports IronOcr
$vbLabelText   $csharpLabel

Konwersja obrazu na tekst: podstawowy przykład

Na początek przyjrzyjmy się podstawowemu przykładowi zamiany obrazu na tekst przy użyciu IronOCR. Jest to podstawowa funkcja każdego narzędzia OCR, a w tym przykładzie wykorzystamy plik PNG, którego użyliśmy w narzędziu online. W tym przykładzie najpierw utworzyliśmy instancję klasy IronTesseract i przypisaliśmy ją do zmiennej ocr. Następnie używamy klasy OcrImageInput do utworzenia nowego obiektu OcrImageInput na podstawie dostarczonego pliku obrazu. Wreszcie, metoda Read służy do odczytu tekstu z obrazu i zwraca obiekt OcrResult. Następnie możemy uzyskać dostęp do wyodrębnionego tekstu i wyświetlić go w konsoli za pomocą ocrResult.Text.

using IronOcr;

IronTesseract ocr = new IronTesseract();

// Load the image from which to extract text
using OcrImageInput image = new OcrImageInput("example.png");

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
using IronOcr;

IronTesseract ocr = new IronTesseract();

// Load the image from which to extract text
using OcrImageInput image = new OcrImageInput("example.png");

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
Imports IronOcr

Private ocr As New IronTesseract()

' Load the image from which to extract text
Private OcrImageInput As using

' Perform OCR to extract text
Private ocrResult As OcrResult = ocr.Read(image)

' Output the extracted text to the console
Console.WriteLine(ocrResult.Text)
$vbLabelText   $csharpLabel

Obraz wyjściowy

Jak przekonwertować obraz na tekst: Rysunek 6

Obsługa różnych formatów obrazów

IronOCR obsługuje wiele formatów obrazów, takich jak PNG, JPEG, BMP, GIF i TIFF. Proces odczytu tekstu z różnych formatów obrazów pozostaje taki sam, wystarczy tylko załadować plik z odpowiednim rozszerzeniem.

using IronOcr;

IronTesseract ocr = new IronTesseract();

// Load a BMP image
using OcrImageInput image = new OcrImageInput("example.bmp");

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
using IronOcr;

IronTesseract ocr = new IronTesseract();

// Load a BMP image
using OcrImageInput image = new OcrImageInput("example.bmp");

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
Imports IronOcr

Private ocr As New IronTesseract()

' Load a BMP image
Private OcrImageInput As using

' Perform OCR to extract text
Private ocrResult As OcrResult = ocr.Read(image)

' Output the extracted text to the console
Console.WriteLine(ocrResult.Text)
$vbLabelText   $csharpLabel

Poprawa dokładności OCR

Wydajność OCR można poprawić poprzez optymalizację obrazu i konfigurację opcji, takich jak język, rozdzielczość obrazu oraz poziom szumu w obrazie. Oto jak można dostroić OCR, aby zwiększyć dokładność wyodrębniania tekstu z obrazu, którego jakość wymaga poprawy, za pomocą metod DeNoise() i Sharpen():

using IronOcr;

IronTesseract ocr = new IronTesseract();

// Load the image and apply image processing to improve accuracy
using OcrImageInput image = new OcrImageInput("example.png");
image.DeNoise();
image.Sharpen();

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
using IronOcr;

IronTesseract ocr = new IronTesseract();

// Load the image and apply image processing to improve accuracy
using OcrImageInput image = new OcrImageInput("example.png");
image.DeNoise();
image.Sharpen();

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
Imports IronOcr

Private ocr As New IronTesseract()

' Load the image and apply image processing to improve accuracy
Private OcrImageInput As using
image.DeNoise()
image.Sharpen()

' Perform OCR to extract text
Dim ocrResult As OcrResult = ocr.Read(image)

' Output the extracted text to the console
Console.WriteLine(ocrResult.Text)
$vbLabelText   $csharpLabel

Eksport wyodrębnionego tekstu

Teraz, gdy znamy już podstawy procesu przekształcania obrazu na tekst, przyjrzyjmy się, jak możemy wyeksportować uzyskany tekst do późniejszego wykorzystania. W tym przykładzie użyjemy tego samego procesu co poprzednio, aby załadować obraz i go zeskanować. Następnie, używając File.WriteAllText("output.txt", ocrResult.Text), tworzymy nowy plik tekstowy o nazwie output.txt i zapisujemy w nim wyodrębniony tekst.

using IronOcr;
using System.IO;

IronTesseract ocr = new IronTesseract();

// Load the image
using OcrImageInput image = new OcrImageInput("example.png");

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Save the extracted text to a file
File.WriteAllText("output.txt", ocrResult.Text);
using IronOcr;
using System.IO;

IronTesseract ocr = new IronTesseract();

// Load the image
using OcrImageInput image = new OcrImageInput("example.png");

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Save the extracted text to a file
File.WriteAllText("output.txt", ocrResult.Text);
Imports IronOcr
Imports System.IO

Private ocr As New IronTesseract()

' Load the image
Private OcrImageInput As using

' Perform OCR to extract text
Private ocrResult As OcrResult = ocr.Read(image)

' Save the extracted text to a file
File.WriteAllText("output.txt", ocrResult.Text)
$vbLabelText   $csharpLabel

Jak przekonwertować obraz na tekst: Rysunek 7

Najważniejsze cechy IronOCR

  1. Wysoka dokładność: IronOCR wykorzystuje zaawansowane algorytmy OCR Tesseract i zawiera wbudowane narzędzia do obsługi złożonych obrazów, zapewniając wysoką dokładność.
  2. Obsługa wielu języków: Obsługuje ponad 125 języków, w tym różne systemy pisma, takie jak alfabet łaciński, cyrylicę, arabski i znaki azjatyckie. Należy jednak zauważyć, że wraz z IronOCR instalowany jest wyłącznie język angielski. Aby korzystać z innych języków, należy zainstalować dodatkowy pakiet językowy dla danego języka.
  3. OCR plików PDF: IronOCR może wyodrębniać tekst ze zeskanowanych plików PDF, co czyni go cennym narzędziem do digitalizacji dokumentów.
  4. Czyszczenie obrazów: Zapewnia narzędzia do wstępnego przetwarzania, takie jak prostowanie, usuwanie szumów i inwersja, w celu poprawy jakości obrazu i zwiększenia dokładności OCR.
  5. Łatwa integracja: API płynnie integruje się z każdym projektem .NET, niezależnie od tego, czy jest to aplikacja konsolowa, aplikacja internetowa czy oprogramowanie desktopowe.

Typowe zastosowania konwersji obrazów na tekst

  • Automatyzacja wprowadzania danych: Firmy mogą wykorzystywać OCR do automatycznego wyodrębniania danych z formularzy, paragonów lub wizytówek.
  • Archiwizacja dokumentów: Organizacje mogą digitalizować dokumenty fizyczne, dzięki czemu można je przeszukiwać i łatwiej przechowywać.
  • Dostępność: Konwersja materiałów drukowanych na tekst do wykorzystania w czytnikach ekranu lub innych technologiach wspomagających.
  • Badania i analiza: Szybka konwersja zeskanowanych materiałów badawczych na tekst w celu analizy lub integracji z innymi narzędziami programistycznymi.
  • Study: Konwertuj zeskanowane notatki z zajęć na edytowalny tekst, który następnie możesz zapisać jako dokument WORDa w celu dalszej obróbki w narzędziach takich jak IronWord, Microsoft Word lub Google Docs.

Wnioski

Konwersja tekstu z obrazu za pomocą IronOCR to szybki, dokładny i wydajny sposób na realizację zadań związanych z przetwarzaniem dokumentów. Niezależnie od tego, czy pracujesz ze skanowanymi dokumentami, obrazami cyfrowymi czy dokumentami PDF, IronOCR upraszcza ten proces, zapewniając wysoką dokładność, obsługę wielu języków oraz potężne narzędzia do przetwarzania obrazów. To narzędzie jest idealne dla firm, które chcą usprawnić procesy zarządzania dokumentami, zautomatyzować pozyskiwanie danych lub zwiększyć dostępność.

Skorzystaj z bezpłatnej wersji próbnej, aby już dziś wypróbować zaawansowane funkcje IronOCR. Wystarczy kilka minut, aby w pełni uruchomić go w swoim środowisku pracy, dzięki czemu można natychmiast rozpocząć przetwarzanie zadań OCR!

Kannaopat Udonpant
Inżynier oprogramowania
Zanim stał się inżynierem oprogramowania, Kannapat ukończył doktorat z zasobów środowiskowych na Uniwersytecie Hokkaido w Japonii. W czasie studiowania, Kannapat również został członkiem Laboratorium Robotyki Pojazdów, które jest częścią Wydziału Inżynierii Bioprodukcji. W 2022 roku wykorzystał swoje umiejętności w ...
Czytaj więcej

Zespol wsparcia Iron

Jestesmy online 24 godziny, 5 dni w tygodniu.
Czat
Email
Zadzwon do mnie