Jak uzyskać tekst ze zrzutu ekranu za pomocą OCR w języku C#
Wiele osób może się zastanawiać: "Czym jest zrzut ekranu OCR?". Inni mogą się zastanawiać, jak przekonwertować zrzut ekranu z dowolnym tekstem na format cyfrowy umożliwiający edycję tekstu lub na format .txt lub .doc. Jeśli należysz do tej grupy, nie martw się, ponieważ mamy dla Ciebie idealne rozwiązania.
W tym artykułe omówimy różne narzędzia, które pozwolą Ci przeprowadzić OCR, czyli optyczne rozpoznawanie znaków, na zrzutach ekranu.
Istnieje wiele narzędzi OCR, ale dzisiaj będziemy używać IronOCR do wyodrębniania tekstu ze zrzutów ekranu.
1. IronOCR
IronOCR to biblioteka oprogramowania dla języków programowania C# i VB.NET, zaprojektowana w celu umożliwienia programistom dodawania funkcji OCR (optycznego rozpoznawania znaków) do swoich aplikacji. Biblioteka może służyć do rozpoznawania tekstu na obrazach i konwertowania go na tekst nadający się do odczytu maszynowego. Biblioteka opiera się na silniku OCR Tesseract, uważanym za jeden z najdokładniejszych dostępnych silników OCR.
IronOCR może być używany do odczytywania tekstu z obrazów w wielu różnych formatach plików, w tym PNG, JPG, TIFF i PDF. Oferuje również szereg zaawansowanych funkcji do pracy z rozpoznawaniem tekstu, takich jak możliwość rozpoznawania wielu języków, a także rozpoznawania tekstu z obrazów, które zostały obrócone lub przekrzywione. Ponadto programiści mogą korzystać z IronOCR, aby szybko zintegrować funkcję OCR ze swoimi aplikacjami, ponieważ zapewnia on proste, łatwe w użyciu API, które można wywołać z kodu C# lub VB.NET. Korzystając z IronOCR, możesz wybrać język OCR i przeprowadzić rozpoznawanie tekstu na obrazach, cyfrowych plikach PDF oraz zeskanowanych plikach PDF.
IronOCR jest uważany za dobre rozwiązanie dla programistów, którzy chcą dodać funkcję OCR do swoich aplikacji. Jest to oprogramowanie typu open source, łatwe w użyciu i integracji, szybkie, dokładne i zgodne z najnowszymi technologiami OCR.
2. Funkcje IronOCR
IronOCR oferuje szeroki zakres funkcji, które pomagają programistom w integracji funkcji OCR z ich aplikacjami. Niektóre z kluczowych funkcji IronOCR to:
- Obsługa wielu języków: IronOCR rozpoznaje tekst w ponad 60 językach, w tym angielskim, hiszpańskim, niemiećkim, francuskim, włoskim i chińskim.
- Automatyczne wykrywanie orientacji tekstu: IronOCR może automatycznie wykrywać orientację tekstu na obrazie, nawet jeśli obraz został obrócony lub przekrzywiony.
- Obsługa szerokiej gamy formatów obrazów: IronOCR może odczytywać tekst z obrazów w wielu różnych formatach plików, w tym PNG, JPG, TIFF i PDF.
- Konfigurowalne ustawienia rozpoznawania: Programiści mogą dostosować ustawienia rozpoznawania, aby poprawić dokładność rozpoznawania dla określonych typów obrazów lub przypadków użycia.
- Możliwość rozpoznawania tekstu ze skanowanych dokumentów i plików PDF zawierających wiele stron.
- Szybkie rozpoznawanie i wysoką dokładność: IronOCR wykorzystuje silnik OCR Tesseract, który jest jednym z najdokładniejszych i najczęściej stosowanych silników OCR dostępnych na rynku.
- Łatwe w użyciu API: IronOCR zapewnia proste, łatwe w użyciu API, które można wywołać z kodu C# lub VB.NET, co ułatwia integrację funkcji OCR z dowolną aplikacją.
Ogólnie rzecz biorąc, IronOCR to potężne narzędzie, które oferuje szeroki zakres funkcji pomagających programistom w dodawaniu funkcji OCR do ich aplikacji.
3. Tworzenie nowego projektu w Visual Studio
Otwórz program Visual Studio i przejdź do menu Plik. Wybierz "Nowy projekt", a następnie wybierz Aplikacja konsolowa.
Wpisz nazwę projektu i wybierz ścieżkę w odpowiednim polu tekstowym. Następnie kliknij przycisk Utwórz. Wybierz wymagańy .NET Framework, tak jak na poniższym zrzucie ekranu:
Tworzenie nowego projektu w Visual Studio
Projekt Visual Studio wygeneruje teraz strukturę aplikacji konsolowej. Po zakończeniu otworzy się plik program.cs, w którym można pisać i wykonywać kod źródłowy.
Plik program.cs, wygenerowany przez Kreatora nowego projektu programu Visual Studio
Teraz możemy dodać bibliotekę IronOCR i przetestować program.
4. Zainstaluj IronOCR
W Visual Studio można łatwo zintegrować IronOCR z projektem C#.
IronOCR oferuje wiele procesów integracji z projektem C# .NET. W tym miejscu omówimy jedno z nich: instalację IronOCR za pomocą menedżera pakietów NuGet.
W programie Visual Studio przejdź do menu Narzędzia > Menedżer pakietów NuGet > Konsola menedżera pakietów
Interfejs użytkownika menedżera pakietów NuGet
Po kliknięciu na dole okna programu Visual Studio pojawi się nowa konsola. Wpisz poniższe polecenie w konsoli i naciśnij Enter.
Install-Package IronOcr
IronOCR zostanie zainstalowany w ciągu zaledwie kilku sekund.
5. Wykorzystanie IronOCR do przeprowadzenia OCR na zrzucie ekranu
IronOCR to potężna biblioteka OCR, którą można wykorzystać do rozpoznawania tekstu ze zrzutów ekranu. Dzięki IronOCR można wykonać zrzut ekranu z tekstem, a następnie wykorzystać funkcje OCR biblioteki IronOCR do konwersji tekstu ze zrzutu ekranu do cyfrowego, edytowalnego formatu. Oto przykład wykorzystania IronOCR do rozpoznawania tekstu na zrzucie ekranu w języku C#. Aby wykonać OCR zrzutu ekranu, wystarczy wykonać zrzut ekranu i uruchomić poniższy kod, aby wyodrębnić tekst do dowolnego formatu wyjściowego.
using IronOcr;
using System;
class Program
{
static void Main()
{
// Create an instance of IronTesseract, the core OCR engine
var ocr = new IronTesseract();
// Perform OCR on the specified image file
var result = ocr.Read("ocr.png");
// Output the recognized text to the console
Console.WriteLine(result.Text);
}
}
using IronOcr;
using System;
class Program
{
static void Main()
{
// Create an instance of IronTesseract, the core OCR engine
var ocr = new IronTesseract();
// Perform OCR on the specified image file
var result = ocr.Read("ocr.png");
// Output the recognized text to the console
Console.WriteLine(result.Text);
}
}
Imports IronOcr
Imports System
Friend Class Program
Shared Sub Main()
' Create an instance of IronTesseract, the core OCR engine
Dim ocr = New IronTesseract()
' Perform OCR on the specified image file
Dim result = ocr.Read("ocr.png")
' Output the recognized text to the console
Console.WriteLine(result.Text)
End Sub
End Class
Plik obrazu wejściowego
Przykładowy zrzut ekranu użyty jako materiał źródłowy
Tekst wyjściowy
- IRONOCR for NET
- The C# OCR Library
- OCR for C# to scan and read images & PDFs
- NET OCR library with 125+ global language packs
- Output as text, structured data, or searchable PDFs
- Supports NET 6, 5, Core, Standard, Framework
6. Wykorzystanie IronOCR do przeprowadzenia OCR w określonej strefie
IronOCR pozwala na przeprowadzenie OCR w określonych obszarach obrazu. Może to być przydatne, gdy obraz zawiera wiele obszarów tekstu, a chcesz rozpoznać tekst tylko w określonym obszarze. Przykładowy kod znajduje się poniżej.
using IronOcr;
using IronSoftware.Drawing;
using System;
class Program
{
static void Main()
{
var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput())
{
// Define the rectangle to crop the image for OCR
var contentArea = new CropRectangle(x: 0, y: 0, width: 350, height: 150);
// Add the image with the specified cropping area
ocrInput.AddImage("ocr.png", contentArea);
// Perform the OCR operation on the defined area
var ocrResult = ocrTesseract.Read(ocrInput);
// Output the recognized text
Console.WriteLine(ocrResult.Text);
}
}
}
using IronOcr;
using IronSoftware.Drawing;
using System;
class Program
{
static void Main()
{
var ocrTesseract = new IronTesseract();
using (var ocrInput = new OcrInput())
{
// Define the rectangle to crop the image for OCR
var contentArea = new CropRectangle(x: 0, y: 0, width: 350, height: 150);
// Add the image with the specified cropping area
ocrInput.AddImage("ocr.png", contentArea);
// Perform the OCR operation on the defined area
var ocrResult = ocrTesseract.Read(ocrInput);
// Output the recognized text
Console.WriteLine(ocrResult.Text);
}
}
}
Imports IronOcr
Imports IronSoftware.Drawing
Imports System
Friend Class Program
Shared Sub Main()
Dim ocrTesseract = New IronTesseract()
Using ocrInput As New OcrInput()
' Define the rectangle to crop the image for OCR
Dim contentArea = New CropRectangle(x:= 0, y:= 0, width:= 350, height:= 150)
' Add the image with the specified cropping area
ocrInput.AddImage("ocr.png", contentArea)
' Perform the OCR operation on the defined area
Dim ocrResult = ocrTesseract.Read(ocrInput)
' Output the recognized text
Console.WriteLine(ocrResult.Text)
End Using
End Sub
End Class
Wynik
- IRONOCR for NET
- The C# OCR Library
- OCR for C# to scan and read images & PDFs
- NET OCR library with 125+ global language packs
7. Wykorzystanie IronOCR do przeprowadzenia OCR na obrazie
Aby przeprowadzić rozpoznawanie optyczne (OCR) obrazu i zapisać rozpoznany tekst w pliku .txt, można użyć poniższego kodu.
using IronOcr;
using System;
class Program
{
static void Main()
{
var ocr = new IronTesseract();
using (var input = new OcrInput("ocr.png"))
{
// Perform OCR on the image
var result = ocr.Read(input);
// Save the recognized text to a .txt file
result.SaveAsTextFile("output.txt");
}
}
}
using IronOcr;
using System;
class Program
{
static void Main()
{
var ocr = new IronTesseract();
using (var input = new OcrInput("ocr.png"))
{
// Perform OCR on the image
var result = ocr.Read(input);
// Save the recognized text to a .txt file
result.SaveAsTextFile("output.txt");
}
}
}
Imports IronOcr
Imports System
Friend Class Program
Shared Sub Main()
Dim ocr = New IronTesseract()
Using input = New OcrInput("ocr.png")
' Perform OCR on the image
Dim result = ocr.Read(input)
' Save the recognized text to a .txt file
result.SaveAsTextFile("output.txt")
End Using
End Sub
End Class
Zawartość pliku wyjściowego przedstawiono poniżej:
Zawartość wygenerowanego pliku output.txt
8. Dowiedz się więcej
Aby uzyskać więcej informacji na temat wykonywania OCR na obrazach, przeczytaj samouczek dotyczący wyodrębniania tekstu z obrazów.
IronOCR jest częścią Suite pięciu bibliotek .NET przeznaczonych do pracy z różnymi typami dokumentów. Możesz kupić wszystkie pięć bibliotek w cenie zaledwie dwóch licencji.
Często Zadawane Pytania
Jak wyodrębnić tekst ze zrzutu ekranu za pomocą OCR w języku C#?
Możesz użyć IronOCR w języku C# do wyodrębnienia tekstu ze zrzutu ekranu, wykorzystując jego proste API do konwersji zrzutu ekranu do cyfrowego formatu edytowalnego. Najpierw zainstaluj IronOCR za pośrednictwem NuGet w Visual Studio, a następnie użyj przykładów kodu dostarczonych przez IronOCR, aby przeprowadzić OCR na zrzucie ekranu.
Czym jest optyczne rozpoznawanie znaków (OCR)?
Optyczne rozpoznawanie znaków (OCR) to technologia, która przekształca różne rodzaje dokumentów, takie jak zeskanowane dokumenty papierowe, pliki PDF lub zdjęcia zrobione aparatem cyfrowym, w dane, które można edytować i przeszukiwać. IronOCR to biblioteka C#, która ułatwia korzystanie z OCR w aplikacjach.
Czy IronOCR obsługuje wiele języków w ramach OCR?
Tak, IronOCR obsługuje rozpoznawanie tekstu w ponad 60 językach, co sprawia, że jest wszechstronnym narzędziem do zastosowań międzynarodowych. Oferuje opcje ustawiania preferencji językowych, aby zapewnić dokładne wyodrębnianie tekstu.
Jakie formaty obrazów obsługuje IronOCR w zakresie OCR?
IronOCR obsługuje różne formaty obrazów do OCR, w tym PNG, JPG, TIFF i PDF. Ta elastyczność pozwala programistom pracować z szeroką gamą źródeł obrazów bez konieczności ręcznej konwersji formatów.
W jaki sposób orientacja tekstu może wpływać na dokładność OCR?
Orientacja tekstu może mieć duży wpływ na dokładność OCR. IronOCR automatycznie wykrywa i koryguje orientację tekstu na obrazach, zapewniając, że tekst obrócony lub przekrzywiony jest dokładnie rozpoznawany i konwertowany do formatu cyfrowego.
Jak zainstalować IronOCR w projekcie C#?
Aby zainstalować IronOCR w projekcie C#, użyj menedżera pakietów NuGet w Visual Studio. Wyszukaj IronOCR i zainstaluj go w swoim projekcie, aby rozpocząć korzystanie z jego funkcji OCR do wyodrębniania tekstu z obrazów.
Jakie są zalety korzystania z IronOCR do rozpoznawania tekstu?
IronOCR oferuje kilka zalet, w tym solidną obsługę wielu języków, automatyczną korektę orientacji tekstu, obsługę wielu formatów obrazów oraz konfigurowalne ustawienia poprawiające dokładność rozpoznawania. Jego proste API ułatwia integrację z aplikacjami C#.
Czy IronOCR nadaje się do rozpoznawania tekstu w określonych obszarach obrazu?
Tak, IronOCR pozwala programistom na zdefiniowanie konkretnych obszarów na obrazie w celu przeprowadzenia OCR, umożliwiając ukierunkowane wyodrębnianie tekstu. Ta funkcja jest przydatna w sytuacjach, gdy tylko część obrazu zawiera istotny tekst.
Jakie są typowe wskazówki dotyczące rozwiązywania problemów związanych z OCR?
Typowe wskazówki dotyczące rozwiązywania problemów z OCR obejmują upewnienie się, że obraz jest wyraźny i ma wysoką rozdzielczość, sprawdzenie orientacji tekstu, upewnienie się, że ustawiony jest właściwy język, oraz aktualizację do najnowszej wersji IronOCR w celu uzyskania optymalnej wydajności.
Jak mogę przekonwertować wyniki OCR do pliku .txt lub .doc?
Dzięki IronOCR można konwertować wyniki OCR na plik .txt lub .doc, wyodrębniając tekst z obrazu i zapisując go przy użyciu standardowych operacji wejścia/wyjścia plików w języku C#. Pozwala to na tworzenie edytowalnych dokumentów na podstawie tekstu zawartego w obrazach.



