OCR w Windows 11 (Darmowe Narzędzia Online)
Optyczne rozpoznawanie znaków (OCR) przekształca zeskanowane obrazy tekstu w standardowy tekst do edycji w ramach analizy dokumentów. Program rozpoznaje znaki na podstawie ich kształtu, rozmiaru i rozmieszczenia. Porównuje je ze znanymi kształtami i rozkładem znaków w celu zidentyfikowania znaku. Oprogramowanie OCR może konwertować dokumenty z jednego formatu pliku do innego, który może nie opierać się na tej samej technologii OCR. OCR konwertuje tekst z dowolnego dokumentu na format tekstowy nadający się do odczytu maszynowego, co pozwala uzyskać pliki, które można edytować.
Codzienne zastosowania OCR obejmują konwersję dokumentów papierowych do formatu PDF lub plików tekstowych z możliwością wyszukiwania, na przykład w celu archiwizacji lub przeglądania na urządzeniach mobilnych, takich jak czytniki e-booków. Możliwości zastosowania są ogromne — skanowanie dokumentów papierowych w celu ich cyfrowego odczytu; digitalizacja dokumentów z archiwów; przekształcanie drukowanych książek i czasopism w e-booki; nawet w rozwiązywaniu spraw kryminalnych, w których stare dowody stały się nieczytelne z upływem czasu. W tym artykułe omówimy, jak przeprowadzić OCR w systemie Windows 11.
Photo Scan: Darmowe oprogramowanie do OCR
Photo Scan to bezpłatne oprogramowanie OCR dostępne dla systemu Windows 11. Można je pobrać bezpłatnie ze sklepu Microsoft Store. Posiada wbudowaną technologię optycznego rozpoznawania znaków, która pomaga wyodrębnić tekst z pliku graficznego bez konieczności integracji z zewnętrznymi źródłami.
Umożliwia to użycie zdjęcia z komputera poprzez wybranie plików, przeciągnięcie i upuszczenie plików lub wybranie obrazów ze schowka. Będziesz mógł wyodrębnić tekst jednym kliknięciem myszki. Można ją łatwo pobrać ze sklepu Microsoft Store.
Oto jak wykonać OCR za pomocą aplikacji Photo Scan:
- Otwórz aplikację Photo Scan w systemie Windows 11.
- Po uruchomieniu oprogramowania zobaczysz trzy opcje uzyskania obrazu:
- Przeglądaj zdjęcia
- Użyj aparatu
- Z schowka
- Wybierz dowolną metodę z powyższych i prześlij zdjęcie do aplikacji Photo Scan.
- Zaraz po przesłaniu zdjęcia wyodrębniony tekst pojawi się po prawej stronie aplikacji.
Można również skorzystać z internetowej wersji programu Adobe Acrobat Reader do OCR w dokumentach PDF.
Narzędzia OCR online
Widzieliśmy już, jak można to zrobić lokalnie na komputerze z systemem Windows przy użyciu oprogramowania do optycznego rozpoznawania znaków. Zobaczmy, jak możemy to zrobić online. Przyjrzymy się niektórym z najlepszych dostępnych darmowych programów do OCR.
Narzędzie OCR DocSumo
DocSumo Online OCR Scanner to przydatne narzędzie dla użytkowników, którzy muszą konwertować zeskanowane dokumenty do różnych formatów, takich jak PDF, tekst i Microsoft WORD. Jest to również przydatne dla osób, które chcą przeczytać stare dokumenty drukowane lub ręcznie pisane. Zobaczmy, jak możemy wykorzystać narzędzie DocSumo OCR do wyodrębniania tekstu z plików graficznych lub plików PDF.
Otwórz stronę internetową narzędzia DocSumo OCR w dowolnej obsługiwanej przeglądarce.
Kliknij "Prześlij plik" i wybierz plik w dowolnym obsługiwanym formacie. Może to być format EPUB lub dowolny plik PDF. DocSumo obsługuje prawie wszystkie formaty zawierające dane w formie wizualnej.
Po przesłaniu pliku rozpocznie się przetwarzanie i wyodrębnianie tekstu ze skanowanego dokumentu.
Po zakończeniu procesu będzie można pobrać wyodrębniony plik tekstowy. Otrzymasz edytowalne pliki tekstowe.
Oto jak możemy wyodrębnić tekst za pomocą narzędzia OCR DocSumo.
OCRConvert
OCRConvert to internetowe narzędzie OCR, które przekształca dokumenty fizyczne w cyfrowe. Oferuje profesjonalną i przystępną cenowo usługę dostosowaną do wszystkich potrzeb. OCRConvert to kompleksowe rozwiązanie dla każdego, kto chce zdigitalizować swoje stare materiały i udostępnić je użytkownikom na całym świecie, umożliwiając wyszukiwanie i udostępnianie treści słowo po słowie.
Oprogramowanie wykorzystuje technologię optycznego rozpoznawania znaków (OCR) do wyodrębniania tekstu ze skanowanych obrazów dokumentów papierowych, zapewniając użytkownikom szerokie możliwości kontroli nad formatowaniem tekstu. Konwersja OCR pomaga wyeliminować błędy ludzkie i zwiększyć dokładność, zapewniając większą wartość i przejrzystość strategii zarządzania informacjami w firmie.
Zobaczmy, jak wyodrębnić tekst ze skanowanego dokumentu za pomocą OCRConvert.
Przejdź do strony internetowej OCRConvert.
Kliknij "Wybierz plik" i wybierz żądany plik. Wybierz typ wyjściowy i kliknij przycisk "Konwertuj".
Po kliknięciu rozpocznie się wyodrębnianie tekstu z przesłanego pliku.
Wyodrębniony tekst będzie można pobrać, klikając przycisk pobierania.
To-text.net
To-text.net to narzędzie, które pomaga przekształcać pliki PDF lub obrazy w edytowalny tekst w czasie rzeczywistym. Sprawia, że proces edycji i konwersji treści jest szybki i łatwy.
To-text.net wykorzystuje sztuczną inteligencję do rozpoznawania tekstu za pomocą technologii automatycznego OCR (optycznego rozpoznawania znaków), która wykrywa tekst na zeskanowanym dokumencie i przekształca go w sformatowany tekst wyświetlany na ekranie. Narzędzie to jest przydatne do szybkiej konwersji pliku PDF na edytowalny dokument bez konieczności pobierania go lub wysyłania gdzie indziej w celu konwersji. Jest to również doskonała opcja dla każdego, kto chce pracować z dużymi ilościami danych, ponieważ do korzystania z tej aplikacji nie jest potrzebny wysokiej klasy skaner ani żadne oprogramowanie.
Aby przeprowadzić OCR, wykonaj poniższe kroki:
- Otwórz stronę internetową To-text.net.
- Prześlij żądany plik z urządzenia. Może to być plik graficzny lub plik PDF.
- Następnie wybierz język docelowy i kliknij przycisk "Konwertuj". Rozpocznie się pobieranie danych z obrazu zeskanowanego pliku PDF.
Po konwersji tekst wyjściowy zostanie wyświetlony w edytorze tekstu i będzie można pobrać plik tekstowy.
IronOCR: biblioteka C
IronOCR to popularna biblioteka OCR dla programistów .NET. Zapewnia wysoką dokładność, szybkie przetwarzanie i wydajność w czasie rzeczywistym w zakresie obrazówania, digitalizacji i rozpoznawania. Od 2006 roku IronOCR zapewnia łatwy sposób obsługi danych graficznych. Biblioteka IronOCR jest komponentem oprogramowania, który upraszcza digitalizację dokumentów poprzez automatyzację ich skanowania. Obsługuje również inne procesy, takie jak OCR zeskanowanych obrazów, indeksowanie dokumentów oraz optyczne rozpoznawanie znaków (OCR).
Biblioteka IronOCR to interfejs API w języku C#, który może być wykorzystywany w różnych branżach, w tym w automatyzacji marketingu, reklamie cyfrowej, informatyce medycznej, sprawach publicznych i bezpieczeństwie. Zobaczmy przykład kodu wykorzystującego bibliotekę IronOCR:
Przykład kodu
using IronOCR;
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
// Add an image from which you want to extract text
Input.AddImage("Image.jpg");
// You can add any number of images
var Result = Ocr.Read(Input);
// Print extracted text to the console
Console.WriteLine(Result.Text);
}
using IronOCR;
var Ocr = new IronTesseract();
using (var Input = new OcrInput())
{
// Add an image from which you want to extract text
Input.AddImage("Image.jpg");
// You can add any number of images
var Result = Ocr.Read(Input);
// Print extracted text to the console
Console.WriteLine(Result.Text);
}
Imports IronOCR
Private Ocr = New IronTesseract()
Using Input = New OcrInput()
' Add an image from which you want to extract text
Input.AddImage("Image.jpg")
' You can add any number of images
Dim Result = Ocr.Read(Input)
' Print extracted text to the console
Console.WriteLine(Result.Text)
End Using
Obraz wejściowy
Wynik
Licencjonowanie
IronOCR jest całkowicie bezpłatny do celów programistycznych. Możesz skorzystać z bezpłatnej wersji próbnej. IronOCR oferuje trzy rodzaje opcji licencyjnych dostosowanych do różnych rozmiarów firm. Możesz wybrać licencję dla jednego programisty, dziesięciu programistów lub nieograniczonej liczby programistów. Iron Software oferuje również Suite 5 produktów w cenie zaledwie dwóch. Więcej informacji można znaleźć pod tym linkiem.




