Jak czytać zdjęcia w C# z IronOCR

This article was translated from English: Does it need improvement?
Translated
View the article in English

Metoda ReadPhoto firmy IronOCR wyodrębnia tekst ze złożonych formatów zdjęć, takich jak TIFF i GIF, zapewniając uporządkowane wyniki z zaznaczonymi obszarami tekstu i ocenami pewności, zoptymalizowane pod kątem wysokiej jakości zeskanowanych dokumentów wymagających dokładnego przetwarzania OCR.

Przy obróbce dużych ilości dokumentów, zwłaszcza zeskanowanych obrazów jak pliki TIFF, ręczne wyodrębnianie tekstu staje się czasochłonne i podatne na błędy. Optical Character Recognition (OCR) automatyzuje ten proces, konwertując tekst z obrazów na dane cyfrowe. Technologia OCR obsługuje złożone obrazy jak zeskanowane dokumenty i fotografie, zamieniając je w przeszukiwalny, edytowalny tekst. To przyspiesza przetwarzanie dokumentów i zapewnia dokładne wyodrębnianie danych.

Użycie OCR na formatach takich jak TIFF i GIF umożliwia szybkie cyfrowe przetwarzanie ogromnych ilości danych, pomimo ich rozmiaru, głębi kolorów czy problemów z kompresją. Dzięki funkcji ReadPhoto programu IronOCR programiści mogą wyodrębniać tekst z obrazów i wykonywać zaawansowane operacje, takie jak wyszukiwanie słów kluczowych lub konwersja zeskanowanych danych do plików PDF z możliwością wyszukiwania. Technologia ta przynosi korzyści branżom zajmującym się dokumentami prawnymi, archiwami lub paragonami, gdzie efektywne wyszukiwanie danych jest kluczowe.

Ten samouczek pokazuje, jak używać ReadPhoto i manipulować obiektem results. Omówimy, kiedy należy używać ReadPhoto zamiast standardowego Read z IronOCR. W przypadku ogólnego przetwarzania obrazów warto zapoznać się z różnymi formatami obrazów.

Aby korzystać z tej funkcji, zainstaluj pakiet IronOcr.Extension.AdvancedScan.

Szybki start: Użyj ReadPhoto do wyodrębniania tekstu ze złożonych obrazów

Szybki start: użyj metody ReadPhoto IronOCR na OcrInput załadowanym ramką obrazu, aby wyodrębnić cały tekst i obszary. Jest zoptymalizowany do TIFFów, GIFów i podobnych formatów zdjęć.

  1. Install IronOCR with NuGet Package Manager

    PM > Install-Package IronOcr
  2. Skopiuj i uruchom ten fragment kodu.

    var result = new IronTesseract().ReadPhoto(new OcrInput().LoadImageFrame("photo.tiff", 0));
  3. Wdrożenie do testowania w środowisku produkcyjnym

    Rozpocznij używanie IronOCR w swoim projekcie już dziś z darmową wersją próbną

    arrow pointer

Jak wyodrębnić tekst z obrazów TIFF za pomocą ReadPhoto?

Odczytywanie wysokiej jakości formatów zdjęć, takich jak TIFF i GIF, jest proste dzięki IronOCR. Najpierw utwórz zmienną OcrInput i załaduj obraz za pomocą LoadImageFrame. Następnie użyj metody ReadPhoto, aby uzyskać wyniki. Wielostronicowy samouczek dotyczący OCR plików TIFF zawiera dodatkowe przykłady dokumentów wielostronicowych.

Zwróć uwagę

  • Plik TIFF zawiera wiele klatek; Parametr PageNumber jest wymagany przy indeksowaniu od zera.
  • Metoda obsługuje obecnie język angielski, chiński, japoński, koreański oraz alfabet łaciński.
  • Korzystanie z zaawansowanego skanowania w środowisku .NET Framework wymaga architektury x64.

)}]

Jakiego formatu pliku użyć?

Ponieważ przeglądarki nie obsługują natywnie formatu TIFF, pobierz plik wejściowy TIFF tutaj. Poniższa wersja została przekonwertowana do formatu WEBP.

Input

Jak zaimplementować metodę ReadPhoto?

Ta implementacja pokazuje, jak wyodrębnić tekst i informacje o regionie z obrazu TIFF. Więcej przykładów można znaleźć w naszym przykładzie kodu odczytu zdjęć.

:path=/static-assets/ocr/content-code-examples/how-to/read-photo-read-photo.cs
using IronOcr;
using IronSoftware.Drawing;
using System;

// Instantiate OCR engine
var ocr = new IronTesseract();

using var inputPhoto = new OcrInput();
inputPhoto.LoadImageFrame("ocr.tiff", 0);

// Read photo
OcrPhotoResult result = ocr.ReadPhoto(inputPhoto);

// Index number refer to region order in the page
int number = result.TextRegions[0].PageNumber;

// Extract the text in the first region
string textinregion = result.TextRegions[0].TextInRegion;

//Extract the co_ordinates of the first text region
Rectangle region = result.TextRegions[0].Region;

var output = $"Text in First Region: {textinregion}\n"
             + $"Text Region:\n"
             + $"Starting X: {region.X}\n"
             + $"Starting Y: {region.Y}\n"
             + $"Region Width: {region.Width}\n"
             + $"Region Height: {region.Height}\n"
             + $"Result Confidence: {result.Confidence}\n\n"
             + $"Full Scnned Photo Text: {result.Text}";

Console.WriteLine(output);
Imports Microsoft.VisualBasic
Imports IronOcr
Imports IronSoftware.Drawing
Imports System

' Instantiate OCR engine
Private ocr = New IronTesseract()

Private inputPhoto = New OcrInput()
inputPhoto.LoadImageFrame("ocr.tiff", 0)

' Read photo
Dim result As OcrPhotoResult = ocr.ReadPhoto(inputPhoto)

' Index number refer to region order in the page
Dim number As Integer = result.TextRegions(0).PageNumber

' Extract the text in the first region
Dim textinregion As String = result.TextRegions(0).TextInRegion

'Extract the co_ordinates of the first text region
Dim region As Rectangle = result.TextRegions(0).Region

Dim output = $"Text in First Region: {textinregion}" & vbLf & $"Text Region:" & vbLf & $"Starting X: {region.X}" & vbLf & $"Starting Y: {region.Y}" & vbLf & $"Region Width: {region.Width}" & vbLf & $"Region Height: {region.Height}" & vbLf & $"Result Confidence: {result.Confidence}" & vbLf & vbLf & $"Full Scnned Photo Text: {result.Text}"

Console.WriteLine(output)
$vbLabelText   $csharpLabel

Jakie właściwości zapewnia OcrPhotoResult?

Wynik debugowania pokazujący ekstrakcję tekstu OCR z numerem telefonu, współrzędnymi i wynikiem pewności z przetworzonego obrazu

Klasa OcrPhotoResult udostępnia kluczowe właściwości do analizy wyodrębnionego tekstu. Szczegółowe informacje na temat pracy z wynikami OCR można znaleźć w naszym przewodniku dotyczącym eksportu danych i przetwarzania wyników.

Text: Tekst wyodrębniony z danych wejściowych OCR.
Confidence: Poziom pewności co do dokładności statystycznej (skala 0–1, gdzie 1 oznacza najwyższy poziom). Dowiedz się więcej o wskaźnikach pewności wyników.
TextRegions: Lista obszarów tekstowych z danymi lokalizacyjnymi. Podobnie jak w przypadku definiowania obszarów OCR do ukierunkowanego wyodrębniania.


Kiedy należy używać ReadPhoto zamiast Read?

Główną różnicą między ReadPhoto a standardowym Read jest obiekt result oraz obsługiwane formaty plików. LoadImageFrame akceptuje konkretnie formaty TIFF i GIF, a nie formaty takie jak JPEG. ReadPhoto jest zoptymalizowany pod kątem złożonych formatów obrazów, natomiast standardowy Read nadaje się do prostszych obrazów i ogólnych zadań związanych z ekstrakcją tekstu.

Dłączego ReadPhoto obsługuje tylko formaty TIFF i GIF?

TIFF to bezstratny format służący do kompresji wielu stron i klatek w jeden plik. Jest on wykorzystywany do przechowywania wielu obrazów o wysokiej jakości, takich jak dokumenty prawne i obrazy medyczne. Ponieważ jest bardziej złożony niż JPEG, wymaga innych metod wyodrębniania tekstu. Specjalistyczne podejście zapewnia optymalne wyniki dzięki profesjonalnym formatom obrazów.

Obrazy TIFF wykorzystują różne metody kompresji, dlatego IronOCR stosuje specjalistyczne algorytmy do rozszyfrowywania tekstu. Zaawansowane algorytmy w ReadPhoto obsługują charakterystykę kompresji TIFF, zapewniając dokładne wyodrębnianie danych ze złożonych, wielowarstwowych dokumentów.

Oto porównanie formatów TIFF i JPEG:

Funkcja TIFF (Tagowany Format Pliku Obrazu) JPG/JPEG (Grupa Ekspertów Fotograficznych Joint Photographic Experts Group)
Kompresja Bezstratny lub nieskompresowany (zachowuje jakość) Kompresja stratna (obniża jakość w celu zmniejszenia rozmiaru pliku)
Rozmiar pliku Duży (ze względu na wysoką jakość i opcjonalny brak kompresji) Mniejszy, zoptymalizowany do użytku w sieci i szybkiego ładowania
Jakość obrazu Wysoka (idealna do użytku profesjonalnego, zachowuje wszystkie szczegóły) Niższa (z powodu kompresji stratnej, pewna utrata jakości)
Głębia kolorów Obsługuje wysoką głębię kolorów (do 16 bitów lub 32 bitów na kanał) Kolory 24-bitowe (16,7 mln kolorów)
Przykład zastosowania Profesjonalna fotografia, publikowanie, skanowanie, archiwizacja Obrazy internetowe, media społecznościowe, codzienne zdjęcia
Przejrzystość Obsługuje przezroczystość i kanały alfa Nie obsługuje przezroczystości
Redakcja Nadaje się do wielokrotnej edycji (bez utraty jakości przy ponownym zapisywaniu) Jakość pogarsza się wraz z wielokrotnymi edycjami i zapisywaniem
Kompatybilność Szeroko obsługiwane w profesjonalnym oprogramowaniu Obsługiwane na wszystkich platformach i urządzeniach
Animacja Nie obsługuje animacji Nie obsługuje animacji
Metadane Przechowuje obszerne metadane (EXIF, warstwy itp.) Zapisuje metadane EXIF, ale ma większe ograniczenia

Jak wybrać między ReadPhoto a Read dla mojej aplikacji?

Należy rozważyć każdy przypadek użycia w środowisku produkcyjnym, aby zoptymalizować wydajność aplikacji. Chociaż ReadPhoto nadaje się do złożonych obrazów TIFF, przetwarza je wolniej. Format JPEG zapewnia szybsze przetwarzanie, ale niższą jakość, co może skutkować niskim wskaźnikiem pewności OCR. W razie potrzeby użyj filtrów poprawiających jakość obrazu, aby uzyskać lepsze wyniki.

Właściwość confidence w OcrPhotoResults lub dowolnej klasie interfejsu IOcrResult wskazuje dokładność wyników, umożliwiając programistom testowanie i optymalizację. W przypadku najwyższych wymagań dotyczących dokładności najlepsze wyniki zapewnia ReadPhoto z wysokiej jakości obrazami TIFF, zwłaszcza w przypadku archiwizacji lub przetwarzania dokumentów prawnych, gdzie liczy się precyzja.

Należy znaleźć równowagę między wydajnością a dokładnością, upewniając się, że obrazy spełniają określone progi jakości. W przypadku dokumentów o zróżnicowanym charakterze należy zastosować podejście hybrydowe: używać ReadPhoto w przypadku dokumentów o znaczeniu krytycznym, wymagających wysokiej dokładności, oraz standardowego Read w przypadku rutynowych zadań, w których priorytetem jest szybkość.

Często Zadawane Pytania

Jakie formaty obrazow obsługuje metoda ReadPhoto?

Metoda ReadPhoto w IronOCR jest zoptymalizowana dla zlozonych formatow zdjec jak TIFF i GIF. Jest specjalnie zaprojektowana do ekstrakcji tekstu z wysokiej jakosci zeskanowanych dokumentow i fotografii, zapewniajac zorganizowane wyniki z regionami tekstowymi i ocenami pewnosci.

Jak wyodrebnic tekst z obrazu TIFF?

Aby wyodrebnic tekst z obrazow TIFF za pomoca IronOCR, utworz zmienna OcrInput, zaladuj obraz uzywajac LoadImageFrame, a nastepnie zastosuj metode ReadPhoto. Proces jest prosty: var result = new IronTesseract().ReadPhoto(new OcrInput().LoadImageFrame("photo.tiff", 0));

Jaki dodatkowy pakiet jest wymagany do uzycia funkcji ReadPhoto?

Aby uzyc funkcji ReadPhoto w IronOCR, nalezy zainstalować pakiet IronOcr.Extension.AdvancedScan z NuGet. To rozszerzenie zapewnia zaawansowane mozliwosci skanowania wymagane dla metody ReadPhoto.

Kiedy nalezy uzyc ReadPhoto zamiast standardowej metody Read?

Uzyj metody ReadPhoto w IronOCR przy pracy ze zlozonymi formatami zdjec jak TIFF i GIF, szczegolnie dla wysokiej jakosci zeskanowanych dokumentow wymagajacych dokladnego przetwarzania OCR. Standardowa metoda Read jest lepsza do ogolnych zadan przetwarzania obrazow.

Jakiego rodzaju wyniki dostarcza ReadPhoto?

Metoda ReadPhoto w IronOCR dostarcza zorganizowane wyniki OCR, ktore zawieraja wyekstraktowane regiony tekstu z ocenami pewnosci. Mozna uzyskac do nich dostep poprzez wlasciwosc OcrPhotoResult, aby przegladac i manipulowac wyekstrakowanymi danymi.

Czy ReadPhoto moze przetwarzac dokumenty wielostronicowe?

Tak, metoda ReadPhoto w IronOCR moze przetwarzac dokumenty wielostronicowe, zwlaszcza pliki TIFF, ktore czesto zawieraja wiele ramek. Metoda LoadImageFrame umożliwia okreslenie, która ramke przetworzyc w dokumentach wielostronicowych.

Jakie branze korzystaja z technologii OCR do zdjec?

IronOCR przynosi korzysci branzom zajmujacym sie dokumentami prawnymi, archiwami, paragonami i wszelkimi firmami obslugujacymi duze ilosci zeskanowanych dokumentow, gdzie efektywne odzyskiwanie danych jest kluczowe. Metoda ReadPhoto automatyzuje ekstrakcje tekstu z tych zlozonych formatow obrazow.

Jakie są korzyści z używania IronOCR do zarządzania dokumentami?

Używanie IronOCR do zarządzania dokumentami upraszcza przepływ pracy przez konwertowanie zeskanowanych dokumentów na przeszukiwalny i edytowalny tekst, redukując konieczność ręcznego wprowadzania danych i poprawiając dostępność dokumentów.

Jak IronOCR może poprawić dokładność danych?

IronOCR poprawia dokładność danych dzięki swoim zaawansowanym algorytmom rozpoznawania i funkcjom korekcji obrazów, zapewniając, że proces ekstrakcji tekstu jest zarówno niezawodny, jak i precyzyjny.

Czy dostępna jest bezpłatna wersja próbna IronOCR?

Tak, Iron Software oferuje bezpłatną wersję próbną IronOCR, umożliwiając użytkownikom przetestowanie jego funkcji i możliwości przed podjęciem decyzji o zakupie.

Curtis Chau
Autor tekstów technicznych

Curtis Chau posiada tytuł licencjata z informatyki (Uniwersytet Carleton) i specjalizuje się w front-endowym rozwoju, z ekspertką w Node.js, TypeScript, JavaScript i React. Pasjonuje się tworzeniem intuicyjnych i estetycznie przyjemnych interfejsów użytkownika, Curtis cieszy się pracą z nowoczesnymi frameworkami i tworzeniem dobrze zorganizowanych, atrakcyjnych wizualnie podrę...

Czytaj więcej
Gotowy, aby rozpocząć?
Nuget Pliki do pobrania 5,896,332 | Wersja: 2026.5 just released
Still Scrolling Icon

Wciąż przewijasz?

Czy chcesz szybko dowodu? PM > Install-Package IronOcr
uruchom próbkę obserwuj, jak twój obraz staje się tekstem z możliwością wyszukiwania.