Jak czytać zdjęcia w C# z IronOCR

This article was translated from English: Does it need improvement?
Translated
View the article in English

Metoda ReadPhoto IronOCR wyodrębnia tekst z złożonych formatów zdjęć takich jak TIFF i GIF, zapewniając uporządkowane wyniki z regionami tekstowymi i wskaźnikami pewności, zoptymalizowana pod kątem wysokiej jakości zeskanowanych dokumentów wymagających precyzyjnego przetwarzania OCR.

Przy obróbce dużych ilości dokumentów, zwłaszcza zeskanowanych obrazów jak pliki TIFF, ręczne wyodrębnianie tekstu staje się czasochłonne i podatne na błędy. Optical Character Recognition (OCR) automatyzuje ten proces, konwertując tekst z obrazów na dane cyfrowe. Technologia OCR obsługuje złożone obrazy jak zeskanowane dokumenty i fotografie, zamieniając je w przeszukiwalny, edytowalny tekst. To przyspiesza przetwarzanie dokumentów i zapewnia dokładne wyodrębnianie danych.

Użycie OCR na formatach takich jak TIFF i GIF umożliwia szybkie cyfrowe przetwarzanie ogromnych ilości danych, pomimo ich rozmiaru, głębi kolorów czy problemów z kompresją. Dzięki funkcji ReadPhoto IronOCR, deweloperzy mogą wyodrębniać tekst z obrazów i wykonywać zaawansowane operacje jak wyszukiwanie słów kluczowych czy konwersja zeskanowanych danych do przeszukiwalnych PDF-ów. Technologia ta przynosi korzyści branżom zajmującym się dokumentami prawnymi, archiwami lub paragonami, gdzie efektywne wyszukiwanie danych jest kluczowe.

Ten samouczek demonstruje stosowanie ReadPhoto i manipulowanie obiektem results. Omówimy, kiedy używać ReadPhoto zamiast standardowego Read z IronOCR. W przypadku ogólnego przetwarzania obrazów warto zapoznać się z różnymi formatami obrazów.

Aby skorzystać z tej funkcji, zainstaluj pakiet IronOcr.Extension.AdvancedScan.

Szybki start: Użyj ReadPhoto do wyodrębniania tekstu ze złożonych obrazów

Szybki start: użyj metody ReadPhoto IronOCR na OcrInput załadowanym z twoim kadrem obrazu, aby wyodrębnić cały tekst i regiony. Jest zoptymalizowany pod kątem plików TIFF, GIF i podobnych formatów zdjęć.

  1. Install IronOCR with NuGet Package Manager

    PM > Install-Package IronOcr
  2. Skopiuj i uruchom ten fragment kodu.

    var result = new IronTesseract().ReadPhoto(new OcrInput().LoadImageFrame("photo.tiff", 0));
  3. Wdrożenie do testowania w środowisku produkcyjnym

    Rozpocznij używanie IronOCR w swoim projekcie już dziś z darmową wersją próbną

    arrow pointer

Jak wyodrębnić tekst z obrazów TIFF za pomocą ReadPhoto?

Odczytywanie wysokiej jakości formatów zdjęć, takich jak TIFF i GIF, jest proste dzięki IronOCR. Najpierw utwórz zmienną OcrInput i załaduj obraz za pomocą LoadImageFrame. Następnie użyj metody ReadPhoto, aby uzyskać wyniki. Wielostronicowy samouczek dotyczący OCR plików TIFF zawiera dodatkowe przykłady dokumentów wielostronicowych.

Zwróć uwagę

  • Plik TIFF zawiera wiele klatek; parametr PageNumber jest wymagany wraz z indeksowaniem zerowym.
  • Metoda obsługuje obecnie język angielski, chiński, japoński, koreański oraz alfabet łaciński.
  • Korzystanie z zaawansowanego skanowania w środowisku .NET Framework wymaga architektury x64.

)}]

Jakiego formatu pliku użyć?

Ponieważ przeglądarki nie obsługują natywnie formatu TIFF, pobierz plik wejściowy TIFF tutaj. Poniższa wersja została przekonwertowana do formatu WEBP.

Wejście

Jak zaimplementować metodę ReadPhoto?

Ta implementacja pokazuje, jak wyodrębnić tekst i informacje o regionie z obrazu TIFF. Więcej przykładów można znaleźć w naszym przykładzie kodu odczytu zdjęć.

:path=/static-assets/ocr/content-code-examples/how-to/read-photo-read-photo.cs
using IronOcr;
using IronSoftware.Drawing;
using System;

// Instantiate OCR engine
var ocr = new IronTesseract();

using var inputPhoto = new OcrInput();
inputPhoto.LoadImageFrame("ocr.tiff", 0);

// Read photo
OcrPhotoResult result = ocr.ReadPhoto(inputPhoto);

// Index number refer to region order in the page
int number = result.TextRegions[0].PageNumber;

// Extract the text in the first region
string textinregion = result.TextRegions[0].TextInRegion;

//Extract the co_ordinates of the first text region
Rectangle region = result.TextRegions[0].Region;

var output = $"Text in First Region: {textinregion}\n"
             + $"Text Region:\n"
             + $"Starting X: {region.X}\n"
             + $"Starting Y: {region.Y}\n"
             + $"Region Width: {region.Width}\n"
             + $"Region Height: {region.Height}\n"
             + $"Result Confidence: {result.Confidence}\n\n"
             + $"Full Scnned Photo Text: {result.Text}";

Console.WriteLine(output);
Imports Microsoft.VisualBasic
Imports IronOcr
Imports IronSoftware.Drawing
Imports System

' Instantiate OCR engine
Private ocr = New IronTesseract()

Private inputPhoto = New OcrInput()
inputPhoto.LoadImageFrame("ocr.tiff", 0)

' Read photo
Dim result As OcrPhotoResult = ocr.ReadPhoto(inputPhoto)

' Index number refer to region order in the page
Dim number As Integer = result.TextRegions(0).PageNumber

' Extract the text in the first region
Dim textinregion As String = result.TextRegions(0).TextInRegion

'Extract the co_ordinates of the first text region
Dim region As Rectangle = result.TextRegions(0).Region

Dim output = $"Text in First Region: {textinregion}" & vbLf & $"Text Region:" & vbLf & $"Starting X: {region.X}" & vbLf & $"Starting Y: {region.Y}" & vbLf & $"Region Width: {region.Width}" & vbLf & $"Region Height: {region.Height}" & vbLf & $"Result Confidence: {result.Confidence}" & vbLf & vbLf & $"Full Scnned Photo Text: {result.Text}"

Console.WriteLine(output)
$vbLabelText   $csharpLabel

Jakie właściwości zapewnia OcrPhotoResult?

Wyjście debugowania pokazujące ekstrakcję tekstu OCR z numerem telefonu, współrzędnymi i wskaźnikiem pewności z przetworzonego obrazu

Klasa OcrPhotoResult zapewnia kluczowe właściwości do analizy wyodrębnionego tekstu. Szczegółowe informacje na temat pracy z wynikami OCR można znaleźć w naszym przewodniku dotyczącym eksportu danych i przetwarzania wyników.

Text: Wyodrębniony tekst z wejścia OCR.
Confidence: Statystyczna pewność dokładności (skala 0-1, gdzie 1 to najwyższa). Dowiedz się więcej o wskaźnikach pewności wyników.
TextRegions: Lista regionów tekstowych z danymi o lokalizacji. Podobnie jak w przypadku definiowania obszarów OCR do ukierunkowanego wyodrębniania.


Kiedy należy używać ReadPhoto zamiast Read?

Główna różnica między ReadPhoto a standardowym Read polega na obiekcie result i obsługiwanych formatach plików. LoadImageFrame akceptuje specjalnie TIFF i GIF, a nie formaty jak JPEG. ReadPhoto jest zoptymalizowany dla złożonych formatów obrazów, podczas gdy standardowy Read pasuje do prostszych obrazów i ogólnych zadań ekstrakcji tekstu.

Dlaczego ReadPhoto obsługuje tylko formaty TIFF i GIF?

TIFF to bezstratny format służący do kompresji wielu stron i klatek w jeden plik. Jest on wykorzystywany do przechowywania wielu obrazów o wysokiej jakości, takich jak dokumenty prawne i obrazy medyczne. Ponieważ jest bardziej złożony niż JPEG, wymaga innych metod wyodrębniania tekstu. Specjalistyczne podejście zapewnia optymalne wyniki dzięki profesjonalnym formatom obrazów.

Obrazy TIFF wykorzystują różne metody kompresji, dlatego IronOCR stosuje specjalistyczne algorytmy do rozszyfrowywania tekstu. Zaawansowane algorytmy w ReadPhoto obsługują kompresję TIFF, zapewniając dokładną ekstrakcję z kompleksowych dokumentów wielowarstwowych.

Oto porównanie formatów TIFF i JPEG:

Funkcja TIFF (Tagged Image File Format) JPG/JPEG (Joint Photographic Experts Group)
Kompresja Bezstratny lub nieskompresowany (zachowuje jakość) Kompresja stratna (obniża jakość w celu zmniejszenia rozmiaru pliku)
Rozmiar pliku Duży (ze względu na wysoką jakość i opcjonalny brak kompresji) Mniejszy, zoptymalizowany do użytku w sieci i szybkiego ładowania
Jakość obrazu Wysoka (idealna do użytku profesjonalnego, zachowuje wszystkie szczegóły) Niższa (z powodu kompresji stratnej, pewna utrata jakości)
Głębia kolorów Obsługuje wysoką głębię kolorów (do 16 bitów lub 32 bitów na kanał) Kolory 24-bitowe (16,7 mln kolorów)
Przykład zastosowania Profesjonalna fotografia, publikowanie, skanowanie, archiwizacja Obrazy internetowe, media społecznościowe, codzienne zdjęcia
Przejrzystość Obsługuje przezroczystość i kanały alfa Nie obsługuje przezroczystości
Redakcja Nadaje się do wielokrotnej edycji (bez utraty jakości przy ponownym zapisywaniu) Jakość pogarsza się wraz z wielokrotnymi edycjami i zapisywaniem
Kompatybilność Szeroko obsługiwane w profesjonalnym oprogramowaniu Obsługiwane na wszystkich platformach i urządzeniach
Animacja Nie obsługuje animacji Nie obsługuje animacji
Metadane Przechowuje obszerne metadane (EXIF, warstwy itp.) Zapisuje metadane EXIF, ale ma większe ograniczenia

Jak wybrać między ReadPhoto a Read dla mojej aplikacji?

Należy rozważyć każdy przypadek użycia w środowisku produkcyjnym, aby zoptymalizować wydajność aplikacji. Podczas gdy ReadPhoto pasuje do złożonych obrazów TIFF, przetwarza je wolniej. Format JPEG zapewnia szybsze przetwarzanie, ale niższą jakość, co może skutkować niskim wskaźnikiem pewności OCR. W razie potrzeby użyj filtrów poprawiających jakość obrazu, aby uzyskać lepsze wyniki.

Właściwość confidence w OcrPhotoResults lub jakiejkolwiek klasie interfejsu IOcrResult wskazuje dokładność wyniku, umożliwiając deweloperom testowanie i optymalizację. Dla najwyższych wymagań dokładności, ReadPhoto z wysokiej jakości obrazami TIFF zapewnia najlepsze wyniki, szczególnie dla przetwarzania archiwalnych lub prawnych dokumentów, gdzie precyzja ma znaczenie.

Należy znaleźć równowagę między wydajnością a dokładnością, upewniając się, że obrazy spełniają określone progi jakości. Dla mieszanych typów dokumentów, zaimplementuj hybrydowe podejście: użyj ReadPhoto dla ważnych dokumentów wymagających wysokiej dokładności i standardowego Read dla rutynowych zadań, gdzie liczy się szybkość.

Często Zadawane Pytania

Jakie formaty obrazow obsluguje metoda ReadPhoto?

Metoda ReadPhoto w IronOCR jest zoptymalizowana dla zlozonych formatow zdjec jak TIFF i GIF. Jest specjalnie zaprojektowana do ekstrakcji tekstu z wysokiej jakosci zeskanowanych dokumentow i fotografii, zapewniajac zorganizowane wyniki z regionami tekstowymi i ocenami pewnosci.

Jak wyodrebnic tekst z obrazu TIFF?

Aby wyodrebnic tekst z obrazow TIFF za pomoca IronOCR, utworz zmienna OcrInput, zaladuj obraz uzywajac LoadImageFrame, a nastepnie zastosuj metode ReadPhoto. Proces jest prosty: var result = new IronTesseract().ReadPhoto(new OcrInput().LoadImageFrame("photo.tiff", 0));

Jaki dodatkowy pakiet jest wymagany do uzycia funkcji ReadPhoto?

Aby uzyc funkcji ReadPhoto w IronOCR, nalezy zainstalowac pakiet IronOcr.Extension.AdvancedScan z NuGet. To rozszerzenie zapewnia zaawansowane mozliwosci skanowania wymagane dla metody ReadPhoto.

Kiedy nalezy uzyc ReadPhoto zamiast standardowej metody Read?

Uzyj metody ReadPhoto w IronOCR przy pracy ze zlozonymi formatami zdjec jak TIFF i GIF, szczegolnie dla wysokiej jakosci zeskanowanych dokumentow wymagajacych dokladnego przetwarzania OCR. Standardowa metoda Read jest lepsza do ogolnych zadan przetwarzania obrazow.

Jakiego rodzaju wyniki dostarcza ReadPhoto?

Metoda ReadPhoto w IronOCR dostarcza zorganizowane wyniki OCR, ktore zawieraja wyekstraktowane regiony tekstu z ocenami pewnosci. Mozna uzyskac do nich dostep poprzez wlasciwosc OcrPhotoResult, aby przegladac i manipulowac wyekstrakowanymi danymi.

Czy ReadPhoto moze przetwarzac dokumenty wielostronicowe?

Tak, metoda ReadPhoto w IronOCR moze przetwarzac dokumenty wielostronicowe, zwlaszcza pliki TIFF, ktore czesto zawieraja wiele ramek. Metoda LoadImageFrame umozliwia okreslenie, ktora ramke przetworzyc w dokumentach wielostronicowych.

Jakie branze korzystaja z technologii OCR do zdjec?

IronOCR przynosi korzysci branzom zajmujacym sie dokumentami prawnymi, archiwami, paragonami i wszelkimi firmami obslugujacymi duze ilosci zeskanowanych dokumentow, gdzie efektywne odzyskiwanie danych jest kluczowe. Metoda ReadPhoto automatyzuje ekstrakcje tekstu z tych zlozonych formatow obrazow.

Curtis Chau
Autor tekstów technicznych

Curtis Chau posiada tytuł licencjata z informatyki (Uniwersytet Carleton) i specjalizuje się w front-endowym rozwoju, z ekspertką w Node.js, TypeScript, JavaScript i React. Pasjonuje się tworzeniem intuicyjnych i estetycznie przyjemnych interfejsów użytkownika, Curtis cieszy się pracą z nowoczesnymi frameworkami i tworzeniem dobrze zorganizowanych, atrakcyjnych wizualnie podrę...

Czytaj więcej
Gotowy, aby rozpocząć?
Nuget Pliki do pobrania 5,571,678 | Wersja: 2026.4 just released
Still Scrolling Icon

Wciąż przewijasz?

Czy chcesz szybko dowodu? PM > Install-Package IronOcr
uruchom próbkę obserwuj, jak twój obraz staje się tekstem z możliwością wyszukiwania.