KORZYSTANIE Z IRONOCR

Ekstrakcja danych z paragonów za pomocą OCR (samouczek krok po kroku)

Zaktualizowano:18 stycznia, 2026

Rozpoznawanie optyczne (OCR) paragonów za pomocą IronOCR to przełomowe rozwiązanie zarówno dla firm, jak i osób prywatnych. Proces ten pozwala na wyodrębnienie ważnych informacji z fizycznych paragonów i przekształcenie ich w dane cyfrowe. W tym artykułe krok po kroku dowiesz się, jak korzystać z IronOCR, aby w pełni wykorzystać swoje paragony.

Krótkie wprowadzenie do OCR

Optyczne rozpoznawanie znaków (OCR) to technologia, która pozwala komputerom odczytywać i rozumieć tekst z obrazów lub zeskanowanych dokumentów. Dzięki konwersji tekstu drukowanego na tekst czytelny dla komputera technologia OCR umożliwia przechowywanie, przetwarzanie i analizowanie informacji zawartych w dokumentach fizycznych.

2. Wprowadzenie do IronOCR

IronOCR to biblioteka OCR (Optical Character Recognition) dla programistów C# i .NET. Umożliwia programistom wyodrębnianie tekstu z obrazów, plików PDF i innych formatów dokumentów. IronOCR opiera się na popularnym silniku OCR Tesseract i oferuje dodatkowe funkcje, co czyni go idealnym wyborem do różnych zastosowań, w tym do rozpoznawania tekstu z paragonów.

3. Korzyści wynikające z użycia IronOCR do ekstrakcji danych

Oto kilka kluczowych korzyści wynikających z użycia IronOCR do ekstrakcji danych z paragonów za pomocą OCR:

Wysoka dokładność: IronOCR zapewnia doskonałą dokładność API OCR, gwarantując niezawodne wyodrębnianie danych z paragonów i innych dokumentów.
Obsługa wielu języków: IronOCR obsługuje ponad 125 języków, dzięki czemu nadaje się do zastosowań globalnych.
Łatwość użytkowania: Biblioteka oferuje proste i intuicyjne API, ułatwiające programistom wdrażanie funkcji OCR w ich projektach.
Możliwość dostosowania: IronOCR oferuje różne opcje precyzyjnego dostosowywania wyników OCR, zapewniając optymalne wyodrębnianie danych dla konkretnego zastosowania.

4. Jak działa IronOCR

IronOCR wykorzystuje zaawansowane algorytmy OCR do rozpoznawania i wyodrębniania tekstu z obrazów i dokumentów. Może przetwarzać różne formaty, w tym JPEG, PNG, TIFF i PDF. Biblioteka odczytuje plik wejściowy, rozpoznaje zawarty w nim tekst i generuje wyodrębniony tekst jako ciąg znaków, który następnie może być przetwarzany lub przechowywany zgodnie z wymaganiami. IronOCR wykorzystuje również wizję komputerową w celu uzyskania najlepszych wyników.

5. Wymagania wstępne dotyczące korzystania z IronOCR

Aby rozpocząć korzystanie z IronOCR do wyodrębniania danych z paragonów, należy najpierw zainstalować pakiet IronOCR. Można to łatwo zrobić za pomocą NuGet, menedżera pakietów dla .NET. Wystarczy otworzyć projekt w Visual Studio i wykonać następujące kroki:

Kliknij prawym przyciskiem myszy swój projekt w Eksploratorze rozwiązań i wybierz "Zarządzaj pakietami NuGet".
W oknie NuGet Package Manager wyszukaj "IronOCR".
Wybierz pakiet IronOcr i kliknij "Zainstaluj".

Wyszukaj pakiet IronOcr w interfejsie użytkownika menedżera pakietów NuGet

6. Przygotowanie obrazu paragonu

Przed wyodrębnieniem danych z paragonu warto upewnić się, że obrazy paragonów są wysokiej jakości, aby poprawić dokładność procesu OCR API paragonów. Oto kilka wskazówek dotyczących robienia dobrych zdjęć paragonów:

Użyj zeskanowanego dokumentu. Do skanowania paragonów można użyć skanera o wysokiej rozdzielczości.
Upewnij się, że paragon jest dobrze oświetlony i nie ma na nim cieni.
Wygładź wszelkie zagięcia lub fałdy na paragonie, aby żadne kluczowe informacje nie były zasłonięte.
Upewnij się, że tekst na paragonie jest czytelny i nie jest rozmazany, aby usprawnić przetwarzanie paragonów.

Przykładowy obraz paragonu do wyodrębnienia tekstu

7. Wykonywanie OCR na obrazie paragonu

Po zainstalowaniu IronOCR i przygotowaniu obrazu paragonu nadszedł czas na przeprowadzenie procesu OCR. W aplikacji .NET użyj następującego fragmentu kodu:

using IronOcr;

// Initialize the IronTesseract class, which is responsible for OCR operations
var ocr = new IronTesseract();

// Use the OcrInput class to load the image of your receipt.
// Replace @"path/to/your/receipt/image.png" with the actual file path.
using (var ocrInput = new OcrInput(@"path/to/your/receipt/image.png"))
{
    // Read the content of the image and perform OCR recognition
    var result = ocr.Read(ocrInput);

    // Output the recognized text to the console
    Console.WriteLine(result.Text);
}

using IronOcr;

// Initialize the IronTesseract class, which is responsible for OCR operations
var ocr = new IronTesseract();

// Use the OcrInput class to load the image of your receipt.
// Replace @"path/to/your/receipt/image.png" with the actual file path.
using (var ocrInput = new OcrInput(@"path/to/your/receipt/image.png"))
{
    // Read the content of the image and perform OCR recognition
    var result = ocr.Read(ocrInput);

    // Output the recognized text to the console
    Console.WriteLine(result.Text);
}

Imports IronOcr

' Initialize the IronTesseract class, which is responsible for OCR operations
Private ocr = New IronTesseract()

' Use the OcrInput class to load the image of your receipt.
' Replace @"path/to/your/receipt/image.png" with the actual file path.
Using ocrInput As New OcrInput("path/to/your/receipt/image.png")
	' Read the content of the image and perform OCR recognition
	Dim result = ocr.Read(ocrInput)

	' Output the recognized text to the console
	Console.WriteLine(result.Text)
End Using

$vbLabelText $csharpLabel

Wyjaśnienie kodu

using IronOcr;

using IronOcr;

Imports IronOcr

$vbLabelText $csharpLabel

Ta linia importuje bibliotekę IronOCR do aplikacji .NET, umożliwiając dostęp do jej funkcji.

var ocr = new IronTesseract();

var ocr = new IronTesseract();

Dim ocr = New IronTesseract()

$vbLabelText $csharpLabel

Ta linia tworzy nową instancję klasy IronTesseract, głównej klasy odpowiedziąlnej za operacje OCR w IronOCR.

using (var ocrInput = new OcrInput(@"path/to/your/receipt/image.png"))

using (var ocrInput = new OcrInput(@"path/to/your/receipt/image.png"))

Using ocrInput As New OcrInput("path/to/your/receipt/image.png")

$vbLabelText $csharpLabel

W tym miejscu tworzona jest nowa instancja klasy OcrInput, która reprezentuje obraz wejściowy dla procesu OCR. @"path/to/your/receipt/image.png" należy zastąpić rzeczywistą ścieżką do pliku z obrazem paragonu. Instrukcja using zapewnia, że zasoby przydzielone do instancji OcrInput zostaną prawidłowo zwolnione po zakończeniu operacji OCR.

var result = ocr.Read(ocrInput);

var result = ocr.Read(ocrInput);

Dim result = ocr.Read(ocrInput)

$vbLabelText $csharpLabel

Ta linia wywołuje metodę Read instancji IronTesseract, przekazując obiekt OcrInput jako parametr. Metoda Read przetwarza obraz wejściowy i wykonuje operację OCR, rozpoznając i wyodrębniając tekst z obrazu. Rozpocznie to proces rozpoznawania paragonów.

Console.WriteLine(result.Text);

Console.WriteLine(result.Text);

Console.WriteLine(result.Text)

$vbLabelText $csharpLabel

Na koniec ta linia wyświetla wyodrębniony tekst w konsoli. Obiekt result, który jest instancją klasy OcrResult, zawiera rozpoznany tekst oraz dodatkowe informacje dotyczące procesu OCR. Wyodrębniony tekst można wyświetlić, uzyskując dostęp do właściwości Text obiektu result.

Wyodrębnianie danych z paragonów za pomocą OCR (samouczek krok po kroku), rysunek 3: Wynik wyodrębnionych tekstów Wynik wyodrębnionych tekstów

Dopracowanie wyników OCR

IronOCR oferuje kilka opcji poprawiających dokładność i wydajność OCR. Obejmuje to wstępne przetwarzanie obrazu, dostosowanie ustawień silnika OCR oraz wybór odpowiedniego języka dla paragonu.

Wstępne przetwarzanie obrazów

Możesz poprawić wyniki OCR, stosując techniki wstępnego przetwarzania obrazów, takie jak:

Prostowanie: Skoryguj wszelkie obroty lub pochylenia obrazu.
Usuwanie szumów: Popraw czytelność tekstu poprzez usunięcie szumów z obrazów.

Oto przykład zastosowania tych technik:

using IronOcr;

// Initialize the IronTesseract class
var ocr = new IronTesseract();

// Load the image of your receipt and apply preprocessing techniques
using (var input = new OcrInput(@"path/to/your/receipt/image.png"))
{
    input.DeNoise(); // Remove noise from the image
    input.DeSkew();  // Correct any skewing in the image

    // Perform OCR and extract the recognized text
    var result = ocr.Read(input);
    Console.WriteLine(result.Text);
}

using IronOcr;

// Initialize the IronTesseract class
var ocr = new IronTesseract();

// Load the image of your receipt and apply preprocessing techniques
using (var input = new OcrInput(@"path/to/your/receipt/image.png"))
{
    input.DeNoise(); // Remove noise from the image
    input.DeSkew();  // Correct any skewing in the image

    // Perform OCR and extract the recognized text
    var result = ocr.Read(input);
    Console.WriteLine(result.Text);
}

Imports IronOcr

' Initialize the IronTesseract class
Private ocr = New IronTesseract()

' Load the image of your receipt and apply preprocessing techniques
Using input = New OcrInput("path/to/your/receipt/image.png")
	input.DeNoise() ' Remove noise from the image
	input.DeSkew() ' Correct any skewing in the image

	' Perform OCR and extract the recognized text
	Dim result = ocr.Read(input)
	Console.WriteLine(result.Text)
End Using

$vbLabelText $csharpLabel

Wybór języka

IronOCR obsługuje ponad 125 języków, a wybór odpowiedniego języka dla danego dokumentu może znacznie poprawić wyniki OCR. Aby określić język, dodaj następujący wiersz do swojego kodu:

ocr.Configuration.Language = OcrLanguage.English;

ocr.Configuration.Language = OcrLanguage.English;

ocr.Configuration.Language = OcrLanguage.English

$vbLabelText $csharpLabel

Pobieranie danych z wyników OCR

Po zakończeniu procesu OCR nadszedł czas na wyodrębnienie konkretnych informacji z tekstu. W zależności od potrzeb możesz chcieć wyodrębnić takie dane, jak:

Nazwa i adres sklepu.
Data i godzina zakupu.
Nazwy produktów i ceny.
Suma częściowa, podatek i kwota całkowita.

W tym celu w aplikacji .NET można używać wyrażeń regularnych lub technik manipulacji ciągami znaków. Na przykład, można wyodrębnić datę z wyniku OCR za pomocą następującego fragmentu kodu:

using System;
using System.Text.RegularExpressions;

// Define a regular expression pattern for matching dates
var datePattern = @"\d{1,2}\/\d{1,2}\/\d{2,4}";

// Search for a date in the OCR result text
var dateMatch = Regex.Match(result.Text, datePattern);
if (dateMatch.Success)
{
    // Parse the matched date string into a DateTime object
    var dateValue = DateTime.Parse(dateMatch.Value);
    Console.WriteLine("Date: " + dateValue);
}

using System;
using System.Text.RegularExpressions;

// Define a regular expression pattern for matching dates
var datePattern = @"\d{1,2}\/\d{1,2}\/\d{2,4}";

// Search for a date in the OCR result text
var dateMatch = Regex.Match(result.Text, datePattern);
if (dateMatch.Success)
{
    // Parse the matched date string into a DateTime object
    var dateValue = DateTime.Parse(dateMatch.Value);
    Console.WriteLine("Date: " + dateValue);
}

Imports System
Imports System.Text.RegularExpressions

' Define a regular expression pattern for matching dates
Private datePattern = "\d{1,2}\/\d{1,2}\/\d{2,4}"

' Search for a date in the OCR result text
Private dateMatch = Regex.Match(result.Text, datePattern)
If dateMatch.Success Then
	' Parse the matched date string into a DateTime object
	Dim dateValue = DateTime.Parse(dateMatch.Value)
	Console.WriteLine("Date: " & dateValue)
End If

$vbLabelText $csharpLabel

Możesz stworzyć podobne wzorce dla innych informacji, które chcesz wyodrębnić z paragonu.

Przechowywanie i analiza wyodrębnionych danych

Teraz, gdy wyodrębniłeś już istotne informacje z paragonu, możesz je zapisać w bazie danych, przeanalizować lub wyeksportować do innych formatów plików, takich jak CSV, JSON lub Excel.

Wnioski

Podsumowując, OCR paragonów przy użyciu IronOCR to innowacyjne i wydajne rozwiązanie do digitalizacji i zarządzania danymi finansowymi. Dzięki IronOCR można zrezygnować z ręcznego wprowadzania danych. Postępując zgodnie z tym przewodnikiem krok po kroku, możesz wykorzystać możliwości IronOCR do usprawnienia śledzenia wydatków i analizy danych. Najlepsze jest to, że IronOCR oferuje bezpłatną wersję próbną, dzięki czemu możesz sprawdzić jego możliwości bez żadnych zobowiązań.

Po okresie próbnym, jeśli zdecydujesz się nadal korzystać z IronOCR, cena licencji zaczyna się od $799, co stanowi opłacalny sposób na wykorzystanie zalet technologii OCR w Twoich aplikacjach.

Często Zadawane Pytania

Jak przekonwertować obraz paragonu na tekst cyfrowy za pomocą języka C#?

Możesz przekonwertować obraz paragonu na tekst cyfrowy za pomocą IronOCR, inicjując klasę IronTesseract, ładując obraz za pomocą OcrInput i wywołując metodę Read w celu wyodrębnienia tekstu.

Czym jest optyczne rozpoznawanie znaków i jak działa w przypadku paragonów?

Optyczne rozpoznawanie znaków (OCR) to technologia, która przekształca tekst z obrazów lub zeskanowanych dokumentów w dane nadające się do odczytu maszynowego. Działa w przypadku paragonów poprzez skanowanie wydrukowanego materiału i konwersję go na tekst, który można przechowywać i analizować za pomocą IronOCR.

Jak mogę poprawić jakość wyników OCR dla obrazów paragonów?

Poprawę wyników OCR można osiągnąć, zapewniając wysoką jakość obrazów paragonów, stosując techniki wstępnego przetwarzania obrazów, takie jak prostowanie i usuwanie szumów, oraz wybierając odpowiednie ustawienia językowe w IronOCR.

Jakie są zalety korzystania z biblioteki OCR w języku C# do wyodrębniania danych z paragonów?

Korzystanie z biblioteki OCR dla języka C#, takiej jak IronOCR, usprawnia proces pozyskiwania danych z paragonów dzięki wysokiej dokładności, obsłudze ponad 125 języków oraz opcjom dostosowywania, co ułatwia integrację z projektami .NET.

W jaki sposób wyodrębnione dane z paragonów można wykorzystać do raportowania i analizy?

Wyodrębnione dane z paragonów można przechowywać w bazach danych lub eksportować do formatów takich jak CSV, JSON lub Excel, co umożliwia dalsze przetwarzanie, raportowanie i analizę.

Jaka jest procedura instalacji biblioteki OCR w środowisku .NET?

Aby zainstalować IronOCR w środowisku .NET, otwórz Visual Studio, przejdź do „Zarządzaj pakietami NuGet”, wyszukaj „IronOCR”, a następnie zainstaluj go w swoim projekcie.

W jaki sposób można wyodrębnić konkretne dane z wyników OCR dla paragonów?

Konkretne dane można wyodrębnić z wyników OCR, używając wyrażeń regularnych lub manipulacji ciągami znaków w celu analizy informacji, takich jak nazwy sklepów, daty zakupu i ceny produktów.

Jakie są typowe wyzwania związane z OCR danych z paragonów i jak można im sprostać?

Typowe wyzwania to słaba jakość obrazu i skomplikowane układy paragonów. Można je rozwiązać, poprawiając jakość obrazu, stosując techniki wstępnego przetwarzania oraz wykorzystując opcje dostosowywania w IronOCR.

Czy IronOCR zapewnia obsługę wielu języków w zakresie OCR paragonów?

Tak, IronOCR zapewnia wielojęzyczną obsługę OCR paragonów, umożliwiając rozpoznawanie i przetwarzanie tekstu w ponad 125 językach, co zwiększa jego użyteczność w zastosowaniach globalnych.

Czy dostępna jest wersja próbna biblioteki OCR dla języka C# i jakie są opcje licencyjne?

IronOCR oferuje bezpłatną wersję próbną, która pozwala użytkownikom zapoznać się z jego funkcjami. Po zakończeniu okresu próbnego dostępne są różne opcje licencyjne, począwszy od ekonomicznej wersji lite.

Kannapat Udonpant

Czat z zespołem inżynierów teraz

Inżynier oprogramowania

Zanim stał się inżynierem oprogramowania, Kannapat ukończył doktorat z zasobów środowiskowych na Uniwersytecie Hokkaido w Japonii. W czasie studiowania, Kannapat również został członkiem Laboratorium Robotyki Pojazdów, które jest częścią Wydziału Inżynierii Bioprodukcji. W 2022 roku wykorzystał swoje umiejętności w ...

Czytaj więcej

Powiązane artykuły

Opublikowano 8 marca, 2026

Zbuduj API OCR do paragonów w C#, które faktycznie wyodrębnia przydatne dane

Zbuduj API OCR do paragonów w C# używając IronOCR. Samouczek krok po kroku z przykładami kodu do wyodrębniania strukturalnych danych z obrazów paragonów - lokalnie i dokładnie.

Czytaj więcej

Zaktualizowano 1 marca, 2026

OCR C# GitHub: Rozpoznawanie tekstu z IronOCR

Samouczek OCR C# GitHub: Zaimplementuj rozpoznawanie tekstu w swoich projektach GitHub używając IronOCR. Zawiera przykłady kodu i wskazówki dotyczące kontroli wersji.

Czytaj więcej

Zaktualizowano 1 marca, 2026

.NET OCR SDK: Biblioteka do rozpoznawania tekstu dla C#

Twórz potężne rozwiązania OCR z SDK .NET IronOCR. Proste API, funkcje biznesowe i wsparcie dla różnych platform dla aplikacji przetwarzania dokumentów.

Czytaj więcej

Jak odczytać tekst z obrazu w Blazorze

OCR z wykorzystaniem wizji komputer...

Zwyciestwo klienta:

Podkreslaj programiste:

SEMINARIA INTERNETOWE:

Rozpocznij darmowy 30-dniowy okres próbny

Ekstrakcja danych z paragonów za pomocą OCR (samouczek krok po kroku)

Krótkie wprowadzenie do OCR

2. Wprowadzenie do IronOCR

3. Korzyści wynikające z użycia IronOCR do ekstrakcji danych

4. Jak działa IronOCR

5. Wymagania wstępne dotyczące korzystania z IronOCR

6. Przygotowanie obrazu paragonu

7. Wykonywanie OCR na obrazie paragonu

Wyjaśnienie kodu

Dopracowanie wyników OCR

Wstępne przetwarzanie obrazów

Wybór języka

Pobieranie danych z wyników OCR

Przechowywanie i analiza wyodrębnionych danych

Wnioski

Często Zadawane Pytania

Jak przekonwertować obraz paragonu na tekst cyfrowy za pomocą języka C#?

Czym jest optyczne rozpoznawanie znaków i jak działa w przypadku paragonów?

Jak mogę poprawić jakość wyników OCR dla obrazów paragonów?

Jakie są zalety korzystania z biblioteki OCR w języku C# do wyodrębniania danych z paragonów?

W jaki sposób wyodrębnione dane z paragonów można wykorzystać do raportowania i analizy?

Jaka jest procedura instalacji biblioteki OCR w środowisku .NET?

W jaki sposób można wyodrębnić konkretne dane z wyników OCR dla paragonów?

Jakie są typowe wyzwania związane z OCR danych z paragonów i jak można im sprostać?

Czy IronOCR zapewnia obsługę wielu języków w zakresie OCR paragonów?

Czy dostępna jest wersja próbna biblioteki OCR dla języka C# i jakie są opcje licencyjne?

Zespol wsparcia Iron

Rozpocznij darmowy 30-dniowy okres próbny

Ekstrakcja danych z paragonów za pomocą OCR (samouczek krok po kroku)

Krótkie wprowadzenie do OCR

2. Wprowadzenie do IronOCR

3. Korzyści wynikające z użycia IronOCR do ekstrakcji danych

4. Jak działa IronOCR

5. Wymagania wstępne dotyczące korzystania z IronOCR

6. Przygotowanie obrazu paragonu

7. Wykonywanie OCR na obrazie paragonu

Wyjaśnienie kodu

Dopracowanie wyników OCR

Wstępne przetwarzanie obrazów

Wybór języka

Pobieranie danych z wyników OCR

Przechowywanie i analiza wyodrębnionych danych

Wnioski

Często Zadawane Pytania

Jak przekonwertować obraz paragonu na tekst cyfrowy za pomocą języka C#?

Czym jest optyczne rozpoznawanie znaków i jak działa w przypadku paragonów?

Jak mogę poprawić jakość wyników OCR dla obrazów paragonów?

Jakie są zalety korzystania z biblioteki OCR w języku C# do wyodrębniania danych z paragonów?

W jaki sposób wyodrębnione dane z paragonów można wykorzystać do raportowania i analizy?

Jaka jest procedura instalacji biblioteki OCR w środowisku .NET?

W jaki sposób można wyodrębnić konkretne dane z wyników OCR dla paragonów?

Jakie są typowe wyzwania związane z OCR danych z paragonów i jak można im sprostać?

Czy IronOCR zapewnia obsługę wielu języków w zakresie OCR paragonów?

Czy dostępna jest wersja próbna biblioteki OCR dla języka C# i jakie są opcje licencyjne?

Powiązane artykuły

Zbuduj API OCR do paragonów w C#, które faktycznie wyodrębnia przydatne dane

OCR C# GitHub: Rozpoznawanie tekstu z IronOCR

.NET OCR SDK: Biblioteka do rozpoznawania tekstu dla C#

Następny krok: Rozpocznij darmową 30-dniową wersję próbną

Następny krok: Rozpocznij darmową 30-dniową wersję próbną

Want to deploy IronSuite to a live project for FREE?

What’s included?

Zaufane przez miliony inżynierów na całym świecie

Zespol wsparcia Iron