How to Tesseract OCR in C# Alternatives with IronOCR

Q: Czy mogę przeprowadzić OCR na dokumentach PDF przy użyciu języka C#?

Tak, dzięki klasie OcrInput w IronOCR można przeprowadzać OCR na dokumentach PDF. Załaduj plik PDF za pomocą input.LoadPdf("file.pdf", "password") i przetwórz go za pomocą var result = ocr.Read(input); . Umożliwia to wyodrębnianie tekstu i tworzenie plików PDF z możliwością wyszukiwania bezpośrednio w aplikacjach C#.

Jacob Mellor

Zaktualizowano:10 stycznia, 2026

Translated

View the article in English

Chcesz wdrożyć rozpoznawanie znaków w swoich aplikacjach C#? Podczas gdy Google Tesseract oferuje bezpłatne rozwiązanie OCR, wielu programistów zmaga się z jego złożoną konfiguracją, ograniczoną dokładnością na rzeczywistych dokumentach oraz wymaganiami interoperacyjności z C++. Ten kompleksowy przewodnik pokazuje, jak osiągnąć dokładność OCR na poziomie 99,8-100% używając ulepszonej implementacji Tesseract w IronOCR - natywna biblioteka C# usuwa problemy z instalacją, zapewniając wybitne wyniki.

Niezależnie od tego, czy wyodrębniasz tekst ze skanowanych dokumentów, przetwarzasz faktury, czy budujesz systemy automatyzacji dokumentów, nauczysz się implementować gotowe do produkcji OCR w minutach zamiast tygodni.

Szybki start: Jednoliniowe OCR z IronTesseract

Pobieraj tekst w sekundach, korzystając z najprostszych API IronOCR. Ten przykład pokazuje, jak jedna linia kodu pozwala wywołać IronTesseract, podać mu obraz i uzyskać rozpoznany tekst — bez zbędnego zamieszania, tylko wyniki.

Install IronOCR with NuGet Package Manager
PM > Install-Package IronOcr

Skopiuj i uruchom ten fragment kodu.

string text = new IronTesseract().Read(new OcrInput("image.png")).Text;

Wdrożenie do testowania w środowisku produkcyjnym

Rozpocznij używanie IronOCR w swoim projekcie już dziś z darmową wersją próbną

Minimalny proces (5 kroków)

Zainstaluj ulepszoną bibliotekę Tesseract OCR poprzez Menedżer pakietów NuGet
Skonfiguruj wstępne przetwarzanie obrazu dla optymalnego rozpoznawania tekstu
Przetwarzaj wiele formatów dokumentów, w tym PDF i wieloklatkowe TIFF
Wyodrębniaj dane strukturalne z metrykami dokładności na poziomie znaków
Wdrażaj na różnych platformach bez natywnych zależności

Kompleksowy przegląd funkcji implementacji Tesseract w IronOCR dla C#, pokazujący zgodność platform, obsługiwane formaty i zaawansowane możliwości przetwarzania

Jak można wyodrębnić tekst z obrazów w C# przy minimalnym kodzie?

Poniższy przykład demonstruje, jak wdrożyć funkcjonalność OCR w aplikacji .NET przy użyciu zaledwie kilku linii kodu. W przeciwieństwie do zwykłego Tesseract, to podejście automatycznie obsługuje wstępne przetwarzanie obrazów i dostarcza dokładne wyniki nawet na niedoskonałych skanach.

Użyj Menedżera pakietów NuGet, aby zainstalować pakiet NuGet IronOCR w rozwiązaniu Visual Studio.

using IronOcr;
using System;

// Initialize IronTesseract for performing OCR (Optical Character Recognition)
var ocr = new IronTesseract
{
    // Set the language for the OCR process to English
    Language = OcrLanguage.English
};

// Create a new OCR input that can hold the images to be processed
using var input = new OcrInput();

// Specify the page indices to be processed from the TIFF image
var pageIndices = new int[] { 1, 2 };

// Load specific pages of the TIFF image into the OCR input object
// Perfect for processing large multi-page documents efficiently
input.LoadImageFrames(@"img\example.tiff", pageIndices);

// Optional pre-processing steps (uncomment as needed)
// input.DeNoise();  // Remove digital noise from scanned documents
// input.Deskew();   // Automatically straighten tilted scans

// Perform OCR on the provided input
OcrResult result = ocr.Read(input);

// Output the recognized text to the console
Console.WriteLine(result.Text);

// Note: The OcrResult object contains detailed information including:
// - Individual words with confidence scores
// - Character positions and bounding boxes
// - Paragraph and line structure

using IronOcr;
using System;

// Initialize IronTesseract for performing OCR (Optical Character Recognition)
var ocr = new IronTesseract
{
    // Set the language for the OCR process to English
    Language = OcrLanguage.English
};

// Create a new OCR input that can hold the images to be processed
using var input = new OcrInput();

// Specify the page indices to be processed from the TIFF image
var pageIndices = new int[] { 1, 2 };

// Load specific pages of the TIFF image into the OCR input object
// Perfect for processing large multi-page documents efficiently
input.LoadImageFrames(@"img\example.tiff", pageIndices);

// Optional pre-processing steps (uncomment as needed)
// input.DeNoise();  // Remove digital noise from scanned documents
// input.Deskew();   // Automatically straighten tilted scans

// Perform OCR on the provided input
OcrResult result = ocr.Read(input);

// Output the recognized text to the console
Console.WriteLine(result.Text);

// Note: The OcrResult object contains detailed information including:
// - Individual words with confidence scores
// - Character positions and bounding boxes
// - Paragraph and line structure

Imports IronOcr
Imports System

' Initialize IronTesseract for performing OCR (Optical Character Recognition)
Private ocr = New IronTesseract With {.Language = OcrLanguage.English}

' Create a new OCR input that can hold the images to be processed
Private input = New OcrInput()

' Specify the page indices to be processed from the TIFF image
Private pageIndices = New Integer() { 1, 2 }

' Load specific pages of the TIFF image into the OCR input object
' Perfect for processing large multi-page documents efficiently
input.LoadImageFrames("img\example.tiff", pageIndices)

' Optional pre-processing steps (uncomment as needed)
' input.DeNoise();  // Remove digital noise from scanned documents
' input.Deskew();   // Automatically straighten tilted scans

' Perform OCR on the provided input
Dim result As OcrResult = ocr.Read(input)

' Output the recognized text to the console
Console.WriteLine(result.Text)

' Note: The OcrResult object contains detailed information including:
' - Individual words with confidence scores
' - Character positions and bounding boxes
' - Paragraph and line structure

$vbLabelText $csharpLabel

Ten kod pokazuje moc uproszczonego API IronOCR. Klasa IronTesseract zapewnia zarządzaną powłokę wokół Tesseract 5, eliminując potrzebę skomplikowanej interoperacyjności z C++. Klasa OcrInput obsługuje ładowanie wielu formatów obrazów i stron, podczas gdy opcjonalne metody wstępnego przetwarzania (DeNoise() i Deskew()) mogą znacznie poprawić dokładność na rzeczywistych dokumentach.

Poza podstawowym wyodrębnianiem tekstu, obiekt OcrResult dostarcza bogate dane strukturalne, w tym poziomy pewności słów, pozycje znaków i strukturę dokumentu - umożliwiając zaawansowane funkcje takie jak tworzenie przeszukiwalnych PDF oraz dokładne śledzenie lokalizacji tekstu.

Jakie są kluczowe różnice w instalacji pomiędzy Tesseract i IronOCR?

Korzystanie z silnika Tesseract do OCR w .NET

Tradycyjna integracja Tesseract z C# wymaga zarządzania bibliotekami C++, co powoduje kilka wyzwań.

Programiści muszą zarządzać binarnymi plikami specyficznymi dla platformy, zapewnić instalację środowiska wykonawczego Visual C++ oraz zarządzać problemami z kompatybilnością 32/64-bitową. Konieczne jest często ręczne kompilowanie bibliotek Tesseract i Leptonica, zwłaszcza dla najnowszych wersji Tesseract 5, które nie były projektowane do kompilacji na Windows.

Wdrażanie międzyplatformowe staje się szczególnie problematyczne w środowiskach Azure, Docker lub Linux, gdzie zezwolenia i zależności różnią się znacząco.

IronOCR Tesseract dla .NET

IronOCR eliminuje złożoność instalacji dzięki pojedynczej zarządzanej bibliotece .NET rozpowszechnianej za pośrednictwem NuGet:

Install-Package IronOcr

Brak natywnych DLL, brak środowisk wykonawczych C++, brak konfiguracji specyficznych dla platformy. Wszystko działa jako czysty kod zarządzany z automatycznym rozwiązywaniem zależności.

Biblioteka zapewnia pełną zgodność z:

.NET Framework 4.6.2 i nowsze
.NET Standard 2.0 i nowszymi (w tym .NET 5, 6, 7, 8, 9 i 10)
.NET Core 2.0 i nowszymi

Takie podejście zapewnia spójne zachowanie na Windows, macOS, Linux, Azure, AWS Lambda, kontenerach Docker, a nawet aplikacjach mobilnych Xamarin.

Jak najnowsze wersje silnika OCR wypadają w rozwoju .NET?

Google Tesseract with C

Tesseract 5, choć potężny, stawia znaczne wyzwania dla programistów Windows.

Najnowsze wersje wymagają cross-kompilacji z użyciem MinGW, co rzadko prowadzi do działających binariów Windows. Darmowe owijki C# na GitHub często opóźniają się latami za najnowszymi wydaniami Tesseract, pomijając istotne ulepszenia i poprawki błędów. Programiści często zmuszeni są używać przestarzałych wersji Tesseract 3.x lub 4.x z powodu tych barier kompilacyjnych.

IronOCR Tesseract dla .NET

IronOCR dostarcza z spersonalizowanym silnikiem Tesseract 5 zoptymalizowanym specjalnie dla .NET.

Ta implementacja zawiera ulepszenia wydajności, takie jak natywna obsługa wielowątkowości, automatyczne przetwarzanie obrazów i wydajne zużycie pamięci przy przetwarzaniu dużych dokumentów. Regularne aktualizacje zapewniają zgodność z najnowszymi wydaniami .NET, jednocześnie utrzymując wsteczną zgodność.

Biblioteka zapewnia również rozległe wsparcie językowe przez dedykowane pakiety NuGet, ułatwiając dodanie możliwości OCR dla ponad 127 języków bez zarządzania zewnętrznymi plikami słownikowymi.

Porównanie z Google Cloud OCR

Podczas gdy Google Cloud Vision OCR oferuje wysoką dokładność, wymaga połączenia z internetem, wiąże się z kosztami za każde żądanie i może budzić obawy dotyczące prywatności danych w przypadku dokumentów poufnych. IronOCR zapewnia porównywalną dokładność z przetwarzaniem na miejscu, co czyni go idealnym dla aplikacji wymagających bezpieczeństwa danych lub możliwości offline.

Jaki poziom dokładności OCR można osiągnąć różnymi podejściami?

Google Tesseract w projektach .NET

Surowy Tesseract doskonale radzi sobie z czytaniem wysokiej rozdzielczości, odpowiednio wyśrodkowanego tekstu, ale ma problemy z rzeczywistymi dokumentami.

Skanowane strony, zdjęcia czy obrazy o niskiej rozdzielczości często dają zniekształcone wyniki, chyba że przejdą rozległe wstępne przetwarzanie. Osiągnięcie akceptowalnej dokładności zazwyczaj wymaga niestandardowych potoków przetwarzania obrazów z użyciem ImageMagick lub podobnych narzędzi - co dodaje tygodnie pracy nad każdym typem dokumentu.

Typowe problemy z dokładnością obejmują:

Nieprawidłowo odczytane znaki na pochylonych dokumentach
Całkowita niezdolność do przetwarzania skanów o niskiej rozdzielczości
Słaba wydajność w przypadku mieszaniny czcionek lub układów
Brak zdolności do radzenia sobie z zakłóceniami tła lub znakami wodnymi

IronOCR Tesseract w projektach .NET

Ulepszona implementacja IronOCR osiąga 99,8-100% dokładności na typowych dokumentach biznesowych bez ręcznego przetwarzania wstępnego:

using IronOcr;
using System;

// Create an instance of the IronTesseract class for OCR processing
var ocr = new IronTesseract();

// Create an OcrInput object to load and preprocess images
using var input = new OcrInput();

// Specify which pages to extract from multi-page documents
var pageIndices = new int[] { 1, 2 };

// Load specific frames from a TIFF file
// IronOCR automatically detects and handles various image formats
input.LoadImageFrames(@"img\example.tiff", pageIndices);

// Apply automatic image enhancement filters
// These filters dramatically improve accuracy on imperfect scans
input.DeNoise();    // Removes digital artifacts and speckles
input.Deskew();     // Corrects rotation up to 15 degrees

// Perform OCR with enhanced accuracy algorithms
OcrResult result = ocr.Read(input);

// Access the extracted text with confidence metrics
Console.WriteLine(result.Text);

// Additional accuracy features available:
// - result.Confidence: Overall accuracy percentage
// - result.Pages[0].Words: Word-level confidence scores
// - result.Blocks: Structured document layout analysis

using IronOcr;
using System;

// Create an instance of the IronTesseract class for OCR processing
var ocr = new IronTesseract();

// Create an OcrInput object to load and preprocess images
using var input = new OcrInput();

// Specify which pages to extract from multi-page documents
var pageIndices = new int[] { 1, 2 };

// Load specific frames from a TIFF file
// IronOCR automatically detects and handles various image formats
input.LoadImageFrames(@"img\example.tiff", pageIndices);

// Apply automatic image enhancement filters
// These filters dramatically improve accuracy on imperfect scans
input.DeNoise();    // Removes digital artifacts and speckles
input.Deskew();     // Corrects rotation up to 15 degrees

// Perform OCR with enhanced accuracy algorithms
OcrResult result = ocr.Read(input);

// Access the extracted text with confidence metrics
Console.WriteLine(result.Text);

// Additional accuracy features available:
// - result.Confidence: Overall accuracy percentage
// - result.Pages[0].Words: Word-level confidence scores
// - result.Blocks: Structured document layout analysis

Imports IronOcr
Imports System

' Create an instance of the IronTesseract class for OCR processing
Private ocr = New IronTesseract()

' Create an OcrInput object to load and preprocess images
Private input = New OcrInput()

' Specify which pages to extract from multi-page documents
Private pageIndices = New Integer() { 1, 2 }

' Load specific frames from a TIFF file
' IronOCR automatically detects and handles various image formats
input.LoadImageFrames("img\example.tiff", pageIndices)

' Apply automatic image enhancement filters
' These filters dramatically improve accuracy on imperfect scans
input.DeNoise() ' Removes digital artifacts and speckles
input.Deskew() ' Corrects rotation up to 15 degrees

' Perform OCR with enhanced accuracy algorithms
Dim result As OcrResult = ocr.Read(input)

' Access the extracted text with confidence metrics
Console.WriteLine(result.Text)

' Additional accuracy features available:
' - result.Confidence: Overall accuracy percentage
' - result.Pages[0].Words: Word-level confidence scores
' - result.Blocks: Structured document layout analysis

$vbLabelText $csharpLabel

Automatyczne filtry przetwarzania wstępnego radzą sobie z powszechnymi problemami jakościowymi dokumentów, które w innym przypadku wymagałyby ręcznej interwencji. Metoda DeNoise() usuwa cyfrowe artefakty ze skanowania, podczas gdy Deskew() koryguje rotację dokumentu - oba krytyczne dla utrzymania wysokiej dokładności.

Zaawansowani użytkownicy mogą dodatkowo optymalizować dokładność za pomocą niestandardowych konfiguracji, w tym białych list znaków, przetwarzania obszarowego i modeli językowych dostosowanych do specyficznego dla branży słownictwa.

Jakie formaty obrazów i źródła są obsługiwane do przetwarzania OCR?

Google Tesseract w .NET

Natywny Tesseract akceptuje tylko format Leptonica PIX - Niezarządzane wskaźniki C++, które są trudne do współpracy w C#.

Konwersja obrazów .NET na format PIX wymaga starannego zarządzania pamięcią, aby zapobiec wyciekom. Wsparcie dla PDF-ów i wielostronicowych TIFF-ów wymaga dodatkowych bibliotek z własnymi problemami zgodności. Wiele implementacji ma problem z podstawowymi konwersjami formatów, co ogranicza praktyczną użyteczność.

Zgodność obrazów IronOCR

IronOCR zapewnia kompleksową obsługę formatów z automatyczną konwersją:

Dokumenty PDF (w tym zabezpieczone hasłem)
Pliki TIFF wieloklatkowe
Standardowe formaty: JPEG, PNG, GIF, BMP
Zaawansowane formaty: JPEG2000, WBMP
Typy .NET: System.Drawing.Image, System.Drawing.Bitmap
Źródła danych: Strumienie, tablice bajtów, ścieżki plików
Bezpośrednia integracja skanera

Przykład wsparcia kompleksowego formatów

using IronOcr;
using System;

// Initialize IronTesseract for OCR operations
var ocr = new IronTesseract();

// Create an OcrInput container for multiple sources
using var input = new OcrInput();

// Load password-protected PDFs seamlessly
// IronOCR handles PDF rendering internally
input.LoadPdf("example.pdf", "password");

// Process specific pages from multi-page TIFFs
// Perfect for batch document processing
var pageIndices = new int[] { 1, 2 };
input.LoadImageFrames("multi-frame.tiff", pageIndices);

// Add individual images in any common format
// Automatic format detection and conversion
input.LoadImage("image1.png");
input.LoadImage("image2.jpeg");

// Process all loaded content in a single operation
// Results maintain document structure and ordering
var result = ocr.Read(input);

// Extract text while preserving document layout
Console.WriteLine(result.Text);

// Advanced features for complex documents:
// - Extract images from specific PDF pages
// - Process only certain regions of images
// - Maintain reading order across mixed formats

using IronOcr;
using System;

// Initialize IronTesseract for OCR operations
var ocr = new IronTesseract();

// Create an OcrInput container for multiple sources
using var input = new OcrInput();

// Load password-protected PDFs seamlessly
// IronOCR handles PDF rendering internally
input.LoadPdf("example.pdf", "password");

// Process specific pages from multi-page TIFFs
// Perfect for batch document processing
var pageIndices = new int[] { 1, 2 };
input.LoadImageFrames("multi-frame.tiff", pageIndices);

// Add individual images in any common format
// Automatic format detection and conversion
input.LoadImage("image1.png");
input.LoadImage("image2.jpeg");

// Process all loaded content in a single operation
// Results maintain document structure and ordering
var result = ocr.Read(input);

// Extract text while preserving document layout
Console.WriteLine(result.Text);

// Advanced features for complex documents:
// - Extract images from specific PDF pages
// - Process only certain regions of images
// - Maintain reading order across mixed formats

Imports IronOcr
Imports System

' Initialize IronTesseract for OCR operations
Private ocr = New IronTesseract()

' Create an OcrInput container for multiple sources
Private input = New OcrInput()

' Load password-protected PDFs seamlessly
' IronOCR handles PDF rendering internally
input.LoadPdf("example.pdf", "password")

' Process specific pages from multi-page TIFFs
' Perfect for batch document processing
Dim pageIndices = New Integer() { 1, 2 }
input.LoadImageFrames("multi-frame.tiff", pageIndices)

' Add individual images in any common format
' Automatic format detection and conversion
input.LoadImage("image1.png")
input.LoadImage("image2.jpeg")

' Process all loaded content in a single operation
' Results maintain document structure and ordering
Dim result = ocr.Read(input)

' Extract text while preserving document layout
Console.WriteLine(result.Text)

' Advanced features for complex documents:
' - Extract images from specific PDF pages
' - Process only certain regions of images
' - Maintain reading order across mixed formats

$vbLabelText $csharpLabel

To zjednoczone podejście do ładowania dokumentów eliminuje kod specyficzny dla formatu. Niezależnie od przetwarzania skanowanych TIFF-ów, cyfrowych PDF-ów czy zdjęć z telefonu, to samo API obsługuje wszystkie scenariusze. Klasa OcrInput inteligentnie zarządza pamięcią i dostarcza spójne wyniki niezależnie od formatu źródłowego.

Dla specjalistycznych scenariuszy, IronOCR obsługuje także odczyt kodów kreskowych i QR z tych samych dokumentów, umożliwiając kompleksowe wydobywanie danych z dokumentów w jednym przejściu.

Jak wypadają osiągi OCR w rzeczywistych aplikacjach?

Wydajność darmowego Google Tesseract

Vanilla Tesseract może dostarczać akceptowalnej prędkości na wstępnie przetworzonych, wysokorozdzielczych obrazach, które pasują do jego danych szkoleniowych.

Jednak rzeczywista wydajność często rozczarowuje. Przetwarzanie jednej strony zeskanowanego dokumentu może zająć 10-30 sekund, gdy Tesseract ma trudności z jakością obrazu. Architektura jednowątkowa staje się wąskim gardłem w przetwarzaniu wsadowym, a użycie pamięci może spiralnie rosnąć przy dużych obrazach.

Wydajność Biblioteki IronOCR Tesseract

IronOCR wdraża inteligentne optymalizacje wydajności dla obciążeń produkcyjnych:

using IronOcr;
using System;

// Configure IronTesseract for optimal performance
var ocr = new IronTesseract();

// Performance optimization: disable unnecessary character recognition
// Speeds up processing by 20-30% when special characters aren't needed
ocr.Configuration.BlackListCharacters = "~`$#^*_}{][|\\@¢©«»°±·×-–—''""•…′″€™←↑→↓↔⇄⇒∅∼≅≈≠≤≥≪≫⌁⌘○◔◑◕●";

// Use automatic page segmentation for faster processing
// Adapts to document layout without manual configuration
ocr.Configuration.PageSegmentationMode = TesseractPageSegmentationMode.Auto;

// Disable barcode scanning when not needed
// Eliminates unnecessary processing overhead
ocr.Configuration.ReadBarCodes = false;

// Switch to fast language pack for speed-critical applications
// Trades minimal accuracy for 40% performance improvement
ocr.Language = OcrLanguage.EnglishFast;

// Load and process documents efficiently
using var input = new OcrInput();
var pageIndices = new int[] { 1, 2 };
input.LoadImageFrames(@"img\Potter.tiff", pageIndices);

// Multi-threaded processing utilizes all CPU cores
// Automatically scales based on system capabilities
var result = ocr.Read(input);

Console.WriteLine(result.Text);

// Performance monitoring capabilities:
// - result.TimeToRead: Processing duration
// - result.InputDetails: Image analysis metrics
// - Memory-efficient streaming for large documents

using IronOcr;
using System;

// Configure IronTesseract for optimal performance
var ocr = new IronTesseract();

// Performance optimization: disable unnecessary character recognition
// Speeds up processing by 20-30% when special characters aren't needed
ocr.Configuration.BlackListCharacters = "~`$#^*_}{][|\\@¢©«»°±·×-–—''""•…′″€™←↑→↓↔⇄⇒∅∼≅≈≠≤≥≪≫⌁⌘○◔◑◕●";

// Use automatic page segmentation for faster processing
// Adapts to document layout without manual configuration
ocr.Configuration.PageSegmentationMode = TesseractPageSegmentationMode.Auto;

// Disable barcode scanning when not needed
// Eliminates unnecessary processing overhead
ocr.Configuration.ReadBarCodes = false;

// Switch to fast language pack for speed-critical applications
// Trades minimal accuracy for 40% performance improvement
ocr.Language = OcrLanguage.EnglishFast;

// Load and process documents efficiently
using var input = new OcrInput();
var pageIndices = new int[] { 1, 2 };
input.LoadImageFrames(@"img\Potter.tiff", pageIndices);

// Multi-threaded processing utilizes all CPU cores
// Automatically scales based on system capabilities
var result = ocr.Read(input);

Console.WriteLine(result.Text);

// Performance monitoring capabilities:
// - result.TimeToRead: Processing duration
// - result.InputDetails: Image analysis metrics
// - Memory-efficient streaming for large documents

Imports IronOcr
Imports System

' Configure IronTesseract for optimal performance
Dim ocr As New IronTesseract()

' Performance optimization: disable unnecessary character recognition
' Speeds up processing by 20-30% when special characters aren't needed
ocr.Configuration.BlackListCharacters = "~`$#^*_}{][|\@¢©«»°±·×-–—''""•…′″€™←↑→↓↔⇄⇒∅∼≅≈≠≤≥≪≫⌁⌘○◔◑◕●"

' Use automatic page segmentation for faster processing
' Adapts to document layout without manual configuration
ocr.Configuration.PageSegmentationMode = TesseractPageSegmentationMode.Auto

' Disable barcode scanning when not needed
' Eliminates unnecessary processing overhead
ocr.Configuration.ReadBarCodes = False

' Switch to fast language pack for speed-critical applications
' Trades minimal accuracy for 40% performance improvement
ocr.Language = OcrLanguage.EnglishFast

' Load and process documents efficiently
Using input As New OcrInput()
    Dim pageIndices As Integer() = {1, 2}
    input.LoadImageFrames("img\Potter.tiff", pageIndices)

    ' Multi-threaded processing utilizes all CPU cores
    ' Automatically scales based on system capabilities
    Dim result = ocr.Read(input)

    Console.WriteLine(result.Text)

    ' Performance monitoring capabilities:
    ' - result.TimeToRead: Processing duration
    ' - result.InputDetails: Image analysis metrics
    ' - Memory-efficient streaming for large documents
End Using

$vbLabelText $csharpLabel

Te optymalizacje pokazują gotowość IronOCR do produkcji. Konfiguracja BlackListCharacters sama może poprawić prędkość o 20-30% przy braku potrzeby znaków specjalnych. Szybkie zestawy językowe zapewniają doskonałą równowagę dla przetwarzania dużych przesyłek, gdzie idealna dokładność nie jest krytyczna.

Dla aplikacji klasy Enterprise wsparcie wielowątkowości w IronOCR pozwala na jednoczesne przetwarzanie wielu dokumentów, osiągając poprawę wydajności 4-8x na nowoczesnych systemach wielordzeniowych w porównaniu do jednowątkowego Tesseract.

Co wyróżnia projekty API pomiędzy Tesseract a IronOCR?

Google Tesseract OCR w .NET

Integracja surowego Tesseract w aplikacjach C# przedstawia dwa trudne opcje:

Owijki interop: Często przestarzałe, słabo udokumentowane i podatne na wycieki pamięci
Wykonywanie z linii poleceń: Trudne do wdrożenia, blokowane przez polityki bezpieczeństwa, słabe zarządzanie błędami

Żadna z tych metod nie działa niezawodnie w środowiskach chmurowych, aplikacjach webowych czy wdrożeniach międzyplatformowych. Brak właściwej integracji z .NET oznacza więcej czasu spędzonego na walce z narzędziami niż na rozwiązywaniu problemów biznesowych.

Biblioteka IronOCR Tesseract OCR dla .NET

IronOCR oferuje w pełni zarządzany, intuicyjny interfejs API zaprojektowany specjalnie dla programistów .NET:

Najprostsze wdrożenie

using IronOcr;

// Initialize the OCR engine with full IntelliSense support
var ocr = new IronTesseract();

// Process an image with automatic format detection
// Handles JPEG, PNG, TIFF, PDF, and more
var result = ocr.Read("img.png");

// Extract text with confidence metrics
string extractedText = result.Text;
Console.WriteLine(extractedText);

// Rich API provides detailed results:
// - result.Confidence: Overall accuracy percentage
// - result.Pages: Page-by-page breakdown
// - result.Paragraphs: Document structure
// - result.Words: Individual word details
// - result.Barcodes: Detected barcode values

using IronOcr;

// Initialize the OCR engine with full IntelliSense support
var ocr = new IronTesseract();

// Process an image with automatic format detection
// Handles JPEG, PNG, TIFF, PDF, and more
var result = ocr.Read("img.png");

// Extract text with confidence metrics
string extractedText = result.Text;
Console.WriteLine(extractedText);

// Rich API provides detailed results:
// - result.Confidence: Overall accuracy percentage
// - result.Pages: Page-by-page breakdown
// - result.Paragraphs: Document structure
// - result.Words: Individual word details
// - result.Barcodes: Detected barcode values

Imports IronOcr

' Initialize the OCR engine with full IntelliSense support
Private ocr = New IronTesseract()

' Process an image with automatic format detection
' Handles JPEG, PNG, TIFF, PDF, and more
Private result = ocr.Read("img.png")

' Extract text with confidence metrics
Private extractedText As String = result.Text
Console.WriteLine(extractedText)

' Rich API provides detailed results:
' - result.Confidence: Overall accuracy percentage
' - result.Pages: Page-by-page breakdown
' - result.Paragraphs: Document structure
' - result.Words: Individual word details
' - result.Barcodes: Detected barcode values

$vbLabelText $csharpLabel

To uproszczone API eliminuje złożoność tradycyjnej integracji Tesseract. Każda metoda zawiera kompleksową dokumentację XML, co ułatwia odkrywanie funkcji bezpośrednio w IDE. Rozległa dokumentacja API dostarcza szczegółowych przykładów dla każdej funkcji.

Profesjonalne wsparcie od doświadczonych inżynierów zapewnia, że nigdy nie utkniesz na szczegółach wdrożenia. Biblioteka regularnie otrzymuje aktualizacje, utrzymując zgodność z najnowszymi wydaniami .NET, jednocześnie dodając nowe funkcje na podstawie opinii programistów.

Jakie platformy i scenariusze wdrożenia są obsługiwane?

Google Tesseract + Interop dla .NET

Cross-platformowe wdrożenie Tesseract wymaga specyficznych dla platformy kompilacji i konfiguracji.

Każde środowisko docelowe wymaga różnych binariów, zależności środowiskowych i uprawnień. Kontenery Docker wymagają starannego wyboru obrazu bazowego. Wdrożenia w Azure często zawodzą z powodu braku środowisk Visual C++. Zgodność Linux zależy od konkretnych dystrybucji i dostępności pakietów.

Biblioteka IronOCR Tesseract .NET OCR

IronOCR zapewnia prawdziwą zdolność napisz raz, wdroż wszędzie:

Typy aplikacji:

Aplikacje desktopowe (WPF, WinForms, Konsola)
Aplikacje webowe (ASP.NET Core, Blazor)
Usługi chmurowe (Azure Functions, AWS Lambda)
Aplikacje mobilne (za pomocą Xamarin)
Mikrousługi (Docker, Kubernetes)

Wsparcie Platformy:

Windows (7, 8, 10, 11, edycje Server)
macOS (Intel i Apple Silicon)
Linux (Ubuntu, Debian, CentOS, Alpine)
Kontenery Docker (oficjalne obrazy bazowe)
Platformy chmurowe (Azure, AWS, Google Cloud)

Zgodność z .NET:

.NET Framework 4.6.2 i wyższe
.NET Standard 2.0 i wyższe (w tym .NET 5, 6, 7, 8, 9 i 10)
.NET Core 2.0 i wyższe
Mono framework
Xamarin.Mac

Biblioteka zarządza różnicami platformowymi wewnętrznie, zapewniając spójne wyniki we wszystkich środowiskach. Przewodniki wdrożeniowe pokrywają konkretne scenariusze, w tym konteneryzację, funkcje bezserwerowe i konfiguracje wysokiej dostępności.

Jak wypadają możliwości OCR wielojęzycznego?

Wsparcie językowe Google Tesseract

Zarządzanie językami w surowym Tesseract wymaga pobierania i utrzymywania plików tessdata - około 4GB dla wszystkich języków.

Struktura folderów musi być precyzyjna, zmienne środowiskowe poprawnie skonfigurowane, a ścieżki dostępne w czasie działania. Zmiana języka wymaga dostępu do systemu plików, co komplikuje wdrożenie w środowiskach ograniczonych. Niezgodności wersji pomiędzy binariami Tesseract a plikami językowymi powodują błędy trudne do zdiagnozowania.

Zarządzanie językami w IronOCR

IronOCR rewolucjonizuje wsparcie językowe poprzez zarządzanie pakietami NuGet:

Przykład OCR w języku arabskim

using IronOcr;

// Configure IronTesseract for Arabic text recognition
var ocr = new IronTesseract
{
    // Set primary language to Arabic
    // Automatically handles right-to-left text
    Language = OcrLanguage.Arabic
};

// Load Arabic documents for processing
using var input = new OcrInput();
var pageIndices = new int[] { 1, 2 };
input.LoadImageFrames("img/arabic.gif", pageIndices);

// IronOCR includes specialized preprocessing for Arabic scripts
// Handles cursive text and diacritical marks automatically

// Perform OCR with language-specific optimizations
var result = ocr.Read(input);

// Save results with proper Unicode encoding
// Preserves Arabic text formatting and direction
result.SaveAsTextFile("arabic.txt");

// Advanced Arabic features:
// - Mixed Arabic/English document support
// - Automatic number conversion (Eastern/Western Arabic)
// - Font-specific optimization for common Arabic typefaces

using IronOcr;

// Configure IronTesseract for Arabic text recognition
var ocr = new IronTesseract
{
    // Set primary language to Arabic
    // Automatically handles right-to-left text
    Language = OcrLanguage.Arabic
};

// Load Arabic documents for processing
using var input = new OcrInput();
var pageIndices = new int[] { 1, 2 };
input.LoadImageFrames("img/arabic.gif", pageIndices);

// IronOCR includes specialized preprocessing for Arabic scripts
// Handles cursive text and diacritical marks automatically

// Perform OCR with language-specific optimizations
var result = ocr.Read(input);

// Save results with proper Unicode encoding
// Preserves Arabic text formatting and direction
result.SaveAsTextFile("arabic.txt");

// Advanced Arabic features:
// - Mixed Arabic/English document support
// - Automatic number conversion (Eastern/Western Arabic)
// - Font-specific optimization for common Arabic typefaces

Imports IronOcr

' Configure IronTesseract for Arabic text recognition
Private ocr = New IronTesseract With {.Language = OcrLanguage.Arabic}

' Load Arabic documents for processing
Private input = New OcrInput()
Private pageIndices = New Integer() { 1, 2 }
input.LoadImageFrames("img/arabic.gif", pageIndices)

' IronOCR includes specialized preprocessing for Arabic scripts
' Handles cursive text and diacritical marks automatically

' Perform OCR with language-specific optimizations
Dim result = ocr.Read(input)

' Save results with proper Unicode encoding
' Preserves Arabic text formatting and direction
result.SaveAsTextFile("arabic.txt")

' Advanced Arabic features:
' - Mixed Arabic/English document support
' - Automatic number conversion (Eastern/Western Arabic)
' - Font-specific optimization for common Arabic typefaces

$vbLabelText $csharpLabel

Przetwarzanie dokumentów wielojęzycznych

using IronOcr;

// Install language packs via NuGet:
// PM> Install-Package IronOcr.Languages.ChineseSimplified

// Configure multi-language OCR
var ocr = new IronTesseract();

// Set primary language for majority content
ocr.Language = OcrLanguage.ChineseSimplified;

// Add secondary language for mixed content
// Perfect for documents with Chinese text and English metadata
ocr.AddSecondaryLanguage(OcrLanguage.English);

// Process multi-language PDFs efficiently
using var input = new OcrInput();
input.LoadPdf("multi-language.pdf");

// IronOCR automatically detects and switches between languages
// Maintains high accuracy across language boundaries
var result = ocr.Read(input);

// Export preserves all languages correctly
result.SaveAsTextFile("results.txt");

// Supported scenarios:
// - Technical documents with English terms in foreign text
// - Multilingual forms and applications  
// - International business documents
// - Mixed-script content (Latin, CJK, Arabic, etc.)

using IronOcr;

// Install language packs via NuGet:
// PM> Install-Package IronOcr.Languages.ChineseSimplified

// Configure multi-language OCR
var ocr = new IronTesseract();

// Set primary language for majority content
ocr.Language = OcrLanguage.ChineseSimplified;

// Add secondary language for mixed content
// Perfect for documents with Chinese text and English metadata
ocr.AddSecondaryLanguage(OcrLanguage.English);

// Process multi-language PDFs efficiently
using var input = new OcrInput();
input.LoadPdf("multi-language.pdf");

// IronOCR automatically detects and switches between languages
// Maintains high accuracy across language boundaries
var result = ocr.Read(input);

// Export preserves all languages correctly
result.SaveAsTextFile("results.txt");

// Supported scenarios:
// - Technical documents with English terms in foreign text
// - Multilingual forms and applications  
// - International business documents
// - Mixed-script content (Latin, CJK, Arabic, etc.)

Imports IronOcr

' Install language packs via NuGet:
' PM> Install-Package IronOcr.Languages.ChineseSimplified

' Configure multi-language OCR
Private ocr = New IronTesseract()

' Set primary language for majority content
ocr.Language = OcrLanguage.ChineseSimplified

' Add secondary language for mixed content
' Perfect for documents with Chinese text and English metadata
ocr.AddSecondaryLanguage(OcrLanguage.English)

' Process multi-language PDFs efficiently
Dim input = New OcrInput()
input.LoadPdf("multi-language.pdf")

' IronOCR automatically detects and switches between languages
' Maintains high accuracy across language boundaries
Dim result = ocr.Read(input)

' Export preserves all languages correctly
result.SaveAsTextFile("results.txt")

' Supported scenarios:
' - Technical documents with English terms in foreign text
' - Multilingual forms and applications  
' - International business documents
' - Mixed-script content (Latin, CJK, Arabic, etc.)

$vbLabelText $csharpLabel

System pakietów językowych obsługuje ponad 127 języków, każdy zoptymalizowany dla specyficznych skryptów i systemów pisma. Instalacja przez NuGet zapewnia zgodność wersji i upraszcza wdrożenie w różnych środowiskach.

Jakie dodatkowe funkcje oferuje IronOCR poza podstawowym OCR?

IronOCR wykracza daleko poza podstawowe wyodrębnianie tekstu z funkcjami gotowymi do zastosowania w przedsiębiorstwach:

Automatyczna analiza obrazów: Inteligentnie konfiguruje przetwarzanie w oparciu o charakterystyki obrazu
Tworzenie przeszukiwalnych PDF: Przekształć zeskanowane dokumenty w w pełni przeszukiwalne PDF. Przekaż true jako drugi argument do SaveAsSearchablePdf() aby zastosować aktywne filtry OCR do wyników (dodano w wersji v2025.5.11)
Zaawansowane OCR PDF: Wyodrębniaj tekst z zachowaniem struktury dokumentu
Odczyt kodów kreskowych i QR: Wykrywaj i dekoduj kody kreskowe podczas tego samego przejścia
Eksport do HTML: Generuj strukturalny HTML z wyników OCR
Konwersja TIFF do PDF: Przekształć wielostronicowe TIFF w przeszukiwalne PDF
OCR pisma odręcznego w języku angielskim: Natywne rozpoznanie pisma ręcznego dla angielskiego, Dodane w v2025.11.31 — silne wyróżnienie w porównaniu z surowym Tesseract przy przetwarzaniu formularzy ręcznie wypełnionych i notatek
Wykrywanie orientacji: DetectPageOrientation() obsługuje cztery wartości OrientationDetectionMode — Fast, Balanced, Detailed, ExtremeDetailed — do kontrolowania kompromisu między dokładnością a prędkością (dodano w v2025.8.6)
Wsparcie wielowątkowe: Przetwórz wiele dokumentów jednocześnie
Szczegółowa analiza wyników: Dostęp do danych na poziomie znaków z poziomami pewności

Scale() i EnhanceResolution() są niekompatybilne z SaveAsSearchablePdf() z powodu znanej usterki w v2025.12.3. Wszystkie inne filtry działają poprawnie z wyjściem przeszukiwalnego PDF.

Klasa OcrResult zapewnia granulowany dostęp do rozpoznawanej zawartości, umożliwiając zaawansowane post-processing i walidację workflowów.

Jakie rozwiązanie OCR wybrać do rozwoju w C#?

Google Tesseract dla OCR w C

Wybierz vanilla Tesseract, gdy:

Pracujesz nad projektami akademickimi lub badawczymi
Przetwarzasz perfekcyjnie zeskanowane dokumenty z nieograniczonym czasem na rozwój
Budujesz aplikacje typu proof-of-concept
Koszty są jedynym rozważaniem

Bądź przygotowany na znaczące wyzwania integracyjne i wymagania utrzymaniowe.

Biblioteka IronOCR Tesseract OCR dla .NET Framework & Core

IronOCR jest optymalnym wyborem dla:

Aplikacji produkcyjnych wymagających niezawodności
Projektów z rzeczywistą jakością dokumentów
Wdrożeń międzyplatformowych
Czasochłonnych harmonogramów rozwoju
Aplikacji wymagających profesjonalnego wsparcia

Biblioteka zwraca koszty przez skrócenie czasu rozwoju i lepszą dokładność na trudnych dokumentach.

Jak zacząć z profesjonalnym OCR w projekcie C#?

Rozpocznij wdrażanie OCR o wysokiej dokładności w swoim projekcie Visual Studio:

Install-Package IronOcr

Lub pobierz bezpośrednio DLL IronOCR .NET do ręcznej instalacji.

Zacznij od naszego kompleksowego przewodnika wprowadzającego, odkryj przykłady kodu i skorzystaj z profesjonalnego wsparcia, gdy będziesz tego potrzebować.

Poznaj różnicę, jaką robi profesjonalne OCR - rozpocznij bezpłatny okres próbny już dziś i dołącz do ponad 10 000 firm osiągających 99,8%+ dokładności w swoich procesach przetwarzania dokumentów.

Logos of major companies including NASA, LEGO, and 3M that trust Iron Software products for their OCR needs Technologia OCR Iron Software jest zaufana przez firmy z listy Fortune 500 i organizacje rządowe na całym świecie w przypadku krytycznych dla misji przetwarzania dokumentów

Często Zadawane Pytania

Jak zaimplementować OCR Tesseract w aplikacjach C#?

Aby zaimplementować OCR Tesseract w aplikacjach C#, można użyć klasy IronTesseract z biblioteki IronOCR. Należy ją zainstalować za pomocą NuGet, używając polecenia Install-Package IronOcr, a następnie dodać przestrzeń nazw za pomocą IronOcr;. Silnik OCR należy zainicjować za pomocą var ocr = new IronTesseract();, a tekst z obrazu wyodrębnić za pomocą var result = ocr.Read("image.png");.

Jakie są zalety korzystania z IronOCR w porównaniu z tradycyjnym Tesseractem?

IronOCR oferuje kilka korzyści w porównaniu z tradycyjnym Tesseractem, w tym uproszczone wdrażanie bez zależności natywnych, automatyczne przetwarzanie wstępne obrazów w celu zwiększenia dokładności oraz zarządzaną integrację z platformą .NET. Zapewnia takie funkcje, jak obsługa plików PDF i wielu języków, a także można go łatwo zainstalować za pośrednictwem NuGet, unikając skomplikowanej interoperacyjności z językiem C++ wymaganej przez standardowy Tesseract.

Jak mogę poprawić dokładność OCR w moich projektach C#?

Aby poprawić dokładność OCR w projektach C#, należy skorzystać z funkcji automatycznej poprawy jakości obrazu w IronOCR. Metody takie jak input.DeNoise() i input.Deskew() pomagają w wstępnym przetwarzaniu obrazów, redukując szumy i korygując przekrzywienie. Dodatkowo należy wybrać odpowiednie ustawienia językowe i korzystać z wskaźników pewności w celu weryfikacji dokładności za pomocą OcrResult.Confidence.

Czy mogę przeprowadzić OCR na dokumentach PDF przy użyciu języka C#?

Tak, dzięki klasie OcrInput w IronOCR można przeprowadzać OCR na dokumentach PDF. Załaduj plik PDF za pomocą input.LoadPdf("file.pdf", "password") i przetwórz go za pomocą var result = ocr.Read(input);. Umożliwia to wyodrębnianie tekstu i tworzenie plików PDF z możliwością wyszukiwania bezpośrednio w aplikacjach C#.

Jak radzić sobie z wieloma językami w jednym dokumencie OCR?

IronOCR umożliwia przetwarzanie wielu języków w jednym dokumencie. Ustaw język główny za pomocą OCR.Language = OcrLanguage.English; i dodaj języki dodatkowe za pomocą OCR.AddSecondaryLanguage(OcrLanguage.Spanish);. Ta elastyczność jest przydatna w przypadku dokumentów zawierających mieszankę języków lub terminów technicznych.

Jakie platformy obsługują IronOCR?

IronOCR obsługuje szeroką gamę platform, w tym .NET Framework 4.6.2+, .NET Core 2.0+, .NET 5-10 oraz .NET Standard 2.0+. Działa na systemach Windows, macOS i Linux, a także w kontenerach Docker, Azure Functions, AWS Lambda i aplikacjach mobilnych Xamarin, zapewniając stałą wydajność w różnych środowiskach.

Jak mogę zoptymalizować wydajność przetwarzania OCR w języku C#?

Aby zoptymalizować wydajność przetwarzania OCR w języku C#, należy wykorzystać funkcje IronOCR, takie jak wyłączenie zbędnego skanowania BarCode za pomocą ocr.Configuration.ReadBarCodes = false; oraz wybór szybszych modeli językowych, np. ocr.Language = OcrLanguage.EnglishFast;. Dodatkowo warto wykorzystać możliwości wielowątkowości w celu przyspieszenia przetwarzania wsadowego.

Jakie formaty obrazów obsługuje IronOCR?

IronOCR obsługuje różne formaty obrazów, w tym PDF, TIFF, JPEG i PNG. Użyj klasy OcrInput do ładowania obrazów za pomocą metod takich jak input.LoadImage("photo.jpg") lub input.LoadPdf("file.pdf"). Ta szeroka kompatybilność pozwala na łatwą integrację z różnymi źródłami i formatami obrazów.

Jacob Mellor

Czat z zespołem inżynierów teraz

Dyrektor ds. technologii

Jacob Mellor jest Chief Technology Officer w Iron Software i wizjonerskim inżynierem, pionierem technologii C# PDF. Jako pierwotny deweloper głównej bazy kodowej Iron Software, kształtuje architekturę produktów firmy od jej początku, przekształcając ją wspólnie z CEO Cameron Rimington w firmę liczą...

Czytaj więcej

Jeffrey T. Fritz

Główny Menedżer Programu - Zespół .NET Community

Jeff jest również Głównym Menedżerem Programu dla zespołów .NET i Visual Studio. Jest producentem wykonawczym wirtualnej serii konferencji .NET Conf i prowadzi 'Fritz and Friends', transmisję na żywo dla deweloperów emitowaną dwa razy w tygodniu, gdzie rozmawia o technologii i pisze kod razem z widzami. Jeff pisze warsztaty, prezentacje i planuje treści dla największych wydarzeń Microsoft dla deweloperów, w tym Microsoft Build, Microsoft Ignite, .NET Conf i Microsoft MVP Summit.

Gotowy, aby rozpocząć?

Nuget Pliki do pobrania 5,571,678 | Wersja: 2026.4 just released

Zobacz licencje

Wciąż przewijasz?

Czy chcesz szybko dowodu? PM > Install-Package IronOcr
uruchom próbkę obserwuj, jak twój obraz staje się tekstem z możliwością wyszukiwania.

Zobacz licencje

Rozpocznij darmowy 30-dniowy okres próbny

Na tej stronie

How to Tesseract OCR in C# Alternatives with IronOCR

Install IronOCR with NuGet Package Manager

Skopiuj i uruchom ten fragment kodu.

Wdrożenie do testowania w środowisku produkcyjnym

Minimalny proces (5 kroków)

Jak można wyodrębnić tekst z obrazów w C# przy minimalnym kodzie?

Jakie są kluczowe różnice w instalacji pomiędzy Tesseract i IronOCR?

Korzystanie z silnika Tesseract do OCR w .NET

IronOCR Tesseract dla .NET

Jak najnowsze wersje silnika OCR wypadają w rozwoju .NET?

Google Tesseract with C

IronOCR Tesseract dla .NET

Porównanie z Google Cloud OCR

Jaki poziom dokładności OCR można osiągnąć różnymi podejściami?

Google Tesseract w projektach .NET

IronOCR Tesseract w projektach .NET

Jakie formaty obrazów i źródła są obsługiwane do przetwarzania OCR?

Google Tesseract w .NET

Zgodność obrazów IronOCR

Przykład wsparcia kompleksowego formatów

Jak wypadają osiągi OCR w rzeczywistych aplikacjach?

Wydajność darmowego Google Tesseract

Wydajność Biblioteki IronOCR Tesseract

Co wyróżnia projekty API pomiędzy Tesseract a IronOCR?

Google Tesseract OCR w .NET

Biblioteka IronOCR Tesseract OCR dla .NET

Najprostsze wdrożenie

Jakie platformy i scenariusze wdrożenia są obsługiwane?

Google Tesseract + Interop dla .NET

Biblioteka IronOCR Tesseract .NET OCR

Jak wypadają możliwości OCR wielojęzycznego?

Wsparcie językowe Google Tesseract

Zarządzanie językami w IronOCR

Przykład OCR w języku arabskim

Przetwarzanie dokumentów wielojęzycznych

Jakie dodatkowe funkcje oferuje IronOCR poza podstawowym OCR?

Jakie rozwiązanie OCR wybrać do rozwoju w C#?

Google Tesseract dla OCR w C

Biblioteka IronOCR Tesseract OCR dla .NET Framework & Core

Jak zacząć z profesjonalnym OCR w projekcie C#?

Często Zadawane Pytania

Jak zaimplementować OCR Tesseract w aplikacjach C#?

Jakie są zalety korzystania z IronOCR w porównaniu z tradycyjnym Tesseractem?

Jak mogę poprawić dokładność OCR w moich projektach C#?

Czy mogę przeprowadzić OCR na dokumentach PDF przy użyciu języka C#?

Jak radzić sobie z wieloma językami w jednym dokumencie OCR?

Jakie platformy obsługują IronOCR?

Jak mogę zoptymalizować wydajność przetwarzania OCR w języku C#?

Jakie formaty obrazów obsługuje IronOCR?

Wciąż przewijasz?

Odbierz swoj BEZPLATNY

Następny krok: Rozpocznij darmową 30-dniową wersję próbną

Następny krok: Rozpocznij darmową 30-dniową wersję próbną

Want to deploy IronSuite to a live project for FREE?

What’s included?

Zaufane przez miliony inżynierów na całym świecie

Zespol wsparcia Iron