Przejdź do treści stopki

Jak korzystać z pakietów językowych OCR w IronOCR

Odkryj możliwości globalnego przetwarzania dokumentów, oglądając ten samouczek, aby opanować wyodrębnianie tekstu z wielojęzycznych plików PDF przy użyciu IronOCR w języku C# i bez wysiłku obsługiwać zarówno tekst angielski, jak i japoński, uzyskując dokładne, uwzględniające język wyniki.

W tym samouczku dowiesz się, jak wyodrębnić tekst z wielojęzycznych dokumentów PDF przy użyciu IronOCR w języku C#. Film przedstawia proces konfiguracji IronOCR oraz instalacji dodatkowych pakietów językowych — w szczególności angielskiego i japońskiego. Zobaczysz, jak skonfigurować silnik OCR do obsługi wielu języków i zastosować go do przykładowego pliku PDF zawierającego zarówno tekst w języku angielskim, jak i japońskim. Samouczek pokazuje, jak zainicjować silnik OCR, zdefiniować plik wejściowy i wyodrębnić tekst za pomocą metody Read. Wyodrębniona treść jest następnie zapisywana w pliku .txt, z obsługą błędów w przypadku nieudanych operacji. To doskonały przykład tego, jak IronOCR wspiera globalne przetwarzanie dokumentów, rozpoznając wiele języków w ramach jednego skanowania. Niezależnie od tego, czy przetwarzasz wielojęzyczne formularze, dokumenty międzynarodowe czy pliki PDF z globalnych źródeł, ten przewodnik pokazuje, jak łatwo uzyskać dokładne, uwzględniające język wyniki OCR w języku C#.

Przeczytaj cały artykuł: Dodatkowe Pakiety Językowe OCR

Powiązane wideo

Gotowy, aby rozpocząć?
Nuget Pliki do pobrania 5,571,678 | Wersja: 2026.4 just released
Still Scrolling Icon

Wciąż przewijasz?

Czy chcesz szybko dowodu? PM > Install-Package IronOcr
uruchom próbkę obserwuj, jak twój obraz staje się tekstem z możliwością wyszukiwania.

Zespol wsparcia Iron

Jestesmy online 24 godziny, 5 dni w tygodniu.
Czat
Email
Zadzwon do mnie