Jak korzystać z pakietów językowych OCR w IronOCR
Odkryj możliwości globalnego przetwarzania dokumentów, oglądając ten samouczek, aby opanować wyodrębnianie tekstu z wielojęzycznych plików PDF przy użyciu IronOCR w języku C# i bez wysiłku obsługiwać zarówno tekst angielski, jak i japoński, uzyskując dokładne, uwzględniające język wyniki.
W tym samouczku dowiesz się, jak wyodrębnić tekst z wielojęzycznych dokumentów PDF przy użyciu IronOCR w języku C#. Film przedstawia proces konfiguracji IronOCR oraz instalacji dodatkowych pakietów językowych — w szczególności angielskiego i japońskiego. Zobaczysz, jak skonfigurować silnik OCR do obsługi wielu języków i zastosować go do przykładowego pliku PDF zawierającego zarówno tekst w języku angielskim, jak i japońskim. Samouczek pokazuje, jak zainicjować silnik OCR, zdefiniować plik wejściowy i wyodrębnić tekst za pomocą metody Read. Wyodrębniona treść jest następnie zapisywana w pliku .txt, z obsługą błędów w przypadku nieudanych operacji. To doskonały przykład tego, jak IronOCR wspiera globalne przetwarzanie dokumentów, rozpoznając wiele języków w ramach jednego skanowania. Niezależnie od tego, czy przetwarzasz wielojęzyczne formularze, dokumenty międzynarodowe czy pliki PDF z globalnych źródeł, ten przewodnik pokazuje, jak łatwo uzyskać dokładne, uwzględniające język wyniki OCR w języku C#.

