Using Custom OCR Language Packs with IronOCR

This article was translated from English: Does it need improvement?
Translated
View the article in English

IronOCRで使用するカスタム言語パックを作成するには? カスタム言語パックの作成には、フォントから新しいTesseract 4 LSTM言語ファイル/辞書をトレーニングする必要があります。 翻訳に必要な手順を説明したチュートリアルは、オンライン上に多数あります。 このプロセスは単純ではありませんが、ありがたいことに非常によく文書化されています。 As a good place to start, we suggest this [YouTube tutorial](https://www.youtube.com/watch?v=KE4xEzFGSU8) from [Gabriel Garcia](https://www.youtube.com/c/GabrielGarciaGG) (no affiliation) and their linked [GitHub repository](https://github.com/astutejoe/tesseract_tutorial). 完了すると、`.traineddata`ファイルが出力されます。 `.traineddata`ファイルはIronOCRで以下のように参照できます: ドキュメンテーション:[IronOCRカスタム言語](https://ironsoftware.com/csharp/ocr/languages/). ```csharp using IronOcr; class Program { static void Main() { // Initialize the IronTesseract OCR engine var Ocr = new IronTesseract(); // Load your custom Tesseract language file (trained .traineddata file) Ocr.UseCustomTesseractLanguageFile("mydir/custom.traineddata"); //<--- your new font // Multiple fonts can be used by calling the method multiple times with different files // Load an image into the OCR Input for processing using (var Input = new OcrInput(@"images\image.png")) { // Perform OCR on the input image var Result = Ocr.Read(Input); // Output the recognized text to the console Console.WriteLine(Result.Text); } } } ```

Curtis Chau
テクニカルライター

Curtis Chauは、カールトン大学でコンピュータサイエンスの学士号を取得し、Node.js、TypeScript、JavaScript、およびReactに精通したフロントエンド開発を専門としています。直感的で美しいユーザーインターフェースを作成することに情熱を持ち、Curtisは現代のフレームワークを用いた開発や、構造の良い視覚的に魅力的なマニュアルの作成を楽しんでいます。

開発以外にも、CurtisはIoT(Internet of Things)への強い関心を持ち、ハードウェアとソフトウェアの統合方法を模索しています。余暇には、ゲームをしたりDiscordボットを作成したりして、技術に対する愛情と創造性を組み合わせています。

準備はいいですか?
Nuget ダウンロード 5,044,537 | バージョン: 2025.11 ただ今リリースされました