C#でのTesseract 5のカスタムフォントトレーニング方法

C# Custom Font Training for Tesseract 5 (for Windows Users)

This article was translated from English: Does it need improvement?
Translated
View the article in English

Tesseract 5のカスタムフォントトレーニングを活用し、デフォルトでは十分にサポートされていない特定のフォントやフォントスタイルを使用する際のOCRエンジンの精度と認識能力を向上させる。

このプロセスでは、フォントサンプルや対応するテキストなどの学習データをTesseractに提供し、カスタムフォントの特定の特性やパターンを学習させます。

クイックスタート: C#で.traineddataフォントファイルを使用する

カスタムトレーニングされたTesseractフォントファイルをIronOCRで使用する方法をご紹介します。 特殊なフォントや装飾的なフォントの正確なOCRを迅速に行うのに最適です。

Nuget IconGet started making PDFs with NuGet now:

  1. Install IronOCR with NuGet Package Manager

    PM > Install-Package IronOcr

  2. Copy and run this code snippet.

    var ocr = new IronOcr.IronTesseract();
    ocr.UseCustomTesseractLanguageFile("path/to/YourCustomFont.traineddata");
    string text = ocr.Read(new IronOcr.OcrInput("image-with-special-font.png")).Text;
  3. Deploy to test on your live environment

    Start using IronOCR in your project today with a free trial
    arrow pointer

よくある質問

C#でTesseractで使用するためにカスタムフォントをどのようにトレーニングできますか?

C#を使ってTesseractでカスタムフォントをトレーニングするには、まずIronOCRをダウンロードし、フォントファイルを準備し、WSL2とUbuntuを使ってLinux環境をセットアップする必要があります。TesseractのカスタムフォントトレーニングはLinuxでのみサポートされています。

WSL2を使用してWindowsシステムにTesseract 5をインストールする手順は何ですか?

WSL2を使用してWindowsでTesseract 5をインストールするには、Ubuntuをセットアップして、sudo apt install tesseract-ocrsudo apt install libtesseract-devというコマンドを使用してインストールを完了する必要があります。

フォントファイルをコピーする際に「アクセス拒否」エラーが発生した場合はどうすればよいですか?

「アクセス拒否」エラーに直面した場合、フォントファイルを必要なディレクトリにコピーするためにルートアクセスを持つコマンドラインを使用して許可の問題を回避します。

TesseractでカスタムフォントトレーニングにLinux環境が必要なのはなぜですか?

TesseractでカスタムフォントトレーニングにLinux環境が必要な理由は、トレーニングツールがUnix系システムで実行するように設計されており、WSL2を使用してWindows上でこの環境をエミュレートできるためです。

カスタムフォントのトレーニング中に「フォントの警告」エラーをどのように修正しますか?

「フォントの警告」エラーを解決するには、フォントディレクトリのパスをfonts.confファイルに追加し、それが/etc/fontsディレクトリにコピーされていることを確認する必要があります。

カスタムフォントトレーニングにおける'tesstrain'リポジトリの目的は何ですか?

'tesstrain'リポジトリは、カスタムフォントトレーニングに必要な.traineddataファイルを作成するために使用され、このプロセスに必要なスクリプトとMakefileを提供しています。

「スクリプトUnicharsetの読み込みに失敗しました」エラーをどのように解決しますか?

「スクリプトUnicharsetの読み込みに失敗しました」エラーを修正するには、Latin.unicharsettesstrain/data/langdataフォルダに挿入して、必要な文字セットが利用可能であることを確認する必要があります。

Tesseractでのカスタムトレーニングデータの精度をどのように検証しますか?

トレーニングエラー率(BCERとして知られる)を確認し、十分な反復とトレーニングファイルの調整の後にそれが最小であることを確認することで、カスタムトレーニングデータの精度を検証できます。

Kannaopat Udonpant
ソフトウェアエンジニア
ソフトウェアエンジニアになる前に、Kannapatは北海道大学で環境資源の博士号を修了しました。博士号を追求する間に、彼はバイオプロダクションエンジニアリング学科の一部である車両ロボティクスラボラトリーのメンバーになりました。2022年には、C#のスキルを活用してIron Softwareのエンジニアリングチームに参加し、IronPDFに注力しています。Kannapatは、IronPDFの多くのコードを執筆している開発者から直接学んでいるため、この仕事を大切にしています。同僚から学びながら、Iron Softwareでの働く社会的側面も楽しんでいます。コードやドキュメントを書いていない時は、KannapatはPS5でゲームをしたり、『The Last of Us』を再視聴したりしていることが多いです。
によってレビュー

A PHP Error was encountered

Severity: Warning

Message: Illegal string offset 'name'

Filename: sections/author_component.php

Line Number: 70

Backtrace:

File: /var/www/ironpdf.com/application/views/main/sections/author_component.php
Line: 70
Function: _error_handler

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 63
Function: view

File: /var/www/ironpdf.com/application/views/products/sections/three_column_docs_page_structure.php
Line: 64
Function: main_view

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 88
Function: view

File: /var/www/ironpdf.com/application/views/products/how-to/index.php
Line: 2
Function: view

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 88
Function: view

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 552
Function: view

File: /var/www/ironpdf.com/application/controllers/Products/Howto.php
Line: 31
Function: render_products_view

File: /var/www/ironpdf.com/index.php
Line: 292
Function: require_once

">

A PHP Error was encountered

Severity: Warning

Message: Illegal string offset 'title'

Filename: sections/author_component.php

Line Number: 84

Backtrace:

File: /var/www/ironpdf.com/application/views/main/sections/author_component.php
Line: 84
Function: _error_handler

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 63
Function: view

File: /var/www/ironpdf.com/application/views/products/sections/three_column_docs_page_structure.php
Line: 64
Function: main_view

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 88
Function: view

File: /var/www/ironpdf.com/application/views/products/how-to/index.php
Line: 2
Function: view

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 88
Function: view

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 552
Function: view

File: /var/www/ironpdf.com/application/controllers/Products/Howto.php
Line: 31
Function: render_products_view

File: /var/www/ironpdf.com/index.php
Line: 292
Function: require_once

A PHP Error was encountered

Severity: Warning

Message: Illegal string offset 'comment'

Filename: sections/author_component.php

Line Number: 85

Backtrace:

File: /var/www/ironpdf.com/application/views/main/sections/author_component.php
Line: 85
Function: _error_handler

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 63
Function: view

File: /var/www/ironpdf.com/application/views/products/sections/three_column_docs_page_structure.php
Line: 64
Function: main_view

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 88
Function: view

File: /var/www/ironpdf.com/application/views/products/how-to/index.php
Line: 2
Function: view

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 88
Function: view

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 552
Function: view

File: /var/www/ironpdf.com/application/controllers/Products/Howto.php
Line: 31
Function: render_products_view

File: /var/www/ironpdf.com/index.php
Line: 292
Function: require_once