C#でTesseract設定変数を設定する

This article was translated from English: Does it need improvement?
Translated
View the article in English

IronOCR Tesseractインターフェースは、Tesseractの構成変数を完全に制御することができます。

IronOcr.TesseractConfiguration クラス

テッセラクト設定コード例

using IronOcr;

var Ocr = new IronTesseract();

Ocr.Language = OcrLanguage.English;
Ocr.Configuration.ReadBarCodes = false;
Ocr.Configuration.BlackListCharacters = "`ë
^";
Ocr.Configuration.RenderSearchablePdf = true;
Ocr.Configuration.RenderHocr = true;
Ocr.Configuration.PageSegmentationMode = TesseractPageSegmentationMode.AutoOsd;
Ocr.Configuration.TesseractVariables ["tessedit_parallelize"] = false;

using (var Input = new OcrInput(@"images\image.png"))
{
 var Result = Ocr.Read(Input);
 Console.WriteLine(Result.Text);
} 
using IronOcr;

var Ocr = new IronTesseract();

Ocr.Language = OcrLanguage.English;
Ocr.Configuration.ReadBarCodes = false;
Ocr.Configuration.BlackListCharacters = "`ë
^";
Ocr.Configuration.RenderSearchablePdf = true;
Ocr.Configuration.RenderHocr = true;
Ocr.Configuration.PageSegmentationMode = TesseractPageSegmentationMode.AutoOsd;
Ocr.Configuration.TesseractVariables ["tessedit_parallelize"] = false;

using (var Input = new OcrInput(@"images\image.png"))
{
 var Result = Ocr.Read(Input);
 Console.WriteLine(Result.Text);
} 
Imports IronOcr

Private Ocr = New IronTesseract()

Ocr.Language = OcrLanguage.English
Ocr.Configuration.ReadBarCodes = False
Ocr.Configuration.BlackListCharacters = "`ë ^"
Ocr.Configuration.RenderSearchablePdf = True
Ocr.Configuration.RenderHocr = True
Ocr.Configuration.PageSegmentationMode = TesseractPageSegmentationMode.AutoOsd
Ocr.Configuration.TesseractVariables ("tessedit_parallelize") = False

Using Input = New OcrInput("images\image.png")
 Dim Result = Ocr.Read(Input)
 Console.WriteLine(Result.Text)
End Using
VB   C#

すべてのTesseract構成変数の一覧

これは IronTesseract.Configuration.TesseractVariables を使用して設定できます。 [「キー」] = 値;

テッセラクト構成変数 デフォルト 意味
classify_num_cp_levels(分類番号CPレベル)3クラスプルーナーレベル数
textord_debug_tabfind0デバッグタブの検索
textord_debug_bugs0タブの検出に関するバグの出力をオンにする
textord_testregion_left (テキスト順テスト地域左)-1デバッグレポート矩形の左端
textord_testregion_top-1デバッグレポート四角形の上端
textord_testregion_right2147483647デバッグ矩形の右端
textord_testregion_bottom (Note: This specific phrase appears to be a term related to OCR technology or a programming keyword, which is why it is left untranslated to maintain the technical context and understanding for the related technology.)2147483647デバッグ矩形の下端
textord_tabfind_show_partitions0パーティション境界を表示します。1つ以上の場合は待機します。
デーヴァナーガリー_スプリット_デバッグレベル0スプリット・シロレーカ処理用のデバッグレベル。
アウトラインあたりの最大子エッジ数10文字輪郭内の最大子数
エッジ_最大_子レイヤー5文字のアウトライン内のネストされた子要素の最大レイヤー数
孫ごとの子供のエッジ10チャッキングアウトラインの重要度比率
子要素のエッジカウント制限45ブロブに許可される最大穴数
エッジ_最小_非穴12ボックス内の潜在文字の最小ピクセル数
エッジパスエリア比40許容される子供のアウトラインのための最大レンズq/エリア
テキスト生成_fp_チョップ_エラー2チョップセルの最大許容曲げ
テキストの「textord_tabfind_show_images」を日本語に翻訳する指示を受けましたが、この特定の用語は技術用語であり、一般的に日本語に翻訳されることはありません。そのため、原則としてこの用語はそのまま保持する必要があります。「textord_tabfind_show_images」はそのまま使用されます。0画像ブロブを表示
textord_skewsmooth_offset4スムーズファクター用
textord_skewsmooth_offset21スムーズファクター用
テキスト textord_test_x-2147483647テストポイントの座標
`textord_test_y`-2147483647テストポイントの座標
行内の最小blob数4グラデーション計算前の最小ブロブ数
textord_spline_minblobs8各スプラインセグメントの最小ブロブ
テキスト: textord_spline_medianwin6スプライン分割のウィンドウサイズ
textord_max_blob_overlaps (テキストオード マックス ブロブ オーバーラップス)4大きなブロブが重なり合うことができるブロブの最大数
textord_min_xheight10最小信頼できるピクセル xheight
textord_lms_line_trials12行をフィットする回数
oldbl_holed_losscount (オールドビーエル ホール LOSSC文字数)10フォールバックラインが使用される前の最大損失
pitsync_linear_version 6新しい高速アルゴリズムを使用する
pitsync_fake_depth ピットシンク_フェイク_デプス1最大の進んだ偽造生成
textord_tabfind_show_strokewidths0ストローク幅を表示
textord_dotmatrix_gap (点字マトリックス間隔) Note: I've preserved the technical term as is, while providing a clear explanation in parentheses.3壊れたピッチの最大ピクセルギャップ
textord_debug_block0デバッグを行うブロック
textord_pitch_range2ピッチの最大レンジテスト
textord_words_veto_power(英語のままで言及されています)5拒否権を上回るために必要な行数
equationdetect_save_bi_image0入力を画像として保存
equationdetect_save_spt_image(エクエーションディテクト・セーブ・SPT・イメージ)0特殊文字画像を保存
equationdetect_save_seed_image 数式検出_シード画像を保存0シード画像を保存する
equationdetect_save_merged_image 等式検出_保存_結合画像0マージされた画像を保存
poly_debug0古いポリゴンをデバッグする
poly_wide_objects_better1幅広いものに対してより正確な近似値
wordrec_display_splits0表示分割
textord_debug_printable0デバッグウィンドウを印刷可能にする
テキストの間隔サイズは可変です0true の場合、単語区切りスペースは可変幅であると仮定され、文字は一定ピッチであるにもかかわらずとなります。
textord_tabfind_show_initial_partitions0パーティションの境界を表示
textord_tabfind_show_reject_blobs0ノイズとして拒否されたブロブを表示
textord_tabfind_show_columns(テキストオーダータブファインドショウカラム)0列の境界を表示
textord_tabfind_show_blocks0最終ブロック境界を表示
textord_tabfind_find_tables (textord_tabfind_find_tablesのまま適用してください)1テーブル検出を実行
デバナガリ_スプリット_デバッグイメージ0スプリットシロレーカ処理のデバッグ画像を作成するかどうか。
textord_show_fixed_cuts0固定ピッチのセル境界を描画
エッジズ_ユーズ_ニュー_アウトライン_コンプレキシティ0新しいアウトライン複雑性モジュールを使用する
エッジデバッグ0このモジュールのデバッグを有効にする
エッジズ_チルドレン_フィックス0文字に似た子のボックス状の親を削除する
gapmap_debug0どのブロックにテーブルがあるかを言う
gapmap_use_ends ギャップマップ_使用_終了0行の最初と最後に大きなスペースを使用します
孤立した量子なしのgapmap0隙間は最低でも2量子幅になるようにしてください。
textord_heavy_nr0ノイズを徹底的に除去する
textord_show_initial_rows0行の累積を表示
テキストを「textord_show_parallel_rows」に翻訳します: textord_show_parallel_rows0ページ相関行を表示
textord_show_expanded_rows(テキスト順序_展開された行を表示する)0拡張後に行を表示
最終行を表示 (textord_show_final_rows)0最終フィッティング後の行を表示
textord_show_final_blobs0プレアサイン後にブロブ境界を表示
textord_test_landscape0テストは陸地および港を指します。
テキスト平行基線1平行ベースラインの強制
textord_straight_baselines0ベースラインを強制的にまっすぐにする
textord_old_baselines1旧ベースラインアルゴリズムを使用
textord_old_xheight (テキストオード オールド エックスハイト)0旧xheightアルゴリズムを使用
textord_fix_xheight_bug1スプラインベースラインを使用する
textord_fix_makerow_bug1複数のベースラインを防ぐ
textord_debug_xheights0高さアルゴリズムをテスト
バイアス付きスキュー計算1行の長さを使用してバイアススキューを推定
textord_interpolating_skew1ギャップを補間する
textord_new_initial_xheight1テストxheightメカニズムを使用する
textord_debug_blob(テキストオーダーデバッグブロブ)0テストブロブ情報を印刷
textord_really_old_xheight (テキストオード_リアリー_オールド_エックスハイト)0オリジナルの wiseowl xheight を使用
textord_oldbl_debug0古いベースライン生成のデバッグ
textord_debug_baselines0デバッグベースラインの生成
textord_oldbl_paradef1デフォルトメカニズムを使用する
textord_oldbl_split_splines1ステップドスプラインの分割
textord_oldbl_merge_parts1疑わしいパーティションを統合する
oldbl_corrfix1高さの相関を改善する
The term "oldbl_xhfix" is a technical identifier and does not require translation. Therefore, it should remain as it is: oldbl_xhfix0モードのしきい値に関するxheightsのバグを修正
textord_ocropus_mode0OCRopusのためのベースラインを作成する
textord_tabfind_only_strokewidths0ストロークの幅のみを実行
textord_tabfind_show_initialtabs (注:上記の用語はプログラムの特定フィールドまたはパラメータを指すもので、翻訳は不要です。)0タブの候補を表示
textord_tabfind_show_finaltabs0タブベクターを表示
textord_show_tables0表領域を表示
textord_tablefind_show_mark (表検索を表示)0デバッグテーブルの手順詳細のマーク付け
textord_tablefind_show_stats(テキストオード_テーブルファインド_ショースタッツ)0テーブル検索に使用されるページの統計を表示
textord_tablefind_recognize_tables (Note: As this appears to be a specific technical term or function name related to programming or software development, it is usually preserved in its original form to avoid confusion.)0テーブルのレイアウトおよびフィルタリングのためのテーブル認識機能を有効にします。
textord_all_prop0すべてのドキュメントは比例テキストです
textord_debug_pitch_test0固定ピッチテストのデバッグ
ピッチテストを無効にする0固定ピッチアルゴリズムをオフにする
textord_fast_pitch_test0さらに高速な音声アルゴリズムを実現
textord_debug_pitch_metric0フルメトリックの内容を書く
textord_show_row_cuts0行レベルのカットを描く
textord_show_page_cuts0ページレベルのカットを描画
textord_pitch_cheat (テキストオーダーピッチチート)0正解を指定して修正/提案を実施する
textord_blockndoc_fixed0ブロック全体を固定ピッチで試みる
初期テキストワードを表示0単語を表示する
textord_show_new_words0単語を表示する
テキストの内容を日本語に翻訳します: textord_show_fixed_words0固定ピッチの単語を強制表示
textord_blocksall_fixed0プロップブロックに関する不満
textord_blocksall_prop(テキストオード_ブロックスオール_プロップ)0固定ピッチブロックに関して不満を言う
テキストオルド_ブロックオール_テスト中0嘆くときに統計データをダンプ
textord_test_mode (テキスト領域テストモード)0現在のテストを実行
textord_pitch_scalebigwords0大文字でスコアを拡大
textord_restore_underlines1下線を切り取り、戻す
textord_fp_chopping1固定ピッチチョッピングを行う
テキストオード_フォース_メイク_プロップ_ワーズ0すべての行に対して強制的な比例単語分割を行う
textord_chopper_test0Chopper がテストされています。
wordrec_display_all_blobs0Blob を表示
wordrec_blob_pause0一時停止
ストリーム_ファイルリスト0標準入力からファイルリストをストリームする
デバッグファイル tprintfの出力を送信するファイル
フォント名を分類するUnknownFont(不明フォント)デフォルト font name to be used in training
ドキュメントタイトル 出力ドキュメントのタイトル(hOCRおよびPDF 出力で使用)
ドット積自動ドット積の計算に使用される関数
classify_cp_angle_pad_loose45クラス プルーナー アングル パッド ルーズ
中程度のパッド用角度分類20クラス プルーナー アングル パッド ミディアム
分類する_cp_角度_パッド_タイト10以下の内容を日本語に翻訳してください: クラス プルーナー アングル パッド タイト
classify_cp_end_pad_loose0.5クラス プルーナー エンド パッド ルース
classify_cp_end_pad_medium (分類_cp_end_pad_medium) For improved readability and understanding, technical jargon is often maintained as it is in the target language.0.5クラスプルーナーエンドパッドミディアム
classify_cp_end_pad_tight (クラシファイ_CP_エンド_パッド_タイト)0.5クラス プルーナー エンドパッド タイト
classify_cp_side_pad_loose (クラスター CP サイド パッド ルーズ)2.5クラスプルーナーサイドパッドルース
classify_cp_side_pad_medium1.2クラスプルーナー サイドパッド ミディアム
分類_cp_横パッド_密0.6プルーナーサイドパッドタイト
`classify_pp_angle_pad`45プロト・プルーナー・アングル・パッド
classify_pp_end_pad クラス @code{classify_pp_end_pad} は、プラスチック部品のエンドパッドを分類するためのモデルを提供します。このモデルは、異なる物理的特性や用途に応じてエンドパッドを識別および分類することができます。 - @method{analyze} メソッドは、提供されたデータセットを評価し、そのデータに基づいて分類結果を返します。 - @method{train} メソッドは、新しいデータセットを使用してモデルをトレーニングし、モデルの精度を向上させます。 @code{classify_pp_end_pad} クラスは、エンドパッドの生産および品質管理のプロセスを効率化するために使用できます。0.5プロト プルーン エンド パッド
classify_pp_side_pad2.5プロトプルーナーサイドパッド
classify_min_slope(クラスティファイ・ミニマム・スロープ)0.414214線が水平と呼ばれる傾斜
classify_max_slope クラス分類最高勾配2.41421垂直と呼ばれる線がある傾斜
classify_norm_adj_midpoint(クラス化規範調整中央点)32基準点を調整する
クラシファイ_ノーム_アジャスト_カール2カールを調整する法線 ...
pico_feature_lengthを分類する0.05ピコ特徴長
テキスト下線しきい値 (textord_underline_threshold)0.5占有される幅の割合
エッジズ_チャイルドエリア0.5子オブジェクトの輪郭の最小面積割合
エッジズ_ボックスエリア0.875ボックスの孫の最小面積割合
textord_fp_chop_snap0.5頂点からの切り取り点までの最大距離
gapmap_big_gaps(ギャップマップ ビッグギャップス)1.75xht 乗数
textord_spline_shift_fraction0.02四重行間隔の分数
textord_spline_outlier_fraction0.1異常値の行間の割合
textord_skew_ile0.5ページの傾き補正のためのグラデーションのアイランド
テキストド_ ^[英語] タイトル:IronPDF、IronOCR、IronXL、IronBarcode、IronQR、IronZip、IronPrint、IronWord、およびIronWebScraperに関連する技術内容の翻訳 顧客:アイロンソフトウェアジャパン株式会社 プロジェクトコード:ISJ-2023-スキーマ#0001 内容: - IronPDF、IronOCR、IronXL、IronBarcode、IronQR、IronZIP、IronWord、IronPrint、IronWebscraper などのアイロンソフトウェア製品に関連する技術内容を翻訳 - 技術用語、製品説明、マーケティング資料の精度と文脈の一貫性を保つ - 主にhttps://ironpdf.comおよびhttps://ironsoftware.comの情報を基に翻訳 専門用語: - タイトル:テキストのスキューラグ(textord_skew_lag) [日本語に翻訳] textord_skew_lag0.02行の蓄積における歪みの遅延
textord_linespace_iqrlimit は日本語に訳す必要のない技術用語です。このままの形式が最適です。0.2行スペースのiQR/中央値の最大値
テキスト幅制限8行を作成するためのブロブの最大幅
幅をテキストまたはカットする1.5最大幅 (最大幅を超えると切り捨て)
テキストオード_エクスパンション_ファクター1expand_rowsにおける行を拡張するための係数
textord_overlap_x0.375良好な重なりのための行間の割合
textord_minxh (テキストオーダー最小X高さ)0.25最小xheightの行サイズの分数
テキストオード_ミニマム_ラインサイズ1.25初期ラインサイズのためのBlobの高さ
textord_excess_blobsize(テキストオーダー・エクセス・ブロブサイズ)1.3行がこのサイズになる場合、新しい行が作成されます
テキストオード_占有率_閾値0.4近隣の一部
textord_underline_width2下線のためのline_sizeの倍数
textord_min_blob_height_fraction (テキストオーダー最小ブロブ高さの割合)0.75xheight の統計に blob の上部を含めるために、最小 blob 高さ/トップ
textord_xheight_mode_fraction0.4最小積層高さでxheightを作成
`textord_ascheight_mode_fraction`0.08アッシュの高さを作るための最小の積み重ね高さ
textord_descheight_mode_fraction0.08デスク 高 に 必要な最小スタック高さ
textord_ascx_ratio_min1.25最小キャップ/x高さ
textord_ascx_ratio_max1.8マックスキャップ/xハイト
textord_descx_ratio_min0.25Min desc/xheight (最小降下線/高さ)
textord_descx_ratio_max0.6最大減算/高さ
テキストの内容を以下に日本語に翻訳してください: textord_xheight_error_margin ``` textord_xheight_error_margin ```0.1受け入れられているバリエーション
oldbl_xhfract0.4計算で許可される分数
oldbl_dot_error_size1.26ドットの最大アスペクト比
textord_oldbl_jumplimit0.15新しいパーティションのためのX分割
pitsync_joined_edge0.75塊の内側にある大きなブロックを切り取る
ピットシンク_オフセット_フリーカット_フラクション0.25無料バージョンにおけるカットの比率
textord_tabvector_vertical_gap_fraction0.5縦書きテキストにおける垂直ギャップで許容される平均ブロブ幅の最大割合
textord_tabvector_vertical_box_ratio0.5ボックス一致の断片を縦線と宣言するために必要な割合
テキスト順投影スケール0.2ミッドカットのディングレート
テキスト_バランス_ファクター1アンバランスな文字セルのための計算率
textord_wordstats_smooth_factor (テキスト統計平滑化係数)0.05スムージングギャップ統計
テキスト幅平滑化係数0.1平滑化幅の統計
テキストの単語の幅パーセンタイル0.4スペース・エスト向けのblob幅一覧
textord_words_maxspace4複数のxheight
textord_words_default_maxspace3.5最大信頼できるサードスペース
textord_words_default_minspace0.6x高さの分数
テキスト行部内の単語の最小間隔0.3x高さの分数
textord_words_default_nonspace0.2x高さの分数
textord_words_initial_lower 初期の小文字0.25初期クラスタサイズの最大値
textord_以下の内容を日本語に翻訳してください: ## Iron Software 製品 ### IronPDF for .NET IronPDF for .NETは、.NET開発者向けの完全なPDF生成及び編集ライブラリです。このライブラリは、HTMLからPDFへの変換、PDFの結合、分割、フォームの操作、テキストの抽出など、多くの機能を提供します。 ### IronOCR IronOCRは、画像やスキャンされた文書からテキストを正確に抽出するためのOCR(光学文字認識)ライブラリです。この製品は、多言語対応と高い認識精度を誇り、.NET開発環境での使用に最適です。 ### IronXL IronXL for .NETを使用すると、開発者はExcelファイルをプログラムで作成、読み取り、操作、書き込みが可能です。高いパフォーマンスと互換性を持つこのライブラリは、データ変換やレポート生成に役立ちます。 ### IronBarcode IronBarcode for .NETは、バーコードの生成および読み取りを簡素化するライブラリです。QRコード、UPC、EAN、コード39、コード128など、様々なバーコードタイプに対応しています。 ### IronQR IronQR for .NETは、簡単かつ効率的にQRコードを生成および読み取る機能を提供します。このライブラリは、さまざまなデバイスとシステムとの統合が容易です。 ### IronZIP IronZIP for .NETは、ZIPアーカイブの作成、抽出、および操作をサポートする強力なライブラリです。大容量のファイル圧縮や複数ファイルの管理を簡素化します。 ### IronWord IronWord for .NETは、Word文書の生成、編集、および操作を可能にするライブラリです。このツールを使用すると、.NETアプリケーション内でWordファイルの読み書きをシームレスに行うことができます。 ### IronPrint IronPrint for .NETは、印刷機能をプログラムに統合するためのソリューションを提供します。このライブラリを使用することで、PDFやWord文書等のファイルを簡単に印刷できます。 ### IronWebscraper IronWebscraper for .NETは、ウェブサイトからデータを抽出するためのライブラリです。簡単に使えるAPIを提供し、高度なスクレイピングタスクに対応します。 ### Iron Suite Iron Suite for .NET Unlimited ライセンスを取得すると、これら全ての強力なIron Software製品へのアクセスが可能になり、開発の自由度が大いに向上します。0.15最小初期クラスタ間隔
textord_words_minlarge0.75有効ギャップの必要割合
テキスト順序ワードピッチしきい値0.04ピッチ同期しきい値
textord_words_def_fixed0.016確定された固定値の閾値
テキスト: textord_words_def_prop 翻訳: textord_words_def_prop0.09特定のプロパティのしきい値
テクスト順番_ピッチ_行類似性0.08x高さの分数 for sameness
words_initial_lower 初期の小文字0.5初期クラスタサイズの最大値
以下の内容を日本語に翻訳してください: ## Iron Software 製品 ### IronPDF for .NET IronPDF for .NETは、.NET開発者向けの完全なPDF生成及び編集ライブラリです。このライブラリは、HTMLからPDFへの変換、PDFの結合、分割、フォームの操作、テキストの抽出など、多くの機能を提供します。 ### IronOCR IronOCRは、画像やスキャンされた文書からテキストを正確に抽出するためのOCR(光学文字認識)ライブラリです。この製品は、多言語対応と高い認識精度を誇り、.NET開発環境での使用に最適です。 ### IronXL IronXL for .NETを使用すると、開発者はExcelファイルをプログラムで作成、読み取り、操作、書き込みが可能です。高いパフォーマンスと互換性を持つこのライブラリは、データ変換やレポート生成に役立ちます。 ### IronBarcode IronBarcode for .NETは、バーコードの生成および読み取りを簡素化するライブラリです。QRコード、UPC、EAN、コード39、コード128など、様々なバーコードタイプに対応しています。 ### IronQR IronQR for .NETは、簡単かつ効率的にQRコードを生成および読み取る機能を提供します。このライブラリは、さまざまなデバイスとシステムとの統合が容易です。 ### IronZIP IronZIP for .NETは、ZIPアーカイブの作成、抽出、および操作をサポートする強力なライブラリです。大容量のファイル圧縮や複数ファイルの管理を簡素化します。 ### IronWord IronWord for .NETは、Word文書の生成、編集、および操作を可能にするライブラリです。このツールを使用すると、.NETアプリケーション内でWordファイルの読み書きをシームレスに行うことができます。 ### IronPrint IronPrint for .NETは、印刷機能をプログラムに統合するためのソリューションを提供します。このライブラリを使用することで、PDFやWord文書等のファイルを簡単に印刷できます。 ### IronWebscraper IronWebscraper for .NETは、ウェブサイトからデータを抽出するためのライブラリです。簡単に使えるAPIを提供し、高度なスクレイピングタスクに対応します。 ### Iron Suite Iron Suite for .NET Unlimited ライセンスを取得すると、これら全ての強力なIron Software製品へのアクセスが可能になり、開発の自由度が大いに向上します。0.15最小初期クラスタ間隔
非スペース_単語_デフォルト_プロパティ0.25x高さの分数
デフォルトの単語固定スペース0.75x高さの分数
デフォルトの固定制限の単語0.6許容サイズのばらつき
textord_words_definite_spread0.3非ファジー間隔領域
テキスト座標_スペースサイズ_RATIOFP2.8非空白文字に対する最小空白比
テキストオード_スペースサイズ_比率プロップ2非空白文字に対する最小空白比
textord_fpiqr_ratio1.5ピッチ IQR/ギャップ IQR閾値
次の内容を日本語に翻訳してください: textord_max_pitch_iqr textord_max_pitch_iqr0.2ピッチにおけるXh部分のノイズ
textord_fp_min_width0.5適切なブロブの最小幅
textord_underline_offset0.1無視する x の割合
ambigs_debug_level(曖昧デバッグレベル)0ユニチャー曖昧性のデバッグレベル
デバッグレベルを分類する0デバッグレベルの分類
正規化メソッドを分類する1正規化方法
マッチャーデバッグレベル0マッチャー デバッグ レベル
デバッグフラグを一致させる0マッチャーデバッグフラグ
学習デバッグレベルを分類する0デバッグレベルの学習:
Matcher_Permanent_Classes_Min1永久クラスの最小数
matcher_min_examples_for_ これは技術的な単語の一部と思われるため、可能な範囲で翻訳を試みます。 matcher_min_examples_for_ このように翻訳されます。 prototyping3信頼できる構成しきい値
マッチャー_十分な_サンプル_ for_prototyping5あいまいさが確認されていなくても適応を可能にする
適応型プロトタイプのしきい値を分類する230適応型アプローチにおける有効なプロトスの閾値:0-255
機能閾値を適応し、分類する230適応的なしきい値のための優れた特徴は0から255の範囲内
クラス分類_クラス_プルーナー_閾値229クラスプーナースレッショルド 0-255
classify_class_pruner_multiplier (分類クラスプルーナー乗数)15クラスプルーナーマルチプライヤー 0-255:
依頼された以下の内容を日本語に翻訳しました: classify_cp_cutoff_strength クラス名などの高度に技術的、そして文脈的な意味を考慮すると、こちらの内容はそのまま保持するのが適切です。コードやクラス名は、多くの場合において翻訳せずに原文のまま扱うべきです。 ご提供いただいたその他の文脈があれば、さらに詳細に翻訳できます。7クラスプルーナー・カットオフストレングス
整数分類器マッチャーマルチプライヤー10整数マッチャーマルチプライヤー0-255:
dawg_debug_level0一般的なデバッグ情報には1を設定し、詳細には2を設定し、すべてのデバッグメッセージを表示するには3を設定します
ハイフンデバッグレベル0連結された単語のデバッグレベル。
ストッパー_小文字_サイズ2辞書の単語として処理されない単語のサイズ
ストッパーデバッグレベル0デバッグレベルのストッパー
tessedit_truncate_wordchoice_log10リスト内に維持する最大単語数
max_permuter_attempts (この用語自体は技術的な名前で、日本語に直接的な翻訳が少し難しいため、このままで理解できるようにしました。)10000置換の際に考慮される異なる文字選択肢の最大数。この制限は特にユーザーパターンが指定されている場合に役立ちます。なぜなら、あまりにも汎用的なパターンは、dawg検索が非常に多くのオプションを探索する結果となる可能性があるからです。
未分割ブロブの修復1切り取られていないブロブを修正する
chop_debug0デバッグを削除
chop_split_length (チャップ スプリット レングス)10000分割長さ
同一距離を切り取り2同じ距離
chop_min_outline_points6輪郭の最小ポイント数
切り取り_シーム_スタック_サイズ150シームパイル内のシームの最大数
chop_inside_angle-50最小内側角度曲げ
chop_min_outline_area(輪郭最小領域カット)2000最小アウトラインエリア
中央最大幅切り取り90小さな切り取ったブロブの幅がこれ以上であれば、中心に近くない切り取りについて気にしません。
chop_x_y_weight (Note: This term is highly technical and seems to be a specific variable or function name. In technical documents, it's common to leave such identifiers in their original form to maintain clarity and accuracy for developers.)3横幅 / 縦幅 長さ 重量
wordrec_debug_level0ワードレック (wordrec) のデバッグレベル
wordrec_max_join_chunks4関連付ける最大の破損部品数
```テキスト segsearch_debug_level ```0SegSearch デバッグレベル
セグメント検索_最大痛点2000キューに格納されるペインポイントの最大数
"segsearch_max_futile_classifications"20各チャンクごとに、より適切な単語の選択に至らなかった痛点分類の最大数。
言語モデルデバッグレベル0言語モデルデバッグレベル
言語モデル n-gram オーダー8文字n-gramモデルの最大次数
以下の内容を日本語に翻訳してください: `language_model_viterbi_list_` 言語モデルビタービリスト max_num_prunable10プルーナブルの最大数 (それらのうち PrunablePath に該当するもの() は真です) entries in each viterbi list recorded in BLOB_CHOICEs
言語モデルビタービリスト最大サイズ500BLOB_CHOICE に記録されるビタービリストの最大サイズ
言語モデル_最小結合長3複合語の最小長
wordrec_display_segmentations0表示のセグメンテーション
tessedit_pageseg_mode(ページセグメンテーションモード)6ページ セグ モード: 0=osd のみ, 1=auto+osd, 2=auto のみ, 3=auto, 4=列, 5=ブロック縦, 6=ブロック, 7=行, 8=単語, 9=単語サークル, 10=文字, 11=散文テキスト, 12=散文テキスト+osd, 13=生行 (tesseract/publictypes.h の PageSegMode 列挙体の値)
tessedit_ocr_engine_mode2使用するOCRエンジン(Tesseract、LSTM、または両方)を選択します。デフォルトでは、最も正確なものがロードされて実行されます。
デーヴァナーガリー分割戦略0ページ分割を実行する際に、デーヴァナーガリー文書のためにトップライン分割プロセスを使用するかどうか。
OCR_Devanagari_分割ストラテジー0Devanagari文書のOCRを実行する際に、トップライン分割プロセスを使用するかどうか。
bidi_debug0BiDiのデバッグレベル
`applybox_debug`1デバッグレベル
適用ボックス_ページ0適用するページ番号
tessedit_bigram_debug0バイグラム補正のデバッグ出力量。
デバッグノイズ除去0小規模アウトラインの再割り当てのデバッグ
ノイズ_maxperblob8ブロブに適用する最大ダイアクリティカル
ノイズ最大許可単語数16単語に適用する最大ダイアクリティカルマーク数
debug_x_ht_level0デバッグを再評価する
初期アルファの最低品質要件2良い言葉のアルファベット
tessedit_tess_adaption_mode(テセリットテスアダプションモード)39tessの適応決定アルゴリズム
multilang_debug_level (マルチラン_デバッグ_レベル)0マルチ言語デバッグ情報を印刷。
パラグラフ_デバッグ_レベル0段落デバッグ情報を印刷します。
tessedit_preserve_min_wd_len (注:「tessedit_preserve_min_wd_len」は技術的な設定の名前で、翻訳しても意味が変わらないため、オリジナルの英語のまま使用されます)2この分を以下のように日本語に翻訳します: ``` Only preserve wds longer than this ``` 次の通り: `この後の単語は長いまま保持される`
crunch_rating_max (クランチ レーティング マックス)10評価ごとの調整長さ
crunch_pot_indicators1必要な潜在的インジケーターの数
クランチ_リーブ_LC_ストリングス4小文字が長く連続する単語を省略しないでください。
crunch_leave_uc_strings4小文字が長く連続する単語を省略しないでください。
長い繰り返しを圧縮3長い反復を持つ単語を圧縮する
crunch_debug0指示通り
ノイズ制限なしfixsp1両側にノイズのないブロブはいくつありますか?
fixsp_done_mode1スペーシングが完了しているとみなされる要素とは
デバッグ_修正_スペース_レベル0コンテキスト修正スペースデバッグ
x_ht_acceptance_tolerance8フォントデータの外側におけるブロブのトップの最大許容偏差
x_ht_min_change8実際に試す前に xht の最小変更
superscript_debug0デバッグレベル for sub & superscript fixer
JPG品質85JPEGの品質レベルを設定
ユーザー定義DPI0入力画像のDPIを指定する
試行する最小文字数50最小文字数をOSD中に試行するように指定する
疑わしいレベル99容疑者マーカーレベル
suspect_short_words2これより長い辞書の単語を疑わないでください
tessedit_reject_mode(テスエディットリジェクトモード)0拒否アルゴリズム
tessedit_image_border2画像の端の近くにあるRej blbs限界
min_sane_x_ht_pixels (min_sane_x_ht_pixels)8この値より小さいか等しい、または大きいx-htを拒否します。
tessedit_page_number-1ページ番号が -1 の場合 -> すべてのページ、そうでない場合は処理する特定のページ
tessedit_parallelize1可能な場合は並列で実行する
lstm_choice_mode2hOCR出力に代替シンボル選択を含めることができます。有効な入力値は0、1、2です。初期値は0です。1を指定すると、タイムステップごとの代替シンボル選択が含まれます。2を指定すると、代替シンボル選択はラティスの代わりにCTCプロセスから抽出されます。選択は文字ごとにマッピングされます。
LSTM選択反復5lstm_choice_modeでビームサーチのカスケード反復回数を設定します。結果を得るには、lstm_choice_modeが0より大きい値に設定されている必要があります。
tosp_debug_level (デバッグレベル)0デバッグデータ
tosp_enough_space_samples_for_median 充分なスペースサンプルの中央値3平均を使用すべきでしょうか
tosp_redo_kern_limit (トスプ_リド_カーン_リミット)10行の再見積もりに必要なサンプル数
サンプルが少ない場合401つの大きなギャップを使用してテーブルとして処理するため、ギャップなしが必要です。
tosp_short_row20証明書を使用するためのいくつかの特定のスペースでギャップは不要です
tosp_sanity_method1How to avoid being silly 愚かにならない方法
textord_max_noise_size7ノイズのピクセルサイズ
テキストオードベースラインデバッグ0基準デバッグレベル
textord_noise_sizefraction10最大値のサイズの比率
textord_noise_translimit16通常のブロブのトランジション
textord_noise_sncount (テキストオードノイズ スノーカウント)1行を保存するためのスーパー ノーム ブロブ
適応に曖昧さを使用0文字に適応するかどうかを決定するためにambigsを使用する
添付ファイルを許可1ディバイザブルブロブチョッピングを使用してください。
優先分割0チョップするよりもブロブ分割を優先する
クラスファイ_イネーブル_ラーニング1適応型分類器を有効にする
tess_cn_matching(テスチャン・マッチング)0文字正規化一致
tess_bn_matching0ベースライン正規化マッチング
分類_適応マッチャーを有効にする1適応型分類器を有効にする
事前適応されたテンプレートを使用して分類する0事前に適応された分類器テンプレートを使用する
分類保存アダプトされたテンプレート0適応したテンプレートをファイルに保存
適応型デバッガーの分類を有効にする0マッチデバッガーを有効にする
非線形正規化を分類0非線形ストローク密度正規化
disable_character_fragments キャラクターフラグメントを無効にする1分類器の結果に文字の断片を含めないでください。
デバッグ文字フラグメントの分類0フラグメントトレーニングのためのグラフィカルデバッグウィンドウを表示します
matcher_debug_separate_windows0マッチングをデバッグするには、2つの異なるウィンドウを使用します: 一つはプロトス用、もう一つはフィーチャー用です。
classify_bln_numeric_mode (数値モードを分類)0入力が数字[0-9]であると仮定します。
load_system_dawg1システムワードをロードしています。
load_freq_dawg (ロード_フリク_ドーグ)1頻出単語の読み込み。
ロード_アンビグ_ドーグ1明確な「dawg」という単語を読み込みます。
load_punc_dawg(符号化済補助記号辞書の読み込み)1句読点パターンを使用してdawgを読み込みます。
load_number_dawg1番号パターンを使用して load dawg。
load_bigram_dawg 1特定の単語ビグラムでdawgを読み込む。
最初のuft8ステップのみを使用0与えられた文字列のログ確率を計算する際には、最初の UTF8 ステップのみを使用してください。
stopper_no_acceptable_choices0AcceptableChoice()が常にfalseを返すようにします。すべてのセグメンテーションを調査する必要がある場合に役立ちます。
非アルファベットスクリプトセグメント0アルファベット特有のトリックを使用しないでください。草書体や本来固定幅のスクリプトに対しては、traineddata設定ファイルでtrueに設定してください。
save_doc_words ```plaintext ドキュメントの単語を保存0ドキュメントの単語を保存
マトリックス内のフラグメントをマージ1評価マトリックス内の断片を結合し、結合後に削除してください
wordrec_enable_assoc1Associator Enable アソシエーター有効化
force_word_assoc0強制的にアソシエータを実行させ、enable_assocの設定に関係なく動作させます。これはCJK(中国語、日本語、韓国語)の場合に、コンポーネントのグループ化が必要な場合に使用されます。
chop_enable (Note: "chop_enable"はソフトウェア開発に関連する専門用語のため、原文のままにしてあります。)1チョップ有効化
垂直クリープを切断0垂直クリープ
新しいシームの積み重ねを切り取る1新しいseam_pileを使用
固定ピッチ文字セグメントを仮定する0文字セグメンテーションに固定ピッチのヒューリスティクスを含める
wordrec_skip_no_truth_words0BlamerBundleに記録された真実がある単語に対してのみOCRを実行してください。
wordrec_debug_blamer0印刷ブレーマーデバッグメッセージ
wordrec_run_blamer0エラーの責任を設定しようとする
保存_alt_選択1切断およびセグメンテーション検索中に見つかった代替パスを保存
言語モデルn-gramオン0文字ngramモデルの使用をオン/オフにする
以下の内容を日本語に翻訳します。: language_model_ngram_use_ --- 以下が翻訳結果です。: 言語モデル n-gram 利用_ --- 技術用語や文脈の整合性を保ちながら翻訳しました。 only_first_uft8_step0与えられた文字列のログ確率を計算する際には、最初の UTF8 ステップのみを使用してください。
言語モデル n-gram スペース delimited_language1以下の内容を日本語に翻訳してください: IronPDF helps you seamlessly create, edit, and extract content from PDFs in .NET and other programming languages such as Java, Python, and Node.js. With IronPDF, you can convert HTML to PDF, merge PDFs, and add watermarks. IronPDF ensures high-fidelity rendering and accurate text extraction, making it a valuable tool for developers needing effective PDF manipulation. ``` IronPDFは、.NETおよびJava、Python、Node.jsなどの他のプログラミング言語で、PDFの作成、編集、コンテンツの抽出をシームレスに支援します。IronPDFを使用すると、HTMLをPDFに変換したり、PDFをマージしたり、透かしを追加したりできます。IronPDFは高忠実度のレンダリングと正確なテキスト抽出を保証し、効果的なPDF操作を必要とする開発者にとって貴重なツールとなります。
シグモイド確信度を使用した言語モデル0確実性にはシグモイドスコアを使用
tessedit_resegment_from_boxes(テスエディット リセグメント フロム ボックス)0ボックスファイルからセグメンテーションとラベリングを取得する
tessedit_resegment_from_line_boxes(ラインボックスから再セグメント化する機能)0単語/行ボックスファイルから文字ボックスファイルへの変換
tessedit_train_from_boxes (テスエディット トレイン フロム ボックス)0ボックス化された文字からトレーニングデータを生成する
tessedit_make_boxes_from_boxes (テッセディットメイクボックスフロムボックス)0ボックス化された文字からさらに多くのボックスを生成する
tessedit_train_line_recognizer0入力を行ごとに分割し、ボックスがあれば再マッピングします
tessedit_dump_pageseg_images(ページセグメント画像のダンプ)0ページセグメンテーション中に生成される中間画像をダンプする
tessedit_do_invert1`LSTMRecognizeWord`で画像を反転してみてください
tessedit_ambigs_training0曖昧さのためのトレーニングを実行する
適応デバッグーツール0適応のためのデバッグ情報を生成および印刷
applybox_learn_chars_and_char_frags_mode(文字と文字フラグメントを学習するモード)0特殊な低露出モードで行われるように、文字の断片と未分割の文字の両方を学習します。
applybox_learn_ngrams_mode (この文は技術用語およびコードの一部であり、翻訳よりそのまま保持するのが適切です)0各バウンディングボックスにはngramが含まれていると仮定します。アウトラインが水平に重なるngramsのみを学習します。
tessedit_display_outwords0出力ワードを描画
tessedit_dump_choices0文字選択をダンプ
tessedit_timing_debug (テッセディット タイミング デバッグ)0印刷タイミング統計
tessedit_fix_fuzzy_spaces1曖昧なスペースを改善する
tessedit_unrej_any_wd0言葉のもっともらしさにこだわらないでください
tessedit_fix_hyphens(テスエディット_フィックス_ハイフンズ)1二重ハイフンを圧縮しますか?
tessedit_enable_doc_dict (この技術用語は直接翻訳せずオリジナルのままにしてください)1ドキュメント辞書に単語を追加
tessedit_debug_fonts(フォントデバッグ機能)0文字ごとのフォント情報を出力
`tessedit_debug_block_rejection(テスエディット_デバッグ_ブロック_リジェクション)0ブロックおよび行の統計
tessedit_enable_bigram_correction1単語ビグラム辞書に基づく修正を有効にする。
tessedit_enable_dict_correction0辞書に基づく単語の補正を有効にする。
ノイズ除去を有効にする1小さなアウトラインがレイアウト解析を混乱させる場合、それらを削除し、条件に応じて再割り当てすることで、ダイアクリティカルマークとノイズを識別します。
tessedit_minimal_rej_pass10パス1出力に対して最小限の拒否を行う
tessedit_test_adaption (この技術用語は翻訳せず、元のままにしておくことが適切です。この用語は多くのエンジニアにそのまま理解されます。)0テスト適用基準
テスト ポイント0ポイントのテスト
段落テキストに基づく1テキスト認識後の段落検出を実行(より正確)
lstm_use_matrix(LSTM使用行列)1評価行列/ビームサーチとLSTMを利用する
tessedit_good_quality_unrej1良好なドキュメントの拒否を減らす
tessedit_use_reject_spaces1空白を拒否しますか?
tessedit_preserve_blk_rej_perfect_wds1部分的に拒否された単語のみをブロック拒否
tessedit_preserve_row_rej_perfect_wds1行の拒否で部分的に拒否されたワードのみ
tessedit_dont_blkrej_good_wds0セグメンテーション品質メトリックを使用
tessedit_dont_rowrej_good_wds0セグメンテーション品質メトリックを使用
tessedit_row_rej_good_docs1良いドキュメントに行ごとに拒否を適用する
tessedit_reject_bad_qual_wds (注:この部分は技術用語であり、翻訳しませんが、意味を説明します。「tessedit_reject_bad_qual_wds」はTesseract OCRの設定に関連するパラメータで、低品質の単語を拒否することを設定します。)1すべての低品質のWDSを拒否する
tessedit_debug_doc_rejection0ページ統計
テセディット_デバッグ_クオリティ_メトリクス0デバッグファイルにデータを出力
bland_unrej0チェックなしで可能性を解き放つ
UNLV_TILDE_CRUNCHING0チルダクラッシュのために不適切な単語にマークを付ける
hocr_font_info ホックフォント情報0hocr出力にフォント情報を追加
hocr_char_boxes(キャラクターボックス)0hOCR出力に各文字の座標を追加
crunch_early_merge_tess_fails クラウンチ_アーリー_マージ_テス_フェイルズ1「Before word crunch?」を日本語に翻訳すると以下のようになります: 単語の圧縮前?
クランチ_アーリー_コンバート_バッド_UNLV_CHS0~^を早く取り出す?
クランチ_テリブル_ガーベッジ1指示通り
crunch_leave_ok_strings (Note: This appears to be a technical term or identifier wherein maintaining the original form is crucial for accurate technical understanding and functionality within any code or software context.)1機密文字列には触れないでください
クランチ_accept_ok1OKStringの受理性を使用する
crunch_leave_accept_strings0文字列を逆参照しないでください
数値を含むcrunchです0フィドルアルファフィギュア
tessedit_prefer_joined_punct0句読点接続を報酬
tessedit_write_block_separators(ブロック区切り文字を書き込む)0出力にブロックセパレーターを書き込む
tessedit_write_rep_codes0反復文字コードを書き込む
tessedit_write_unlv0.unlv出力ファイルを書き込み
tessedit_create_txt0.txt出力ファイルを書く
tessedit_create_hocr0.html hOCR出力ファイルを作成
tessedit_create_alto0.xml ALTOファイルを作成
tessedit_create_lstmbox (テスエディット・クリエイト・エルエスティエムボックス)0LSTMトレーニングのために .boxファイルを書き出す
tessedit_create_tsv0.tsv出力ファイルを作成
tessedit_create_wordstrbox0WordStr形式の.box出力ファイルを作成
tessedit_create_pdf0.pdf出力ファイルを書き込む
テキストのみのPDF0単一の見えないテキストレイヤーのみでPDFを作成
suspect_constrain_1Il0UNLV 1Il文字は拒否されました
tessedit_minimal_rejection(テセディット・ミニマル・リジェクション)0テス失敗のみ拒否
テスエディットゼロリジェクション0何も拒否しない
tessedit_word_for_word0出力が各WERDごとに正確に1つの単語を持つようにする
tessedit_zero_kelvin_rejection (テスエディットゼロケルビンリジェクション)0何も拒否しない AT ALL
tessedit_rejection_debug0適応デバッグ
tessedit_flip_0O1文脈における0O O0の逆転
ドキュメントが提供されていませんので、短いメッセージや単語では翻訳が難しいかもしれません。この文脈では意味が不確かであるため、提供されたフレーズの個々の単語を変換するよりも、もう一度詳細な内容を明示していただけると幸いです。011l コンフィギュレーターで DOC dawg を使用してください。
rej_1Il_use_dict_word0"Use dictword test"を日本語に翻訳すると、以下のようになります: 「dictword testを使用」 この翻訳では、技術用語「dictword test」をそのまま使用し、コンテキストに忠実に翻訳しました。
rej_1Il_trust_permuter_type1再確認しないでください
rej_use_tess_accepted(テッサー機能が受け入れられています)1個別リジェクト制御
rej_use_tess_blanks1個別リジェクト制御
良好な権限を使用1個別リジェクト制御
以下の内容を日本語に翻訳してください: rej_use_sensible_wd0パーミュートチェッカーを拡張する
英数字の順列のrej_alphas0パーミュートチェッカーを拡張する
tessedit_create_boxfile (テッセディット・クリエイト・ボックスファイル)0ボックス付きの出力テキスト
tessedit_write_images0IPEから画像をキャプチャする
対話型表示モード0インタラクティブに実行しますか?
tessedit_override_permuter テクニカルタームや製品名を翻訳せずにそのまま表示する指示を受けています。このため、この用語はそのまま「tessedit_override_permuter」として表示されます。1dict_word によると
tessedit_use_primary_params_model0多言語モードでは、主言語のパラメーターモデルを使用します
textord_tabfind_show_vlines0デバッグラインの検出
CJKフォントモデルを使用する0CJK 固定ピッチモデルを使用
poly_allow_detailed_fx ポリ_allow_detailed_fx0機能抽出器が元のアウトラインを見ることを許可します
tessedit_init_config_only0構成ファイルでのみ初期化します。インスタンスがOCRに使用されず、レイアウト分析のみに使用される場合に便利です。
textord_equation_detect (テキスト順方程式検出)0式検出器をオンにする
テキスト: `textord_tabfind_vertical_text 翻訳: `textord_tabfind_vertical_text1垂直検出を有効にする
textord_tabfind_force_vertical_text(テキスト順タブ検出強制垂直テキスト)0縦書きページモードを強制使用
インターワードスペースを保持0複数の単語間スペースを保持する
pageseg_apply_music_mask (楽譜マスクを適用する)1楽譜を検出し、交差する要素を削除します。
`textord_single_height_mode` This is a technical term and does not have a direct translation into Japanese. It is best to keep it as is: `textord_single_height_mode`.0スクリプトにはxheightがないため、シングルモードを使用してください。
tosp_old_to_method (原文の「tosp_old_to_method」をそのまま理解できる日本語訳がないため、この部分は元のままにします。)0スペース統計はプレチョッピングを使用していますか?
tosp_old_to_constrain_sp_kn0old_to_methodのインターワードギャップおよびイントラーワードギャップの相対値を制約します。
tosp_only_use_prop_rows1固定ピッチ行を使用するためのブロック統計?
句読点で単語の改行を強制する0句読点で単語を強制的に区切り、非スペース区切りの言語で長い行を分割する
tosp_use_pre_chopping0スペース統計はプレチョッピングを使用していますか?
バグ修正のためのtosp_old0古いコードの疑わしいバグを修正
tosp_block_use_cert_spaces1明らかなスペースのみ説明する
tosp_row_use_cert_spaces1明らかなスペースのみ説明する
tosp_narrow_blobs_not_cert1明らかなスペースのみ説明する
tosp_row_use_cert_spaces11明らかなスペースのみ説明する
`tosp_recovery_isolated_row_stats`1不適切な証明書スペースがある場合にのみ単独で行を使用します。
カーニング用に小さなギャップのみを許可0より良い推測
tosp_all_flips_fuzzy0任意のフリップをコンテキストに渡す?
tosp_fuzzy_limit_all1表にのみ制限をかけないようにする kn->sp ファジー制限
tosp_stats_use_xht_gaps (この専門用語は特定の技術コンテキストで一般的な翻訳がないため、そのまま保持されます)1wdの改行のためにxhtの間隔内で使用する
tosp_use_xht_gaps1wdの改行のためにxhtの間隔内で使用する
tosp_only_use_xht_gaps のみ使用0xhtギャップ内でのみ使用し、wdブレークのために使用します。
tosp_rule_9_test_punct0句読点の横にスペースを入れないでください。
tosp_flip_fuzz_kn_to_sp1デフォルトのフリップ
tosp_flip_fuzz_sp_to_kn1デフォルトのフリップ
tosp_improve_thresh(しきい値改良)0改善ヒューリスティックを有効にする
テキストの内容を日本語に翻訳します: textord_no_rejects textord_no_rejects0ノイズブロブを削除しないでください。
ブロブを表示0未整理のブロブを表示
textord_show_boxes0未整理のブロブを表示
textord_noise_rejwords(テキストオルド・ノイズ・レジワード)1ノイズのような単語を拒否
テキスト行のノイズ拒否行1ノイズのような行を拒否する
textord_noise_debug0デバッグ行ガベージ検出器
classify_learn_debug_str (学習デバッグ文字列の分類)デバッグ学習のためのクラスstr
ユーザー・ワード・ファイルユーザー提供の単語のファイル名。
ユーザー・ワード・サフィックスtessdataにあるユーザー提供の単語の接尾辞。
ユーザーパターンファイルユーザーが提供したパターンのファイル名。
ユーザーパターン接尾辞tessdataにあるユーザー提供パターンの接尾辞。
`output_ambig_words_file (曖昧な単語の出力ファイル)`辞書で見つかった曖昧性の出力ファイル
デバッグする単語標準出力に停止デバッグ情報を印刷するワード
tessedit_char_blacklist (テスエディット_キャラ_ブラックリスト)認識しない文字のブラックリスト
tessedit_char_whitelist認識する文字のホワイトリスト
tessedit_char_unblacklisttessedit_char_blacklistを上書きする文字のリスト (テスエディット_キャラ_ブラックリスト)
tessedit_write_params_to_file(テスエディット_ライト_パラメータズ_トゥ_ファイル)指定されたファイルにすべてのパラメーターを書き込みます。
applybox_exposure_pattern(適用ボックス露光パターン)以下の内容を日本語に翻訳します: .expExposure value follows this pattern in the image filename. The name of the image files are expected to be in the form [lang].[fontname]以下の内容を日本語に翻訳します: .exp [num].tif
先導句読点 (')] 先行句読点
chs_trailing_punct1).,;:?!末尾の句読点
chs_trailing_punct2 )'`"末尾の句読点
アウトライン_奇数「%」 非標準のアウトライン数
アウトライン_2 ij!?%":;非標準のアウトライン数
数字の句読点。、数字内に期待される句読点
認識されない文字 識別されていないブロブの出力文字
ok_repeated_ch_non_alphanum_wds-?*=NNの許可を解除する
conflict_set_I_l_1 (注: 元の用語やプログラムの名前はそのままにするのが望ましいため、この特定の用語は翻訳されていません。)イル1 [].Il1 conflict set(Il1コンフリクトセット)
ファイルタイプ.tifファイル名拡張子
tessedit_load_sublangsこの言語と一緒にロードする言語のリスト
ページ区切り ページ区切り(デフォルトはフォームフィード制御文字)
クラスイファイ・キャラ・ノーム・レンジ (classify_char_norm_range)0.2文字正規化範囲
classify_max_rating_ratio(最大評価比率の分類)1.5分類器評価間の拒否率
最大確実度マージンで分類5.5分類器の確実性の違いを拒否
matcher_good_threshold0.125良好 (0-1)
リライアブル_アダプティブ_リザルト_マッチャー0Great Match (0-1)
matcher_perfect_threshold0.02パーフェクトマッチ (0-1)
マッチャー_バッド_マッチ_パッド0.15バッドマッチパッド (0-1)
一致評価マージン0.1新しいテンプレートのマージン(0-1)
平均ノイズサイズマッチャー12平均ノイズブロブの長さ
matcher_clustering_max_angle_delta(最大角度差クラスタリングマッチャー)0.015プロトタイプクラスタリングの最大角度デルタ
誤分類_ノイズ_ペナルティ0期待されるテキストラインの位置から垂直方向に外れた非英数字に適用されるペナルティ
評価尺度1.5評価スケーリングファクター
確実性スケール20確実性スケーリングファクター
tessedit_class_miss_scale0.00390625使用されていない機能のスケールファクター
classify_adapted_pruning_factor を日本語に翻訳する場合、専門用語や構文の文脈をなるべくそのまま活かして次のようになります: classify_adapted_pruning_factor (「アダプテッド・プルーニング・ファクターを分類」といった意訳も考えられますが、技術用語の一貫性を保つためにそのままにしてあります。)2.5最良の結果よりもはるかに劣る適応結果を削除する
適応型プルーニング閾値を分類する-1Threshold at which classify_adapted_pruning_factor を日本語に翻訳する場合、専門用語や構文の文脈をなるべくそのまま活かして次のようになります: classify_adapted_pruning_factor (「アダプテッド・プルーニング・ファクターを分類」といった意訳も考えられますが、技術用語の一貫性を保つためにそのままにしてあります。) starts
文字断片を分類する (classify_character_fragments_) garbage_certainty_threshold-3トレーニングおよび適応から完全な文字ではない断片を除外する
speckle_large_max_size (スペックル_ラージ_マックス_サイズ)0.3最大ラージスペックルサイズ
スぺックル評価ペナルティ10最低評価に対するノイズによる加算ペナルティ
下付き文字のx高さペナルティ0.125複数の単語に下付き文字や上付き文字がある場合、加点ペナルティ(0.1=10%)が追加されますが、それ以外は問題ありません。
xheight_penalty_inconsistent (xheightの不一致のペナルティ)0.25xheightが一貫していない場合、スコアペナルティ(0.1 = 10%)が追加されます。
頻出単語のセグメントペナルティ辞書1与えられた言語で、適切な大文字使用と頻繁に使用される単語の一致に対するスコア乗数 (低いほど良い)。
セグメントペナルティ辞書ケースOK1.1良いケースを持つ単語の一致に対するスコア乗数(小さい方が良い)。
セグメント_ペナルティ_ディクショナリ_ケース_バッド1.3125単語の一致におけるデフォルトのスコア乗数です。これは大文字と小文字の問題があるかもしれません(低いほど良い)。
非単語セグメントペナルティ辞書1.25辞書の単語と一致しないグリフフラグメントセグメンテーションのスコア乗数(低いほど良い)。
セグメント_ペナルティ_ガベージ1.5辞書に含まれておらず、一般的にゴミのように見える不適切な大文字小文字の文字列のスコア乗数(低い方が良い)。
確実性スケール20確実性スケーリングファクター
ストッパー_ノンディクト_確信_ベース-2.5非辞書単語の確実性しきい値
stopper_phase2_certainty_rejection_offset ストッパー・フェーズ2・確実性・拒絶・オフセット1確実性オフセットを拒否する
ストッパー_確実性_パー_キャラ-0.5各辞書キャラクターに対して、小さい単語サイズを超える確実性を追加します。
許容可能な文字の悪さのストッパー3単語の最大確度変動許容範囲(シグマ内)
保留ドキュメント閾値0ペンディング辞書を使用する際の最悪の確定事項
doc_dict_certainty_threshold (信頼度閾値)-2.25ドキュメント辞書に挿入できる単語に関する最悪の確実性
tessedit_certainty_threshold-2.25良いBLOB制限
chop_split_dist_knob チョップスプリットディストノブ0.5分割長さの調整
重なり除去ノブ0.9分割オーバーラップ調整
中心ノブを切断0.15センター調整の分割
chop_sharpness_knobは日本語に直接翻訳しにくいですが、コンテキストに応じて「シャープネス調整ノブ」や「鋭さ調整ノブ」などが適切です。0.06シャープネス調整の分割
幅変更コントロールノブ5幅変更調整
分割可能100OK分割制限
chop_good_split50良好な分割制限
segsearch_max_char_wh_ratio (セグサーチ_マックス_キャラ_ワイド_ハイ_レシオ)2最大文字幅対高さ比