Iron Tesseractの使用方法
IronOCRは、Iron Tesseractとして知られるカスタマイズおよび最適化されたTesseract 5を利用する直感的なAPIを提供します。 IronOCRとIronTesseractを使用することで、テキストの画像やスキャンした文書をテキストおよび検索可能なPDFに変換することができます。
IronOCRを始めましょう
今日から無料トライアルでIronOCRをあなたのプロジェクトで使い始めましょう。
Iron Tesseractの使用方法
- NuGetを使用してOCRライブラリをインストールし、画像を読み取ります。
- カスタムTesseract 5を利用してOCRを実行する
- 処理のために、画像やPDFファイルといった目的の文書を読み込んでください。
- 抽出したテキストをコンソールまたはファイルに出力
- 検索可能なPDFとして結果を保存
IronTesseractインスタンスを作成する
次のようにしてtesseractオブジェクトを初期化するだけです。
:path=/static-assets/ocr/content-code-examples/how-to/irontesseract-initialize-irontesseract.cs
using IronOcr;
IronTesseract ocr = new IronTesseract();
IRON VB CONVERTER ERROR developers@ironsoftware.com
IronTesseractの動作は、異なる言語の選択、バーコード読み取りの有効化、文字のホワイトリスト/ブラックリスト設定によりカスタマイズできます。
:path=/static-assets/ocr/content-code-examples/how-to/irontesseract-configure-irontesseract.cs
IronTesseract ocr = new IronTesseract
{
Configuration = new TesseractConfiguration
{
ReadBarCodes = false,
RenderHocr = true,
TesseractVariables = null,
WhiteListCharacters = null,
BlackListCharacters = "`ë|^",
},
MultiThreaded = false,
Language = OcrLanguage.English,
EnableTesseractConsoleMessages = true, // False as default
};
Dim ocr As New IronTesseract With {
.Configuration = New TesseractConfiguration With {
.ReadBarCodes = False,
.RenderHocr = True,
.TesseractVariables = Nothing,
.WhiteListCharacters = Nothing,
.BlackListCharacters = "`ë|^"
},
.MultiThreaded = False,
.Language = OcrLanguage.English,
.EnableTesseractConsoleMessages = True
}
これが完了したら、Tesseract 機能を使用して OcrInput
オブジェクトを読み取ることができます。
:path=/static-assets/ocr/content-code-examples/how-to/irontesseract-read.cs
IronTesseract ocr = new IronTesseract();
using OcrInput input = new OcrInput();
input.LoadImage("attachment.png");
OcrResult result = ocr.Read(input);
string text = result.Text;
Dim ocr As New IronTesseract()
Using input As New OcrInput()
input.LoadImage("attachment.png")
Dim result As OcrResult = ocr.Read(input)
Dim text As String = result.Text
End Using
高度なTesseract構成変数
IronOCR Tesseractインターフェースは、Tesseractの構成変数を完全に制御することができます。
IronOcr.TesseractConfiguration クラス
テッセラクト設定コード例
:path=/static-assets/ocr/content-code-examples/how-to/irontesseract-tesseract-configuration.cs
using IronOcr;
using System;
IronTesseract Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.English;
Ocr.Configuration.PageSegmentationMode = TesseractPageSegmentationMode.AutoOsd;
// Configure Tesseract Engine
Ocr.Configuration.TesseractVariables["tessedit_parallelize"] = false;
using var input = new OcrInput();
input.LoadImage("/path/file.png");
OcrResult Result = Ocr.Read(input);
Console.WriteLine(Result.Text);
Imports IronOcr
Imports System
Private Ocr As New IronTesseract()
Ocr.Language = OcrLanguage.English
Ocr.Configuration.PageSegmentationMode = TesseractPageSegmentationMode.AutoOsd
' Configure Tesseract Engine
Ocr.Configuration.TesseractVariables("tessedit_parallelize") = False
Dim input = New OcrInput()
input.LoadImage("/path/file.png")
Dim Result As OcrResult = Ocr.Read(input)
Console.WriteLine(Result.Text)
すべてのTesseract構成変数の一覧
これは IronTesseract.Configuration.TesseractVariables
を使用して設定できます。[「キー」]= 値;
テッセラクト構成変数 | デフォルト | 意味 |
---|---|---|
classify_num_cp_levels(分類番号CPレベル) | クラスプルーナーレベル数 | |
textord_debug_tabfind | デバッグタブの検索 | |
textord_debug_bugs | タブの検出に関するバグの出力をオンにする | |
textord_testregion_left (テキスト順テスト地域左) | -1 | デバッグレポート矩形の左端 |
textord_testregion_top | -1 | デバッグレポート四角形の上端 |
textord_testregion_right | 147483647 | デバッグ矩形の右端 |
textord_testregion_bottom (Note: This specific phrase appears to be a term related to OCR technology or a programming keyword, which is why it is left untranslated to maintain the technical context and understanding for the related technology.) | 147483647 | デバッグ矩形の下端 |
textord_tabfind_show_partitions | パーティション境界を表示します。1つ以上の場合は待機します。 | |
デーヴァナーガリー_スプリット_デバッグレベル | スプリット・シロレーカ処理用のデバッグレベル。 | |
アウトラインあたりの最大子エッジ数 | 文字輪郭内の最大子数 | |
エッジ_最大_子レイヤー | 文字のアウトライン内のネストされた子要素の最大レイヤー数 | |
孫ごとの子供のエッジ | チャッキングアウトラインの重要度比率 | |
子要素のエッジカウント制限 | ブロブに許可される最大穴数 | |
エッジ_最小_非穴 | ボックス内の潜在文字の最小ピクセル数 | |
エッジパスエリア比 | 許容される子供のアウトラインのための最大レンズq/エリア | |
テキスト生成_fp_チョップ_エラー | チョップセルの最大許容曲げ | |
テキストの「textord_tabfind_show_images」を日本語に翻訳する指示を受けましたが、この特定の用語は技術用語であり、一般的に日本語に翻訳されることはありません。そのため、原則としてこの用語はそのまま保持する必要があります。「textord_tabfind_show_images」はそのまま使用されます。 | 画像ブロブを表示 | |
textord_skewsmooth_offset | スムーズファクター用 | |
textord_skewsmooth_offset2 | スムーズファクター用 | |
テキスト textord_test_x | -2147483647 | テストポイントの座標 |
`textord_test_y` | -2147483647 | テストポイントの座標 |
行内の最小blob数 | グラデーション計算前の最小ブロブ数 | |
textord_spline_minblobs | 各スプラインセグメントの最小ブロブ | |
テキスト: textord_spline_medianwin | スプライン分割のウィンドウサイズ | |
textord_max_blob_overlaps (テキストオード マックス ブロブ オーバーラップス) | 大きなブロブが重なり合うことができるブロブの最大数 | |
textord_min_xheight | 最小信頼できるピクセル xheight | |
textord_lms_line_trials | 行をフィットする回数 | |
oldbl_holed_losscount (オールドビーエル ホール LOSSC文字数) | フォールバックラインが使用される前の最大損失 | |
pitsync_linear_version | 新しい高速アルゴリズムを使用する | |
pitsync_fake_depth ピットシンク_フェイク_デプス | 最大の進んだ偽造生成 | |
textord_tabfind_show_strokewidths | ストローク幅を表示 | |
textord_dotmatrix_gap (点字マトリックス間隔) Note: I've preserved the technical term as is, while providing a clear explanation in parentheses. | 壊れたピッチの最大ピクセルギャップ | |
textord_debug_block | デバッグを行うブロック | |
textord_pitch_range | ピッチの最大レンジテスト | |
textord_words_veto_power(英語のままで言及されています) | 拒否権を上回るために必要な行数 | |
equationdetect_save_bi_image | 入力を画像として保存 | |
equationdetect_save_spt_image(エクエーションディテクト・セーブ・SPT・イメージ) | 特殊文字画像を保存 | |
equationdetect_save_seed_image 数式検出_シード画像を保存 | シード画像を保存する | |
equationdetect_save_merged_image 等式検出_保存_結合画像 | マージされた画像を保存 | |
poly_debug | 古いポリゴンをデバッグする | |
poly_wide_objects_better | 幅広いものに対してより正確な近似値 | |
wordrec_display_splits | 表示分割 | |
textord_debug_printable | デバッグウィンドウを印刷可能にする | |
テキストの間隔サイズは可変です | true の場合、単語区切りスペースは可変幅であると仮定され、文字は一定ピッチであるにもかかわらずとなります。 | |
textord_tabfind_show_initial_partitions | パーティションの境界を表示 | |
textord_tabfind_show_reject_blobs | ノイズとして拒否されたブロブを表示 | |
textord_tabfind_show_columns(テキストオーダータブファインドショウカラム) | 列の境界を表示 | |
textord_tabfind_show_blocks | 最終ブロック境界を表示 | |
textord_tabfind_find_tables (textord_tabfind_find_tablesのまま適用してください) | テーブル検出を実行 | |
デバナガリ_スプリット_デバッグイメージ | スプリットシロレーカ処理のデバッグ画像を作成するかどうか。 | |
textord_show_fixed_cuts | 固定ピッチのセル境界を描画 | |
エッジズ_ユーズ_ニュー_アウトライン_コンプレキシティ | 新しいアウトライン複雑性モジュールを使用する | |
エッジデバッグ | このモジュールのデバッグを有効にする | |
エッジズ_チルドレン_フィックス | 文字に似た子のボックス状の親を削除する | |
gapmap_debug | どのブロックにテーブルがあるかを言う | |
gapmap_use_ends ギャップマップ_使用_終了 | 行の最初と最後に大きなスペースを使用します | |
孤立した量子なしのgapmap | 隙間は最低でも2量子幅になるようにしてください。 | |
textord_heavy_nr | ノイズを徹底的に除去する | |
textord_show_initial_rows | 行の累積を表示 | |
テキストを「textord_show_parallel_rows」に翻訳します: textord_show_parallel_rows | ページ相関行を表示 | |
textord_show_expanded_rows(テキスト順序_展開された行を表示する) | 拡張後に行を表示 | |
最終行を表示 (textord_show_final_rows) | 最終フィッティング後の行を表示 | |
textord_show_final_blobs | プレアサイン後にブロブ境界を表示 | |
textord_test_landscape | テストは陸地および港を指します。 | |
テキスト平行基線 | 平行ベースラインの強制 | |
textord_straight_baselines | ベースラインを強制的にまっすぐにする | |
textord_old_baselines | 旧ベースラインアルゴリズムを使用 | |
textord_old_xheight (テキストオード オールド エックスハイト) | 旧xheightアルゴリズムを使用 | |
textord_fix_xheight_bug | スプラインベースラインを使用する | |
textord_fix_makerow_bug | 複数のベースラインを防ぐ | |
textord_debug_xheights | 高さアルゴリズムをテスト | |
バイアス付きスキュー計算 | 行の長さを使用してバイアススキューを推定 | |
textord_interpolating_skew | ギャップを補間する | |
textord_new_initial_xheight | テストxheightメカニズムを使用する | |
textord_debug_blob(テキストオーダーデバッグブロブ) | テストブロブ情報を印刷 | |
textord_really_old_xheight (テキストオード_リアリー_オールド_エックスハイト) | オリジナルの wiseowl xheight を使用 | |
textord_oldbl_debug | 古いベースライン生成のデバッグ | |
textord_debug_baselines | デバッグベースラインの生成 | |
textord_oldbl_paradef | デフォルトメカニズムを使用する | |
textord_oldbl_split_splines | ステップドスプラインの分割 | |
textord_oldbl_merge_parts | 疑わしいパーティションを統合する | |
oldbl_corrfix | 高さの相関を改善する | |
The term "oldbl_xhfix" is a technical identifier and does not require translation. Therefore, it should remain as it is: oldbl_xhfix | モードのしきい値に関するxheightsのバグを修正 | |
textord_ocropus_mode | OCRopusのためのベースラインを作成する | |
textord_tabfind_only_strokewidths | ストロークの幅のみを実行 | |
textord_tabfind_show_initialtabs (注:上記の用語はプログラムの特定フィールドまたはパラメータを指すもので、翻訳は不要です。) | タブの候補を表示 | |
textord_tabfind_show_finaltabs | タブベクターを表示 | |
textord_show_tables | 表領域を表示 | |
textord_tablefind_show_mark (表検索を表示) | デバッグテーブルの手順詳細のマーク付け | |
textord_tablefind_show_stats(テキストオード_テーブルファインド_ショースタッツ) | テーブル検索に使用されるページの統計を表示 | |
textord_tablefind_recognize_tables (Note: As this appears to be a specific technical term or function name related to programming or software development, it is usually preserved in its original form to avoid confusion.) | テーブルのレイアウトおよびフィルタリングのためのテーブル認識機能を有効にします。 | |
textord_all_prop | すべてのドキュメントは比例テキストです | |
textord_debug_pitch_test | 固定ピッチテストのデバッグ | |
ピッチテストを無効にする | 固定ピッチアルゴリズムをオフにする | |
textord_fast_pitch_test | さらに高速な音声アルゴリズムを実現 | |
textord_debug_pitch_metric | フルメトリックの内容を書く | |
textord_show_row_cuts | 行レベルのカットを描く | |
textord_show_page_cuts | ページレベルのカットを描画 | |
textord_pitch_cheat (テキストオーダーピッチチート) | 正解を指定して修正/提案を実施する | |
textord_blockndoc_fixed | ブロック全体を固定ピッチで試みる | |
初期テキストワードを表示 | 単語を表示する | |
textord_show_new_words | 単語を表示する | |
テキストの内容を日本語に翻訳します: textord_show_fixed_words | 固定ピッチの単語を強制表示 | |
textord_blocksall_fixed | プロップブロックに関する不満 | |
textord_blocksall_prop(テキストオード_ブロックスオール_プロップ) | 固定ピッチブロックに関して不満を言う | |
テキストオルド_ブロックオール_テスト中 | 嘆くときに統計データをダンプ | |
textord_test_mode (テキスト領域テストモード) | 現在のテストを実行 | |
textord_pitch_scalebigwords | 大文字でスコアを拡大 | |
textord_restore_underlines | 下線を切り取り、戻す | |
textord_fp_chopping | 固定ピッチチョッピングを行う | |
テキストオード_フォース_メイク_プロップ_ワーズ | すべての行に対して強制的な比例単語分割を行う | |
textord_chopper_test | Chopper がテストされています。 | |
wordrec_display_all_blobs | Blob を表示 | |
wordrec_blob_pause | 一時停止 | |
ストリーム_ファイルリスト | 標準入力からファイルリストをストリームする | |
デバッグファイル | tprintfの出力を送信するファイル | |
フォント名を分類する | UnknownFont(不明フォント) | トレーニングに使用されるデフォルトフォント名 |
ドキュメントタイトル | 出力ドキュメントのタイトル(hOCRおよびPDF 出力で使用) | |
ドット積 | 自動 | ドット積の計算に使用される関数 |
classify_cp_angle_pad_loose | クラス プルーナー アングル パッド ルーズ | |
中程度のパッド用角度分類 | クラス プルーナー アングル パッド ミディアム | |
分類する_cp_角度_パッド_タイト | 以下の内容を日本語に翻訳してください: クラス プルーナー アングル パッド タイト | |
classify_cp_end_pad_loose | .5 | クラス プルーナー エンド パッド ルース |
classify_cp_end_pad_medium (分類_cp_end_pad_medium) For improved readability and understanding, technical jargon is often maintained as it is in the target language. | .5 | クラスプルーナーエンドパッドミディアム |
classify_cp_end_pad_tight (クラシファイ_CP_エンド_パッド_タイト) | .5 | クラス プルーナー エンドパッド タイト |
classify_cp_side_pad_loose (クラスター CP サイド パッド ルーズ) | .5 | クラスプルーナーサイドパッドルース |
classify_cp_side_pad_medium | .2 | クラスプルーナー サイドパッド ミディアム |
分類_cp_横パッド_密 | .6 | プルーナーサイドパッドタイト |
`classify_pp_angle_pad` | プロト・プルーナー・アングル・パッド | |
classify_pp_end_pad クラス @code{classify_pp_end_pad} は、プラスチック部品のエンドパッドを分類するためのモデルを提供します。このモデルは、異なる物理的特性や用途に応じてエンドパッドを識別および分類することができます。 - @method{analyze} メソッドは、提供されたデータセットを評価し、そのデータに基づいて分類結果を返します。 - @method{train} メソッドは、新しいデータセットを使用してモデルをトレーニングし、モデルの精度を向上させます。 @code{classify_pp_end_pad} クラスは、エンドパッドの生産および品質管理のプロセスを効率化するために使用できます。 | .5 | プロト プルーン エンド パッド |
classify_pp_side_pad | .5 | プロトプルーナーサイドパッド |
classify_min_slope(クラスティファイ・ミニマム・スロープ) | .414214 | 線が水平と呼ばれる傾斜 |
classify_max_slope クラス分類最高勾配 | .41421 | 垂直と呼ばれる線がある傾斜 |
classify_norm_adj_midpoint(クラス化規範調整中央点) | 基準点を調整する | |
クラシファイ_ノーム_アジャスト_カール | カールを調整する法線 ... | |
pico_feature_lengthを分類する | .05 | ピコ特徴長 |
テキスト下線しきい値 (textord_underline_threshold) | .5 | 占有される幅の割合 |
エッジズ_チャイルドエリア | .5 | 子オブジェクトの輪郭の最小面積割合 |
エッジズ_ボックスエリア | .875 | ボックスの孫の最小面積割合 |
textord_fp_chop_snap | .5 | 頂点からの切り取り点までの最大距離 |
gapmap_big_gaps(ギャップマップ ビッグギャップス) | .75 | xht 乗数 |
textord_spline_shift_fraction | .02 | 四重行間隔の分数 |
textord_spline_outlier_fraction | .1 | 異常値の行間の割合 |
textord_skew_ile | .5 | ページの傾き補正のためのグラデーションのアイランド |
テキストド_ ^[英語] タイトル:IronPDF、IronOCR、IronXL、IronBarcode、IronQR、IronZip、IronPrint、IronWord、およびIronWebScraperに関連する技術内容の翻訳 顧客:アイロンソフトウェアジャパン株式会社 プロジェクトコード:ISJ-2023-スキーマ#0001 内容: - IronPDF、IronOCR、IronXL、IronBarcode、IronQR、IronZIP、IronWord、IronPrint、IronWebscraper などのアイロンソフトウェア製品に関連する技術内容を翻訳 - 技術用語、製品説明、マーケティング資料の精度と文脈の一貫性を保つ - 主にhttps://ironpdf.comおよびhttps://ironsoftware.comの情報を基に翻訳 専門用語: - タイトル:テキストのスキューラグ(textord_skew_lag) [日本語に翻訳] textord_skew_lag | .02 | 行の蓄積における歪みの遅延 |
textord_linespace_iqrlimit は日本語に訳す必要のない技術用語です。このままの形式が最適です。 | .2 | 行スペースのiQR/中央値の最大値 |
テキスト幅制限 | 行を作成するためのブロブの最大幅 | |
幅をテキストまたはカットする | .5 | 最大幅 (最大幅を超えると切り捨て) |
テキストオード_エクスパンション_ファクター | expand_rowsにおける行を拡張するための係数 | |
textord_overlap_x | .375 | 良好な重なりのための行間の割合 |
textord_minxh (テキストオーダー最小X高さ) | .25 | 最小xheightの行サイズの分数 |
テキストオード_ミニマム_ラインサイズ | .25 | 初期ラインサイズのためのBlobの高さ |
textord_excess_blobsize(テキストオーダー・エクセス・ブロブサイズ) | .3 | 行がこのサイズになる場合、新しい行が作成されます |
テキストオード_占有率_閾値 | .4 | 近隣の一部 |
textord_underline_width | 下線のためのline_sizeの倍数 | |
textord_min_blob_height_fraction (テキストオーダー最小ブロブ高さの割合) | .75 | xheight の統計に blob の上部を含めるために、最小 blob 高さ/トップ |
textord_xheight_mode_fraction | .4 | 最小積層高さでxheightを作成 |
`textord_ascheight_mode_fraction` | .08 | アッシュの高さを作るための最小の積み重ね高さ |
textord_descheight_mode_fraction | .08 | デスク 高 に 必要な最小スタック高さ |
textord_ascx_ratio_min | .25 | 最小キャップ/x高さ |
textord_ascx_ratio_max | .8 | マックスキャップ/xハイト |
textord_descx_ratio_min | .25 | Min desc/xheight (最小降下線/高さ) |
textord_descx_ratio_max | .6 | 最大減算/高さ |
テキストの内容を以下に日本語に翻訳してください: textord_xheight_error_margin ``` textord_xheight_error_margin ``` | .1 | 受け入れられているバリエーション |
oldbl_xhfract | .4 | 計算で許可される分数 |
oldbl_dot_error_size | .26 | ドットの最大アスペクト比 |
textord_oldbl_jumplimit | .15 | 新しいパーティションのためのX分割 |
pitsync_joined_edge | .75 | 塊の内側にある大きなブロックを切り取る |
ピットシンク_オフセット_フリーカット_フラクション | .25 | 無料バージョンにおけるカットの比率 |
textord_tabvector_vertical_gap_fraction | .5 | 縦書きテキストにおける垂直ギャップで許容される平均ブロブ幅の最大割合 |
textord_tabvector_vertical_box_ratio | .5 | ボックス一致の断片を縦線と宣言するために必要な割合 |
テキスト順投影スケール | .2 | ミッドカットのディングレート |
テキスト_バランス_ファクター | アンバランスな文字セルのための計算率 | |
textord_wordstats_smooth_factor (テキスト統計平滑化係数) | .05 | スムージングギャップ統計 |
テキスト幅平滑化係数 | .1 | 平滑化幅の統計 |
テキストの単語の幅パーセンタイル | .4 | スペース・エスト向けのblob幅一覧 |
textord_words_maxspace | 複数のxheight | |
textord_words_default_maxspace | .5 | 最大信頼できるサードスペース |
textord_words_default_minspace | .6 | x高さの分数 |
テキスト行部内の単語の最小間隔 | .3 | x高さの分数 |
textord_words_default_nonspace | .2 | x高さの分数 |
textord_words_initial_lower | .25 | 初期クラスタサイズの最大値 |
textord_words_initial_upper | .15 | 最小初期クラスタ間隔 |
textord_words_minlarge | .75 | 有効ギャップの必要割合 |
テキスト順序ワードピッチしきい値 | .04 | ピッチ同期しきい値 |
textord_words_def_fixed | .016 | 確定された固定値の閾値 |
テキスト: textord_words_def_prop 翻訳: textord_words_def_prop | .09 | 特定のプロパティのしきい値 |
テクスト順番_ピッチ_行類似性 | .08 | 同一性のためのxheightの分数 |
words_initial_lower 初期の小文字 | .5 | 初期クラスタサイズの最大値 |
以下の内容を日本語に翻訳してください: ## Iron Software 製品 ### IronPDF for .NET IronPDF for .NETは、.NET開発者向けの完全なPDF生成及び編集ライブラリです。このライブラリは、HTMLからPDFへの変換、PDFの結合、分割、フォームの操作、テキストの抽出など、多くの機能を提供します。 ### IronOCR IronOCRは、画像やスキャンされた文書からテキストを正確に抽出するためのOCR(光学文字認識)ライブラリです。この製品は、多言語対応と高い認識精度を誇り、.NET開発環境での使用に最適です。 ### IronXL IronXL for .NETを使用すると、開発者はExcelファイルをプログラムで作成、読み取り、操作、書き込みが可能です。高いパフォーマンスと互換性を持つこのライブラリは、データ変換やレポート生成に役立ちます。 ### IronBarcode IronBarcode for .NETは、バーコードの生成および読み取りを簡素化するライブラリです。QRコード、UPC、EAN、コード39、コード128など、様々なバーコードタイプに対応しています。 ### IronQR IronQR for .NETは、簡単かつ効率的にQRコードを生成および読み取る機能を提供します。このライブラリは、さまざまなデバイスとシステムとの統合が容易です。 ### IronZIP IronZIP for .NETは、ZIPアーカイブの作成、抽出、および操作をサポートする強力なライブラリです。大容量のファイル圧縮や複数ファイルの管理を簡素化します。 ### IronWord IronWord for .NETは、Word文書の生成、編集、および操作を可能にするライブラリです。このツールを使用すると、.NETアプリケーション内でWordファイルの読み書きをシームレスに行うことができます。 ### IronPrint IronPrint for .NETは、印刷機能をプログラムに統合するためのソリューションを提供します。このライブラリを使用することで、PDFやWord文書等のファイルを簡単に印刷できます。 ### IronWebscraper IronWebscraper for .NETは、ウェブサイトからデータを抽出するためのライブラリです。簡単に使えるAPIを提供し、高度なスクレイピングタスクに対応します。 ### Iron Suite Iron Suite for .NET Unlimited ライセンスを取得すると、これら全ての強力なIron Software製品へのアクセスが可能になり、開発の自由度が大いに向上します。 | .15 | 最小初期クラスタ間隔 |
非スペース_単語_デフォルト_プロパティ | .25 | x高さの分数 |
デフォルトの単語固定スペース | .75 | x高さの分数 |
デフォルトの固定制限の単語 | .6 | 許容サイズのばらつき |
textord_words_definite_spread | .3 | 非ファジー間隔領域 |
テキスト座標_スペースサイズ_RATIOFP | .8 | 非空白文字に対する最小空白比 |
テキストオード_スペースサイズ_比率プロップ | 非空白文字に対する最小空白比 | |
textord_fpiqr_ratio | .5 | ピッチ IQR/ギャップ IQR閾値 |
次の内容を日本語に翻訳してください: textord_max_pitch_iqr textord_max_pitch_iqr | .2 | ピッチにおけるXh部分のノイズ |
textord_fp_min_width | .5 | 適切なブロブの最小幅 |
textord_underline_offset | .1 | 無視する x の割合 |
ambigs_debug_level(曖昧デバッグレベル) | ユニチャー曖昧性のデバッグレベル | |
デバッグレベルを分類する | デバッグレベルの分類 | |
正規化メソッドを分類する | 正規化方法 | |
マッチャーデバッグレベル | マッチャー デバッグ レベル | |
デバッグフラグを一致させる | マッチャーデバッグフラグ | |
学習デバッグレベルを分類する | デバッグレベルの学習: | |
Matcher_Permanent_Classes_Min | 永久クラスの最小数 | |
matcher_min_examples_for_ これは技術的な単語の一部と思われるため、可能な範囲で翻訳を試みます。 matcher_min_examples_for_ このように翻訳されます。 prototyping | 信頼できる構成しきい値 | |
マッチャー_十分な_サンプル_ for_prototyping | あいまいさが確認されていなくても適応を可能にする | |
適応型プロトタイプのしきい値を分類する | 30 | 適応型アプローチにおける有効なプロトスの閾値:0-255 |
機能閾値を適応し、分類する | 30 | 適応的なしきい値のための優れた特徴は0から255の範囲内 |
クラス分類_クラス_プルーナー_閾値 | 29 | クラスプーナースレッショルド 0-255 |
classify_class_pruner_multiplier (分類クラスプルーナー乗数) | 5 | クラスプルーナーマルチプライヤー 0-255: |
依頼された以下の内容を日本語に翻訳しました: classify_cp_cutoff_strength クラス名などの高度に技術的、そして文脈的な意味を考慮すると、こちらの内容はそのまま保持するのが適切です。コードやクラス名は、多くの場合において翻訳せずに原文のまま扱うべきです。 ご提供いただいたその他の文脈があれば、さらに詳細に翻訳できます。 | クラスプルーナー・カットオフストレングス | |
整数分類器マッチャーマルチプライヤー | 整数マッチャーマルチプライヤー0-255: | |
dawg_debug_level | 一般的なデバッグ情報には1を設定し、詳細には2を設定し、すべてのデバッグメッセージを表示するには3を設定します | |
ハイフンデバッグレベル | 連結された単語のデバッグレベル。 | |
ストッパー_小文字_サイズ | 辞書の単語として処理されない単語のサイズ | |
ストッパーデバッグレベル | デバッグレベルのストッパー | |
tessedit_truncate_wordchoice_log | リスト内に維持する最大単語数 | |
max_permuter_attempts (この用語自体は技術的な名前で、日本語に直接的な翻訳が少し難しいため、このままで理解できるようにしました。) | 0000 | 置換の際に考慮される異なる文字選択肢の最大数。この制限は特にユーザーパターンが指定されている場合に役立ちます。なぜなら、あまりにも汎用的なパターンは、dawg検索が非常に多くのオプションを探索する結果となる可能性があるからです。 |
未分割ブロブの修復 | 切り取られていないブロブを修正する | |
chop_debug | デバッグを削除 | |
chop_split_length (チャップ スプリット レングス) | 0000 | 分割長さ |
同一距離を切り取り | 同じ距離 | |
chop_min_outline_points | 輪郭の最小ポイント数 | |
切り取り_シーム_スタック_サイズ | 50 | シームパイル内のシームの最大数 |
chop_inside_angle | -50 | 最小内側角度曲げ |
chop_min_outline_area(輪郭最小領域カット) | 000 | 最小アウトラインエリア |
中央最大幅切り取り | 小さな切り取ったブロブの幅がこれ以上であれば、中心に近くない切り取りについて気にしません。 | |
chop_x_y_weight (Note: This term is highly technical and seems to be a specific variable or function name. In technical documents, it's common to leave such identifiers in their original form to maintain clarity and accuracy for developers.) | 横幅 / 縦幅 長さ 重量 | |
wordrec_debug_level | ワードレック (wordrec) のデバッグレベル | |
wordrec_max_join_chunks | 関連付ける最大の破損部品数 | |
```テキスト segsearch_debug_level ``` | SegSearch デバッグレベル | |
セグメント検索_最大痛点 | 000 | キューに格納されるペインポイントの最大数 |
"segsearch_max_futile_classifications" | 各チャンクごとに、より適切な単語の選択に至らなかった痛点分類の最大数。 | |
言語モデルデバッグレベル | 言語モデルデバッグレベル | |
言語モデル n-gram オーダー | 文字n-gramモデルの最大次数 | |
以下の内容を日本語に翻訳してください: `language_model_viterbi_list_` 言語モデルビタービリスト max_num_prunable | 0 | プルーナブルの最大数 (それらのうち PrunablePath に該当するもの()は真です) entries in each viterbi list recorded in BLOB_CHOICEs |
言語モデルビタービリスト最大サイズ | 00 | BLOB_CHOICE に記録されるビタービリストの最大サイズ |
言語モデル_最小結合長 | 複合語の最小長 | |
wordrec_display_segmentations | 表示のセグメンテーション | |
tessedit_pageseg_mode(ページセグメンテーションモード) | ページ セグ モード: 0=osd のみ, 1=auto+osd, 2=auto のみ, 3=auto, 4=列, 5=ブロック縦, 6=ブロック, 7=行, 8=単語, 9=単語サークル, 10=文字, 11=散文テキスト, 12=散文テキスト+osd, 13=生行 (tesseract/publictypes.h の PageSegMode 列挙体の値) | |
tessedit_ocr_engine_mode | 使用するOCRエンジン(Tesseract、LSTM、または両方)を選択します。デフォルトでは、最も正確なものがロードされて実行されます。 | |
デーヴァナーガリー分割戦略 | ページ分割を実行する際に、デーヴァナーガリー文書のためにトップライン分割プロセスを使用するかどうか。 | |
OCR_Devanagari_分割ストラテジー | Devanagari文書のOCRを実行する際に、トップライン分割プロセスを使用するかどうか。 | |
bidi_debug | BiDiのデバッグレベル | |
`applybox_debug` | デバッグレベル | |
適用ボックス_ページ | 適用するページ番号 | |
tessedit_bigram_debug | バイグラム補正のデバッグ出力量。 | |
デバッグノイズ除去 | 小規模アウトラインの再割り当てのデバッグ | |
ノイズ_maxperblob | ブロブに適用する最大ダイアクリティカル | |
ノイズ最大許可単語数 | 6 | 単語に適用する最大ダイアクリティカルマーク数 |
debug_x_ht_level | デバッグを再評価する | |
初期アルファの最低品質要件 | 良い言葉のアルファベット | |
tessedit_tess_adaption_mode(テセリットテスアダプションモード) | 9 | tessの適応決定アルゴリズム |
multilang_debug_level (マルチラン_デバッグ_レベル) | マルチ言語デバッグ情報を印刷。 | |
パラグラフ_デバッグ_レベル | 段落デバッグ情報を印刷します。 | |
tessedit_preserve_min_wd_len (注:「tessedit_preserve_min_wd_len」は技術的な設定の名前で、翻訳しても意味が変わらないため、オリジナルの英語のまま使用されます) | この分を以下のように日本語に翻訳します: ``` Only preserve wds longer than this ``` 次の通り: `この後の単語は長いまま保持される` | |
crunch_rating_max (クランチ レーティング マックス) | 評価ごとの調整長さ | |
crunch_pot_indicators | 必要な潜在的インジケーターの数 | |
クランチ_リーブ_LC_ストリングス | 小文字が長く連続する単語を省略しないでください。 | |
crunch_leave_uc_strings | 小文字が長く連続する単語を省略しないでください。 | |
長い繰り返しを圧縮 | 長い反復を持つ単語を圧縮する | |
crunch_debug | 指示通り | |
ノイズ制限なしfixsp | 両側にノイズのないブロブはいくつありますか? | |
fixsp_done_mode | スペーシングが完了しているとみなされる要素とは | |
デバッグ_修正_スペース_レベル | コンテキスト修正スペースデバッグ | |
x_ht_acceptance_tolerance | フォントデータの外側におけるブロブのトップの最大許容偏差 | |
x_ht_min_change | 実際に試す前に xht の最小変更 | |
superscript_debug | サブおよび上付き文字補正のデバッグレベル | |
JPG品質 | JPEGの品質レベルを設定 | |
ユーザー定義DPI | 入力画像のDPIを指定する | |
試行する最小文字数 | 最小文字数をOSD中に試行するように指定する | |
疑わしいレベル | 9 | 容疑者マーカーレベル |
suspect_short_words | これより長い辞書の単語を疑わないでください | |
tessedit_reject_mode(テスエディットリジェクトモード) | 拒否アルゴリズム | |
tessedit_image_border | 画像の端の近くにあるRej blbs限界 | |
min_sane_x_ht_pixels (min_sane_x_ht_pixels) | この値より小さいか等しい、または大きいx-htを拒否します。 | |
tessedit_page_number | -1 | ページ番号が -1 の場合 -> すべてのページ、そうでない場合は処理する特定のページ |
tessedit_parallelize | 可能な場合は並列で実行する | |
lstm_choice_mode | hOCR出力に代替シンボル選択を含めることができます。有効な入力値は0、1、2です。初期値は0です。1を指定すると、タイムステップごとの代替シンボル選択が含まれます。2を指定すると、代替シンボル選択はラティスの代わりにCTCプロセスから抽出されます。選択は文字ごとにマッピングされます。 | |
LSTM選択反復 | lstm_choice_modeでビームサーチのカスケード反復回数を設定します。結果を得るには、lstm_choice_modeが0より大きい値に設定されている必要があります。 | |
tosp_debug_level (デバッグレベル) | デバッグデータ | |
tosp_enough_space_samples_for_median 充分なスペースサンプルの中央値 | 平均を使用すべきでしょうか | |
tosp_redo_kern_limit (トスプ_リド_カーン_リミット) | 行の再見積もりに必要なサンプル数 | |
サンプルが少ない場合 | つの大きなギャップを使用してテーブルとして処理するため、ギャップなしが必要です。 | |
tosp_short_row | 証明書を使用するためのいくつかの特定のスペースでギャップは不要です | |
tosp_sanity_method | How to avoid being silly 愚かにならない方法 | |
textord_max_noise_size | ノイズのピクセルサイズ | |
テキストオードベースラインデバッグ | 基準デバッグレベル | |
textord_noise_sizefraction | 最大値のサイズの比率 | |
textord_noise_translimit | 6 | 通常のブロブのトランジション |
textord_noise_sncount (テキストオードノイズ スノーカウント) | 行を保存するためのスーパー ノーム ブロブ | |
適応に曖昧さを使用 | 文字に適応するかどうかを決定するためにambigsを使用する | |
添付ファイルを許可 | ディバイザブルブロブチョッピングを使用してください。 | |
優先分割 | チョップするよりもブロブ分割を優先する | |
クラスファイ_イネーブル_ラーニング | 適応型分類器を有効にする | |
tess_cn_matching(テスチャン・マッチング) | 文字正規化一致 | |
tess_bn_matching | ベースライン正規化マッチング | |
分類_適応マッチャーを有効にする | 適応型分類器を有効にする | |
事前適応されたテンプレートを使用して分類する | 事前に適応された分類器テンプレートを使用する | |
分類保存アダプトされたテンプレート | 適応したテンプレートをファイルに保存 | |
適応型デバッガーの分類を有効にする | マッチデバッガーを有効にする | |
非線形正規化を分類 | 非線形ストローク密度正規化 | |
disable_character_fragments キャラクターフラグメントを無効にする | 分類器の結果に文字の断片を含めないでください。 | |
デバッグ文字フラグメントの分類 | フラグメントトレーニングのためのグラフィカルデバッグウィンドウを表示します | |
matcher_debug_separate_windows | マッチングをデバッグするには、2つの異なるウィンドウを使用します: 一つはプロトス用、もう一つはフィーチャー用です。 | |
classify_bln_numeric_mode (数値モードを分類) | 入力が数字[0-9]であると仮定します。 | |
load_system_dawg | システムワードをロードしています。 | |
load_freq_dawg (ロード_フリク_ドーグ) | 頻出単語の読み込み。 | |
ロード_アンビグ_ドーグ | 明確な「dawg」という単語を読み込みます。 | |
load_punc_dawg(符号化済補助記号辞書の読み込み) | 句読点パターンを使用してdawgを読み込みます。 | |
load_number_dawg | 番号パターンを使用して load dawg。 | |
load_bigram_dawg | 特定の単語ビグラムでdawgを読み込む。 | |
最初のuft8ステップのみを使用 | 与えられた文字列のログ確率を計算する際には、最初の UTF8 ステップのみを使用してください。 | |
stopper_no_acceptable_choices | AcceptableChoice()が常にfalseを返すようにします。すべてのセグメンテーションを調査する必要がある場合に役立ちます。 | |
非アルファベットスクリプトセグメント | アルファベット特有のトリックを使用しないでください。草書体や本来固定幅のスクリプトに対しては、traineddata設定ファイルでtrueに設定してください。 | |
save_doc_words ```plaintext ドキュメントの単語を保存 | ドキュメントの単語を保存 | |
マトリックス内のフラグメントをマージ | 評価マトリックス内の断片を結合し、結合後に削除してください | |
wordrec_enable_assoc | Associator Enable アソシエーター有効化 | |
force_word_assoc | 強制的にアソシエータを実行させ、enable_assocの設定に関係なく動作させます。これはCJK(中国語、日本語、韓国語)の場合に、コンポーネントのグループ化が必要な場合に使用されます。 | |
chop_enable (Note: "chop_enable"はソフトウェア開発に関連する専門用語のため、原文のままにしてあります。) | チョップ有効化 | |
垂直クリープを切断 | 垂直クリープ | |
新しいシームの積み重ねを切り取る | 新しいseam_pileを使用 | |
固定ピッチ文字セグメントを仮定する | 文字セグメンテーションに固定ピッチのヒューリスティクスを含める | |
wordrec_skip_no_truth_words | BlamerBundleに記録された真実がある単語に対してのみOCRを実行してください。 | |
wordrec_debug_blamer | 印刷ブレーマーデバッグメッセージ | |
wordrec_run_blamer | エラーの責任を設定しようとする | |
保存_alt_選択 | 切断およびセグメンテーション検索中に見つかった代替パスを保存 | |
言語モデルn-gramオン | 文字ngramモデルの使用をオン/オフにする | |
以下の内容を日本語に翻訳します。: language_model_ngram_use_ --- 以下が翻訳結果です。: 言語モデル n-gram 利用_ --- 技術用語や文脈の整合性を保ちながら翻訳しました。 only_first_uft8_step | 与えられた文字列のログ確率を計算する際には、最初の UTF8 ステップのみを使用してください。 | |
言語モデル n-gram スペース delimited_language | 以下の内容を日本語に翻訳してください: IronPDF helps you seamlessly create, edit, and extract content from PDFs in .NET and other programming languages such as Java, Python, and Node.js. With IronPDF, you can convert HTML to PDF, merge PDFs, and add watermarks. IronPDF ensures high-fidelity rendering and accurate text extraction, making it a valuable tool for developers needing effective PDF manipulation. ``` IronPDFは、.NETおよびJava、Python、Node.jsなどの他のプログラミング言語で、PDFの作成、編集、コンテンツの抽出をシームレスに支援します。IronPDFを使用すると、HTMLをPDFに変換したり、PDFをマージしたり、透かしを追加したりできます。IronPDFは高忠実度のレンダリングと正確なテキスト抽出を保証し、効果的なPDF操作を必要とする開発者にとって貴重なツールとなります。 | |
シグモイド確信度を使用した言語モデル | 確実性にはシグモイドスコアを使用 | |
tessedit_resegment_from_boxes(テスエディット リセグメント フロム ボックス) | ボックスファイルからセグメンテーションとラベリングを取得する | |
tessedit_resegment_from_line_boxes(ラインボックスから再セグメント化する機能) | 単語/行ボックスファイルから文字ボックスファイルへの変換 | |
tessedit_train_from_boxes (テスエディット トレイン フロム ボックス) | ボックス化された文字からトレーニングデータを生成する | |
tessedit_make_boxes_from_boxes (テッセディットメイクボックスフロムボックス) | ボックス化された文字からさらに多くのボックスを生成する | |
tessedit_train_line_recognizer | 入力を行ごとに分割し、ボックスがあれば再マッピングします | |
tessedit_dump_pageseg_images(ページセグメント画像のダンプ) | ページセグメンテーション中に生成される中間画像をダンプする | |
tessedit_do_invert | `LSTMRecognizeWord`で画像を反転してみてください | |
tessedit_ambigs_training | 曖昧さのためのトレーニングを実行する | |
適応デバッグーツール | 適応のためのデバッグ情報を生成および印刷 | |
applybox_learn_chars_and_char_frags_mode(文字と文字フラグメントを学習するモード) | 特殊な低露出モードで行われるように、文字の断片と未分割の文字の両方を学習します。 | |
applybox_learn_ngrams_mode (この文は技術用語およびコードの一部であり、翻訳よりそのまま保持するのが適切です) | 各バウンディングボックスにはngramが含まれていると仮定します。アウトラインが水平に重なるngramsのみを学習します。 | |
tessedit_display_outwords | 出力ワードを描画 | |
tessedit_dump_choices | 文字選択をダンプ | |
tessedit_timing_debug (テッセディット タイミング デバッグ) | 印刷タイミング統計 | |
tessedit_fix_fuzzy_spaces | 曖昧なスペースを改善する | |
tessedit_unrej_any_wd | 言葉のもっともらしさにこだわらないでください | |
tessedit_fix_hyphens(テスエディット_フィックス_ハイフンズ) | 二重ハイフンを圧縮しますか? | |
tessedit_enable_doc_dict (この技術用語は直接翻訳せずオリジナルのままにしてください) | ドキュメント辞書に単語を追加 | |
tessedit_debug_fonts(フォントデバッグ機能) | 文字ごとのフォント情報を出力 | |
`tessedit_debug_block_rejection(テスエディット_デバッグ_ブロック_リジェクション) | ブロックおよび行の統計 | |
tessedit_enable_bigram_correction | 単語ビグラム辞書に基づく修正を有効にする。 | |
tessedit_enable_dict_correction | 辞書に基づく単語の補正を有効にする。 | |
ノイズ除去を有効にする | 小さなアウトラインがレイアウト解析を混乱させる場合、それらを削除し、条件に応じて再割り当てすることで、ダイアクリティカルマークとノイズを識別します。 | |
tessedit_minimal_rej_pass1 | パス1出力に対して最小限の拒否を行う | |
tessedit_test_adaption (この技術用語は翻訳せず、元のままにしておくことが適切です。この用語は多くのエンジニアにそのまま理解されます。) | テスト適用基準 | |
テスト ポイント | ポイントのテスト | |
段落テキストに基づく | テキスト認識後の段落検出を実行(より正確) | |
lstm_use_matrix(LSTM使用行列) | 評価行列/ビームサーチとLSTMを利用する | |
tessedit_good_quality_unrej | 良好なドキュメントの拒否を減らす | |
tessedit_use_reject_spaces | 空白を拒否しますか? | |
tessedit_preserve_blk_rej_perfect_wds | 部分的に拒否された単語のみをブロック拒否 | |
tessedit_preserve_row_rej_perfect_wds | 行の拒否で部分的に拒否されたワードのみ | |
tessedit_dont_blkrej_good_wds | セグメンテーション品質メトリックを使用 | |
tessedit_dont_rowrej_good_wds | セグメンテーション品質メトリックを使用 | |
tessedit_row_rej_good_docs | 良いドキュメントに行ごとに拒否を適用する | |
tessedit_reject_bad_qual_wds (注:この部分は技術用語であり、翻訳しませんが、意味を説明します。「tessedit_reject_bad_qual_wds」はTesseract OCRの設定に関連するパラメータで、低品質の単語を拒否することを設定します。) | すべての低品質のWDSを拒否する | |
tessedit_debug_doc_rejection | ページ統計 | |
テセディット_デバッグ_クオリティ_メトリクス | デバッグファイルにデータを出力 | |
bland_unrej | チェックなしで可能性を解き放つ | |
UNLV_TILDE_CRUNCHING | チルダクラッシュのために不適切な単語にマークを付ける | |
hocr_font_info ホックフォント情報 | hocr出力にフォント情報を追加 | |
hocr_char_boxes(キャラクターボックス) | hOCR出力に各文字の座標を追加 | |
crunch_early_merge_tess_fails クラウンチ_アーリー_マージ_テス_フェイルズ | 「Before word crunch?」を日本語に翻訳すると以下のようになります: 単語の圧縮前? | |
クランチ_アーリー_コンバート_バッド_UNLV_CHS | ~^を早く取り出す? | |
クランチ_テリブル_ガーベッジ | 指示通り | |
crunch_leave_ok_strings (Note: This appears to be a technical term or identifier wherein maintaining the original form is crucial for accurate technical understanding and functionality within any code or software context.) | 機密文字列には触れないでください | |
クランチ_accept_ok | OKStringの受理性を使用する | |
crunch_leave_accept_strings | 文字列を逆参照しないでください | |
数値を含むcrunchです | フィドルアルファフィギュア | |
tessedit_prefer_joined_punct | 句読点接続を報酬 | |
tessedit_write_block_separators(ブロック区切り文字を書き込む) | 出力にブロックセパレーターを書き込む | |
tessedit_write_rep_codes | 反復文字コードを書き込む | |
tessedit_write_unlv | .unlv出力ファイルを書き込み | |
tessedit_create_txt | .txt出力ファイルを書く | |
tessedit_create_hocr | .html hOCR出力ファイルを作成 | |
tessedit_create_alto | .xml ALTOファイルを作成 | |
tessedit_create_lstmbox (テスエディット・クリエイト・エルエスティエムボックス) | LSTMトレーニングのために .boxファイルを書き出す | |
tessedit_create_tsv | .tsv出力ファイルを作成 | |
tessedit_create_wordstrbox | WordStr形式の.box出力ファイルを作成 | |
tessedit_create_pdf | .pdf出力ファイルを書き込む | |
テキストのみのPDF | 単一の見えないテキストレイヤーのみでPDFを作成 | |
suspect_constrain_1Il | UNLV 1Il文字は拒否されました | |
tessedit_minimal_rejection(テセディット・ミニマル・リジェクション) | テス失敗のみ拒否 | |
テスエディットゼロリジェクション | 何も拒否しない | |
tessedit_word_for_word | 出力が各WERDごとに正確に1つの単語を持つようにする | |
tessedit_zero_kelvin_rejection (テスエディットゼロケルビンリジェクション) | 何も拒否しないでください | |
tessedit_rejection_debug | 適応デバッグ | |
tessedit_flip_0O | 文脈における0O O0の逆転 | |
ドキュメントが提供されていませんので、短いメッセージや単語では翻訳が難しいかもしれません。この文脈では意味が不確かであるため、提供されたフレーズの個々の単語を変換するよりも、もう一度詳細な内容を明示していただけると幸いです。 | 1l コンフィギュレーターで DOC dawg を使用してください。 | |
rej_1Il_use_dict_word | "Use dictword test"を日本語に翻訳すると、以下のようになります: 「dictword testを使用」 この翻訳では、技術用語「dictword test」をそのまま使用し、コンテキストに忠実に翻訳しました。 | |
rej_1Il_trust_permuter_type | 再確認しないでください | |
rej_use_tess_accepted(テッサー機能が受け入れられています) | 個別リジェクト制御 | |
rej_use_tess_blanks | 個別リジェクト制御 | |
良好な権限を使用 | 個別リジェクト制御 | |
以下の内容を日本語に翻訳してください: rej_use_sensible_wd | パーミュートチェッカーを拡張する | |
英数字の順列のrej_alphas | パーミュートチェッカーを拡張する | |
tessedit_create_boxfile (テッセディット・クリエイト・ボックスファイル) | ボックス付きの出力テキスト | |
tessedit_write_images | IPEから画像をキャプチャする | |
対話型表示モード | インタラクティブに実行しますか? | |
tessedit_override_permuter テクニカルタームや製品名を翻訳せずにそのまま表示する指示を受けています。このため、この用語はそのまま「tessedit_override_permuter」として表示されます。 | dict_word によると | |
tessedit_use_primary_params_model | 多言語モードでは、主言語のパラメーターモデルを使用します | |
textord_tabfind_show_vlines | デバッグラインの検出 | |
CJKフォントモデルを使用する | CJK 固定ピッチモデルを使用 | |
poly_allow_detailed_fx ポリ_allow_detailed_fx | 機能抽出器が元のアウトラインを見ることを許可します | |
tessedit_init_config_only | 構成ファイルでのみ初期化します。インスタンスがOCRに使用されず、レイアウト分析のみに使用される場合に便利です。 | |
textord_equation_detect (テキスト順方程式検出) | 式検出器をオンにする | |
テキスト: `textord_tabfind_vertical_text 翻訳: `textord_tabfind_vertical_text | 垂直検出を有効にする | |
textord_tabfind_force_vertical_text(テキスト順タブ検出強制垂直テキスト) | 縦書きページモードを強制使用 | |
インターワードスペースを保持 | 複数の単語間スペースを保持する | |
pageseg_apply_music_mask (楽譜マスクを適用する) | 楽譜を検出し、交差する要素を削除します。 | |
`textord_single_height_mode` This is a technical term and does not have a direct translation into Japanese. It is best to keep it as is: `textord_single_height_mode`. | スクリプトにはxheightがないため、シングルモードを使用してください。 | |
tosp_old_to_method (原文の「tosp_old_to_method」をそのまま理解できる日本語訳がないため、この部分は元のままにします。) | スペース統計はプレチョッピングを使用していますか? | |
tosp_old_to_constrain_sp_kn | old_to_methodのインターワードギャップおよびイントラーワードギャップの相対値を制約します。 | |
tosp_only_use_prop_rows | 固定ピッチ行を使用するためのブロック統計? | |
句読点で単語の改行を強制する | 句読点で単語を強制的に区切り、非スペース区切りの言語で長い行を分割する | |
tosp_use_pre_chopping | スペース統計はプレチョッピングを使用していますか? | |
バグ修正のためのtosp_old | 古いコードの疑わしいバグを修正 | |
tosp_block_use_cert_spaces | 明らかなスペースのみ説明する | |
tosp_row_use_cert_spaces | 明らかなスペースのみ説明する | |
tosp_narrow_blobs_not_cert | 明らかなスペースのみ説明する | |
tosp_row_use_cert_spaces1 | 明らかなスペースのみ説明する | |
`tosp_recovery_isolated_row_stats` | 不適切な証明書スペースがある場合にのみ単独で行を使用します。 | |
カーニング用に小さなギャップのみを許可 | より良い推測 | |
tosp_all_flips_fuzzy | 任意のフリップをコンテキストに渡す? | |
tosp_fuzzy_limit_all | 表にのみ制限をかけないようにする kn->sp ファジー制限 | |
tosp_stats_use_xht_gaps (この専門用語は特定の技術コンテキストで一般的な翻訳がないため、そのまま保持されます) | wdの改行のためにxhtの間隔内で使用する | |
tosp_use_xht_gaps | wdの改行のためにxhtの間隔内で使用する | |
tosp_only_use_xht_gaps のみ使用 | xhtギャップ内でのみ使用し、wdブレークのために使用します。 | |
tosp_rule_9_test_punct | 句読点の横にスペースを入れないでください。 | |
tosp_flip_fuzz_kn_to_sp | デフォルトのフリップ | |
tosp_flip_fuzz_sp_to_kn | デフォルトのフリップ | |
tosp_improve_thresh(しきい値改良) | 改善ヒューリスティックを有効にする | |
テキストの内容を日本語に翻訳します: textord_no_rejects textord_no_rejects | ノイズブロブを削除しないでください。 | |
ブロブを表示 | 未整理のブロブを表示 | |
textord_show_boxes | 未整理のブロブを表示 | |
textord_noise_rejwords(テキストオルド・ノイズ・レジワード) | ノイズのような単語を拒否 | |
テキスト行のノイズ拒否行 | ノイズのような行を拒否する | |
textord_noise_debug | デバッグ行ガベージ検出器 | |
classify_learn_debug_str (学習デバッグ文字列の分類) | デバッグ学習のためのクラスstr | |
ユーザー・ワード・ファイル | ユーザー提供の単語のファイル名。 | |
ユーザー・ワード・サフィックス | tessdataにあるユーザー提供の単語の接尾辞。 | |
ユーザーパターンファイル | ユーザーが提供したパターンのファイル名。 | |
ユーザーパターン接尾辞 | tessdataにあるユーザー提供パターンの接尾辞。 | |
`output_ambig_words_file (曖昧な単語の出力ファイル)` | 辞書で見つかった曖昧性の出力ファイル | |
デバッグする単語 | 標準出力に停止デバッグ情報を印刷するワード | |
tessedit_char_blacklist (テスエディット_キャラ_ブラックリスト) | 認識しない文字のブラックリスト | |
tessedit_char_whitelist | 認識する文字のホワイトリスト | |
tessedit_char_unblacklist | tessedit_char_blacklistを上書きする文字のリスト | |
tessedit_write_params_to_file(テスエディット_ライト_パラメータズ_トゥ_ファイル) | 指定されたファイルにすべてのパラメーターを書き込みます。 | |
applybox_exposure_pattern(適用ボックス露光パターン) | 以下の内容を日本語に翻訳します: .exp | 露出値は画像ファイル名のパターンに従います。画像ファイルの名前は [lang].[fontname].exp [num].tif という形式になることが期待されます。 |
先導句読点 (')] | 先行句読点 | |
chs_trailing_punct1 | ).,;:?! | 末尾の句読点 |
chs_trailing_punct2 )'`" | 末尾の句読点 | |
アウトライン_奇数 | 「%」 | 非標準のアウトライン数 |
アウトライン_2 ij!?%":; | 非標準のアウトライン数 | |
数字の句読点 | ., | 数字内に期待される句読点 |
認識されない文字 | 識別されていないブロブの出力文字 | |
ok_repeated_ch_non_alphanum_wds | -?*= | NNの許可を解除する |
conflict_set_I_l_1 (注: 元の用語やプログラムの名前はそのままにするのが望ましいため、この特定の用語は翻訳されていません。) | イル1 []. | Il1 conflict set(Il1コンフリクトセット) |
ファイルタイプ | .tif | ファイル名拡張子 |
tessedit_load_sublangs | この言語と一緒にロードする言語のリスト | |
ページ区切り | ページ区切り(デフォルトはフォームフィード制御文字) | |
クラスイファイ・キャラ・ノーム・レンジ (classify_char_norm_range) | .2 | 文字正規化範囲 |
classify_max_rating_ratio(最大評価比率の分類) | .5 | 分類器評価間の拒否率 |
最大確実度マージンで分類 | .5 | 分類器の確実性の違いを拒否 |
matcher_good_threshold | .125 | 良好 (0-1) |
リライアブル_アダプティブ_リザルト_マッチャー | Great Match (0-1) | |
matcher_perfect_threshold | .02 | パーフェクトマッチ (0-1) |
マッチャー_バッド_マッチ_パッド | .15 | バッドマッチパッド (0-1) |
一致評価マージン | .1 | 新しいテンプレートのマージン(0-1) |
平均ノイズサイズマッチャー | 2 | 平均ノイズブロブの長さ |
matcher_clustering_max_angle_delta(最大角度差クラスタリングマッチャー) | .015 | プロトタイプクラスタリングの最大角度デルタ |
誤分類_ノイズ_ペナルティ | 期待されるテキストラインの位置から垂直方向に外れた非英数字に適用されるペナルティ | |
評価尺度 | .5 | 評価スケーリングファクター |
確実性スケール | 0 | 確実性スケーリングファクター |
tessedit_class_miss_scale | .00390625 | 使用されていない機能のスケールファクター |
classify_adapted_pruning_factor を日本語に翻訳する場合、専門用語や構文の文脈をなるべくそのまま活かして次のようになります: classify_adapted_pruning_factor (「アダプテッド・プルーニング・ファクターを分類」といった意訳も考えられますが、技術用語の一貫性を保つためにそのままにしてあります。) | .5 | 最良の結果よりもはるかに劣る適応結果を削除する |
適応型プルーニング閾値を分類する | -1 | 分類適応剪定係数が始まる閾値 |
文字断片を分類する (classify_character_fragments_) garbage_certainty_threshold | -3 | トレーニングおよび適応から完全な文字ではない断片を除外する |
speckle_large_max_size (スペックル_ラージ_マックス_サイズ) | .3 | 最大ラージスペックルサイズ |
スぺックル評価ペナルティ | 最低評価に対するノイズによる加算ペナルティ | |
下付き文字のx高さペナルティ | .125 | 複数の単語に下付き文字や上付き文字がある場合、加点ペナルティ(0.1=10%)が追加されますが、それ以外は問題ありません。 |
xheight_penalty_inconsistent (xheightの不一致のペナルティ) | .25 | xheightが一貫していない場合、スコアペナルティ(0.1 = 10%)が追加されます。 |
頻出単語のセグメントペナルティ辞書 | 与えられた言語で、適切な大文字使用と頻繁に使用される単語の一致に対するスコア乗数 (低いほど良い)。 | |
セグメントペナルティ辞書ケースOK | .1 | 良いケースを持つ単語の一致に対するスコア乗数(小さい方が良い)。 |
セグメント_ペナルティ_ディクショナリ_ケース_バッド | .3125 | 単語の一致におけるデフォルトのスコア乗数です。これは大文字と小文字の問題があるかもしれません(低いほど良い)。 |
非単語セグメントペナルティ辞書 | .25 | 辞書の単語と一致しないグリフフラグメントセグメンテーションのスコア乗数(低いほど良い)。 |
セグメント_ペナルティ_ガベージ | .5 | 辞書に含まれておらず、一般的にゴミのように見える不適切な大文字小文字の文字列のスコア乗数(低い方が良い)。 |
確実性スケール | 確実性スケーリングファクター | |
ストッパー_ノンディクト_確信_ベース | -2.5 | 非辞書単語の確実性しきい値 |
stopper_phase2_certainty_rejection_offset ストッパー・フェーズ2・確実性・拒絶・オフセット | 確実性オフセットを拒否する | |
ストッパー_確実性_パー_キャラ | -0.5 | 各辞書キャラクターに対して、小さい単語サイズを超える確実性を追加します。 |
許容可能な文字の悪さのストッパー | 単語の最大確度変動許容範囲(シグマ内) | |
保留ドキュメント閾値 | ペンディング辞書を使用する際の最悪の確定事項 | |
doc_dict_certainty_threshold (信頼度閾値) | -2.25 | ドキュメント辞書に挿入できる単語に関する最悪の確実性 |
tessedit_certainty_threshold | -2.25 | 良いBLOB制限 |
chop_split_dist_knob チョップスプリットディストノブ | .5 | 分割長さの調整 |
重なり除去ノブ | .9 | 分割オーバーラップ調整 |
中心ノブを切断 | .15 | センター調整の分割 |
chop_sharpness_knobは日本語に直接翻訳しにくいですが、コンテキストに応じて「シャープネス調整ノブ」や「鋭さ調整ノブ」などが適切です。 | .06 | シャープネス調整の分割 |
幅変更コントロールノブ | 幅変更調整 | |
分割可能 | 00 | OK分割制限 |
chop_good_split | 0 | 良好な分割制限 |
segsearch_max_char_wh_ratio (セグサーチ_マックス_キャラ_ワイド_ハイ_レシオ) | 最大文字幅対高さ比 |