Définition des variables de configuration de Tesseract dans C# ;
L'interface IronOCR Tesseract permet un contrôle total des variables de configuration de Tesseract par l'intermédiaire de la fonction
Classe IronOCR.TesseractConfiguration
Exemple de code de configuration de Tesseract
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.English;
Ocr.Configuration.ReadBarCodes = false;
Ocr.Configuration.BlackListCharacters = "`ë
^";
Ocr.Configuration.RenderSearchablePdf = true;
Ocr.Configuration.RenderHocr = true;
Ocr.Configuration.PageSegmentationMode = TesseractPageSegmentationMode.AutoOsd;
Ocr.Configuration.TesseractVariables ["tessedit_parallelize"] = false;
using (var Input = new OcrInput(@"images\image.png"))
{
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.English;
Ocr.Configuration.ReadBarCodes = false;
Ocr.Configuration.BlackListCharacters = "`ë
^";
Ocr.Configuration.RenderSearchablePdf = true;
Ocr.Configuration.RenderHocr = true;
Ocr.Configuration.PageSegmentationMode = TesseractPageSegmentationMode.AutoOsd;
Ocr.Configuration.TesseractVariables ["tessedit_parallelize"] = false;
using (var Input = new OcrInput(@"images\image.png"))
{
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.English
Ocr.Configuration.ReadBarCodes = False
Ocr.Configuration.BlackListCharacters = "`ë ^"
Ocr.Configuration.RenderSearchablePdf = True
Ocr.Configuration.RenderHocr = True
Ocr.Configuration.PageSegmentationMode = TesseractPageSegmentationMode.AutoOsd
Ocr.Configuration.TesseractVariables ("tessedit_parallelize") = False
Using Input = New OcrInput("images\image.png")
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
Liste de toutes les variables de configuration de Tesseract
Elles peuvent être définies en utilisant IronTesseract.Configuration.TesseractVariables ["clé"] = valeur;
Variable de configuration du Tesseract | Défaut | Signification |
---|---|---|
classifier_num_cp_niveaux | 3 | Nombre de niveaux d'élagage de classe |
textord_debug_tabfind | 0 | Onglet Débogage |
textord_debug_bugs | 0 | Activer les sorties relatives aux bogues dans la recherche d'onglets |
textord_testregion_left | -1 | Bord gauche du rectangle de rapport de débogage |
textord_testregion_top | -1 | Bord supérieur du rectangle de rapport de débogage |
textord_testregion_droite | 2147483647 | Bord droit du rectangle de débogage |
textord_testregion_bottom | 2147483647 | Bord inférieur du rectangle de débogage |
textord_tabfind_show_partitions | 0 | Afficher les limites de la partition, attendre si >1 |
devanagari_split_debuglevel | 0 | Niveau de débogage pour le processus split shiro-rekha. |
edges_max_children_per_outline | 10 | Nombre maximal d'enfants à l'intérieur d'un contour de caractère |
couches_max_enfants_arêtes | 5 | Nombre maximal de couches d'enfants imbriqués à l'intérieur d'un contour de caractère |
bords_enfants_par_petit-enfant | 10 | Rapport d'importance pour les contours du mandrin |
limite_compte_des_enfants_des_arêtes | 45 | Nombre maximum de trous automobilerisés dans le blob |
bords_min_nonhole | 12 | Pixels minimums pour les caractères potentiels dans la boîte |
rapport_patharea_bords | 40 | Lentille maximale/surface pour un contour d'enfant acceptable |
textord_fp_chop_error | 2 | Courbure maximale automobilerisée des cellules de la hache |
textord_tabfind_show_images | 0 | Afficher les taches d'image |
textord_skewsmooth_offset | 4 | Pour le facteur lisse |
textord_skewsmooth_offset2 | 1 | Pour le facteur lisse |
textord_test_x | -2147483647 | coordonnateur du pt de test |
textord_test_y | -2147483647 | coordonnateur du pt de test |
textord_min_blobs_in_row | 4 | Min blobs before gradient counted |
textord_spline_minblobs | 8 | Min blobs dans chaque segment de spline |
texteord_spline_medianwin | 6 | Taille de la fenêtre pour la segmentation spline |
textord_max_blob_overlaps | 4 | Nombre maximum de blobs qu'un big blob peut chevaucher |
textord_min_xheight | 10 | Pixel crédible minimum xhauteur |
essais en ligne textord_lms_line | 12 | Nombre de lignes à effectuer |
compte des pertes de l'ancienbl_holed_losscount | 10 | Nombre maximal de lignes perdues avant l'utilisation de la ligne de repli |
pitsync_linear_version | 6 | Utiliser un nouvel algorithme rapide |
pitsync_fake_depth | 1 | Génération maximale de fausses avances |
textord_tabfind_show_strokewidths | 0 | Afficher l'épaisseur des traits |
textord_dotmatrix_gap | 3 | Écart maximal entre les pixels pour un pas de pixel brisé |
textord_debug_block | 0 | Bloc à déboguer sur |
gamme_de_pitch_du_texte | 2 | Essai de portée maximale sur le terrain |
mots-clés_veto_power | 5 | Rangs nécessaires pour mettre un veto en minorité |
équationdetect_save_bi_image | 0 | Sauvegarde de l'image d'entrée |
equationdetect_save_spt_image | 0 | Enregistrer l'image d'un caractère spécial |
equationdetect_save_seed_image | 0 | Enregistrer l'image de départ |
equationdetect_save_merged_image | 0 | Enregistrer l'image fusionnée |
poly_debug | 0 | Déboguer l'ancien poly |
poly_large_objets_mieux | 1 | Plus d'informations précises sur des sujets vastes |
wordrec_display_splits | 0 | Afficher les fractionnements |
textord_debug_printable | 0 | Rendre les fenêtres de débogage imprimables |
textord_space_size_is_variable | 0 | Si c'est le cas, les espaces délimitant les mots sont supposés avoir une largeur variable, même si les caractères ont une hauteur fixe. |
textord_tabfind_show_initial_partitions | 0 | Afficher les limites de la partition |
textord_tabfind_show_reject_blobs | 0 | Afficher les blobs rejetés comme du bruit |
textord_tabfind_show_columns | 0 | Afficher les limites des colonnes |
textord_tabfind_show_blocks | 0 | Afficher les limites du bloc final |
textord_tabfind_find_tables | 1 | détection de la table d'exécution |
devanagari_split_debugimage | 0 | Création ou non d'une image de débogage pour le processus de fractionnement shiro-rekha. |
textord_show_fixed_cuts | 0 | Tracer les limites des cellules à pas fixe |
arêtes_utilisation_nouvelle_complexité_des_sorties_de_sorties_de_sorties | 0 | Utiliser le nouveau module de complexité des contours |
edges_debug | 0 | activer le débogage pour ce module |
bords_enfants_fixe | 0 | Supprimez les parents de type "boxy" des enfants de type "char" |
gapmap_debug | 0 | Indiquer les blocs qui ont des tables |
gapmap_use_ends | 0 | Utiliser de grands espaces au début et à la fin des lignes |
gapmap_no_isolated_quanta | 0 | Veiller à ce que les lacunes ne soient pas inférieures à 2quanta de large |
textord_heavy_nr | 0 | Supprimer énergiquement le bruit |
textord_show_initial_rows | 0 | Affichage de l'accumulation des lignes |
textord_show_parallel_rows | 0 | Afficher les lignes en corrélation avec la page |
textord_show_expanded_rows | 0 | Afficher les lignes après l'expansion |
textord_show_final_rows | 0 | Afficher les rangs après l'ajustement final |
textord_show_final_blobs | 0 | Afficher les limites du blob après le pré-assemblage |
textord_test_paysage | 0 | Les tests se réfèrent à la terre/au port |
textord_parallel_baselines | 1 | Forcer les lignes de base parallèles |
lignes de base droites | 0 | Forcer les lignes de base droites |
textord_old_baselines | 1 | Utiliser l'ancien algorithme de base |
textord_old_xheight | 0 | Utiliser l'ancien algorithme xheight |
textord_fix_xheight_bug | 1 | Utiliser une ligne de base spline |
textord_fix_makerow_bug | 1 | Empêcher les lignes de base multiples |
textord_debug_xheights | 0 | Test des algorithmes xheight |
textord_biased_skewcalc | 1 | Estimation de l'asymétrie du biais en fonction de la longueur de la ligne |
textord_interpolating_skew | 1 | Interpoler à travers les lacunes |
textord_new_initial_xheight | 1 | Utiliser le mécanisme de test xheight |
textord_debug_blob | 0 | Imprimer les informations sur le blob de test |
textord_really_old_xheight | 0 | Utiliser l'original de wiseowl xheight |
textord_oldbl_debug | 0 | Déboguer l'ancienne génération de lignes de base |
textord_debug_baselines | 0 | Génération d'une ligne de base de débogage |
textord_oldbl_paradef | 1 | Utiliser le mécanisme par défaut |
textord_oldbl_split_splines | 1 | Cannelures à gradins fendus |
textord_oldbl_merge_parts | 1 | Fusionner des partitions suspectes |
oldbl_corrfix | 1 | Améliorer la corrélation des hauteurs |
oldbl_xhfix | 0 | Correction d'un bug dans le seuil des modes pour les hauteurs x |
textord_ocropus_mode | 0 | Établir des lignes de base pour ocropus |
textord_tabfind_only_strokewidths | 0 | Exécuter uniquement les largeurs de trait |
textord_tabfind_show_initialtabs | 0 | Afficher les candidats aux onglets |
textord_tabfind_show_finaltabs | 0 | Afficher les vecteurs des onglets |
textord_show_tables | 0 | Afficher les régions du tableau |
textord_tablefind_show_mark | 0 | Tableau de débogage marquant les étapes en détail |
textord_tablefind_show_stats | 0 | Afficher les statistiques de la page utilisées dans la recherche de tableaux |
textord_tablefind_recognize_tables | 0 | Active l'outil de reconnaissance des tableaux pour la mise en page et le filtrage des tableaux. |
textord_all_prop | 0 | Tous les documents sont des textes proportionnels |
textord_debug_pitch_test | 0 | Débogage sur le test du pas fixe |
textord_disable_pitch_test | 0 | Désactiver l'algorithme de pas fixe dp |
textord_fast_pitch_test | 0 | Faire un algorithme de tangage encore plus rapide |
textord_debug_pitch_metric | 0 | Rédiger des documents métriques complets |
textord_show_row_cuts | 0 | Tracer des coupes au niveau des rangs |
textord_show_page_cuts | 0 | Effectuer des coupes au niveau de la page |
textord_pitch_cheat | 0 | Utiliser la bonne réponse pour fixe/prop |
textord_blockndoc_fixed | 0 | Tentative d'un document/bloc entier à hauteur fixe |
textord_show_initial_words | 0 | Afficher des mots séparés |
textord_show_new_words | 0 | Afficher des mots séparés |
textord_show_fixed_words | 0 | Affichage de mots forcés à hauteur fixe |
textord_blocksall_fixed | 0 | Se plaindre des blocs d'accessoires |
textord_blocksall_prop | 0 | Se plaindre des blocs à hauteur fixe |
textord_blocksall_testing | 0 | Déchargez les statistiques en vous lamentant |
mode_test_textord | 0 | Effectuer le test de courant |
mots_de_pitch_échellemots_grands | 0 | Scores sur les grands mots |
textord_restore_underlines | 1 | Découper les soulignements et les remettre en place |
textord_fp_chopping | 1 | Effectuer un hachage à hauteur fixe |
textord_force_make_prop_words | 0 | Forcer la segmentation proportionnelle des mots sur toutes les lignes |
textord_chopper_test | 0 | L'hélico est en cours de test. |
wordrec_display_all_blobs | 0 | Afficher les blobs |
wordrec_blob_pause | 0 | Pause du Blob |
liste_de_fichiers_de_flux | 0 | Stream d'une liste de fichiers à partir de stdin |
fichier_débogage | Fichier vers lequel envoyer la sortie tprintf | |
classer_le_nom_de_la_police_de_polices_de_polices_de_polices | Police inconnue | Défaut font name to be used in training |
titre du document | Titre du document de sortie (utilisé pour hOCR et la sortie PDF) | |
pointproduit | automobile | Fonction utilisée pour le calcul du produit de points |
classifier_cp_angle_pad_loose | 45 | Class Pruner Angle Pad Loose |
classifier_cp_angle_pad_medium | 20 | Classe Tampon d'élagage à angle moyen |
classifier_cp_angle_pad_tight | 10 | CLass Pruner Angle Pad Tight |
classifier_cp_end_pad_loose | 0.5 | Classe Tampon d'élagage en vrac |
classifier_cp_end_pad_medium | 0.5 | Classe Tampon d'élagage moyen |
classifier_cp_end_pad_tight | 0.5 | Class Pruner End Pad Tight |
classifier_cp_side_pad_loose | 2.5 | Classe Tampon latéral d'élagueur Détaché |
classifier_cp_side_pad_medium | 1.2 | Class Pruner Side Pad Medium |
classifier_cp_side_pad_tight | 0.6 | Class Pruner Side Pad Tight |
classifier_pp_angle_pad | 45 | Plaque d'angle pour élagueuse Proto |
classifier_pp_end_pad | 0.5 | Proto Prune End Pad |
classifier_pp_side_pad | 2.5 | Coussinet latéral pour élagueuse Proto |
classer_pente_min | 0.414214 | Pente en dessous de laquelle les lignes sont dites horizontales |
classer_max_pente | 2.41421 | Pente au-dessus de laquelle les lignes sont dites verticales |
classifier_norm_adj_midpoint | 32 | Ajuster le point médian de la norme ... |
classifier_norm_adj_curl | 2 | La norme permet d'ajuster l'enroulement ... |
longueur_de_la_caractéristique_de_la_classification | 0.05 | Pico Feature Length |
seuil de soulignement du texte | 0.5 | Fraction de la largeur occupée |
bords_childarea | 0.5 | Fraction de surface minimale du contour de l'enfant |
edges_boxarea | 0.875 | Fraction de surface minimale du petit-enfant pour la boîte |
textord_fp_chop_snap | 0.5 | Distance maximale du point de coupe par rapport au sommet |
gapmap_big_gaps | 1.75 | multiplicateur xht |
textord_spline_shift_fraction | 0.02 | Fraction de l'interligne pour le quad |
textord_spline_outlier_fraction | 0.1 | Fraction de l'interligne pour la valeur aberrante |
textord_skew_ile | 0.5 | Ile de gradients pour l'inclinaison de la page |
textord_skew_lag | 0.02 | Retard pour l'asymétrie sur l'accumulation de lignes |
textord_linespace_iqrlimit | 0.2 | Prix maximal/ médian pour l'espace interligne |
limite_de_largeur_du_texte | 8 | Largeur maximale des blobs pour former des rangées |
textord_chop_width | 1.5 | Largeur maximale avant coupe |
facteur_d'expansion_du_texte | 1 | Facteur d'expansion des lignes dans expand_rows |
textord_overlap_x | 0.375 | Fraction d'espace pour un bon chevauchement |
textord_minxh | 0.25 | fraction de la taille des lignes pour la hauteur minimale |
textord_min_linesize | 1.25 | * hauteur du blob pour la taille initiale des lignes |
textord_excess_blobsize | 1.3 | Nouvelle rangée créée si le blob fait une rangée de cette taille |
seuil d'occupation | 0.4 | Fraction du quartier |
largeur_du_soulignement_du_texte | 2 | Multiple de line_size pour le soulignement |
textord_min_blob_height_fraction | 0.75 | Hauteur/top minimum du blob pour inclure le top du blob dans les statistiques xheight |
textord_xheight_mode_fraction | 0.4 | Hauteur minimale de la pile pour obtenir la hauteur x |
textord_ascheight_mode_fraction | 0.08 | Hauteur minimale de la pile pour obtenir la hauteur de la pile |
textord_descheight_mode_fraction | 0.08 | Hauteur minimale de la pile pour obtenir une hauteur inférieure |
textord_ascx_ratio_min | 1.25 | Cap min/hauteur |
textord_ascx_ratio_max | 1.8 | Hauteur max. du capuchon/x |
textord_descx_ratio_min | 0.25 | Min desc/xheight |
textord_descx_ratio_max | 0.6 | Description maximale/hauteur max |
textord_xheight_error_margin | 0.1 | Variation acceptée |
oldbl_xhfract | 0.4 | Fraction de l'est autorisée dans le calcul |
oldbl_dot_error_size | 1.26 | Rapport d'aspect maximal d'un point |
textord_oldbl_jumplimit | 0.15 | Fraction X pour la nouvelle partition |
pitsync_joined_edge | 0.75 | Dist inside big blob for chopping |
pitsync_offset_freecut_fraction | 0.25 | Fraction de la coupe pour les coupes franches |
textord_tabvector_vertical_gap_fraction | 0.5 | fraction maximale de la largeur moyenne du blob autorisée pour les lacunes verticales dans le texte vertical |
textord_tabvector_vertical_box_ratio | 0.5 | Fraction de boîtes d'allumettes nécessaires pour déclarer une ligne verticale |
textord_projection_scale | 0.2 | Taux de ding pour les coupes intermédiaires |
facteur_d'équilibre_du_texte | 1 | Taux de ding pour les cellules déséquilibrées |
facteur_de_lissage_des_mots_de_texte | 0.05 | Lissage des statistiques sur les écarts |
facteur de lissage de la largeur du texte | 0.1 | Statistiques sur la largeur de lissage |
mot_texte_largeur_ile | 0.4 | Ile de largeurs de blob pour l'espace est |
espace_maximum_des_mots_du_texte | 4 | Multiple de xheight |
textord_words_default_maxspace | 3.5 | Troisième espace le plus crédible possible |
textord_words_default_minspace | 0.6 | Fraction de xheight |
textord_words_min_minspace | 0.3 | Fraction de xheight |
textord_words_default_nonspace | 0.2 | Fraction de xheight |
textord_mots_initiaux_inférieurs | 0.25 | Taille initiale maximale de la grappe |
textord_mots_initiaux_supérieurs | 0.15 | Espacement initial minimal des grappes |
textord_words_minlarge | 0.75 | Fraction de lacunes valides nécessaires |
textord_words_pitchsd_threshold | 0.04 | Seuil de synchronisation de la hauteur |
textord_words_def_fixed | 0.016 | Seuil de fixation définitive |
textord_words_def_prop | 0.09 | Seuil de l'accessoire définitif |
textord_pitch_rowsimilarity | 0.08 | Fraction de xheight for sameness |
mots_initiaux_inférieurs | 0.5 | Taille initiale maximale de la grappe |
mots_initiaux_supérieurs | 0.15 | Espacement initial minimal des grappes |
mots_default_prop_nonspace | 0.25 | Fraction de xheight |
mots_default_fixed_space | 0.75 | Fraction de xheight |
mots_limite_fixe_par_défaut | 0.6 | Variation de la taille autorisée |
textord_mots_definite_spread | 0.3 | Région d'espacement non floue |
textord_spacesize_ratiofp | 2.8 | Rapport minimal espace/non-espace |
textord_spacesize_ratioprop | 2 | Rapport minimal espace/non-espace |
textord_fpiqr_ratio | 1.5 | Seuil IQR pitch/Gap IQR |
textord_max_pitch_iqr | 0.2 | Xh fraction du bruit en hauteur |
textord_fp_min_width | 0.5 | Largeur minimale des blocs décents |
décalage_souligné_du_texte | 0.1 | Fraction de x à ignorer |
ambigs_debug_level | 0 | Niveau de débogage pour les ambiguïtés unichar |
classifier le niveau de débogage | 0 | Classifier le niveau de débogage |
méthode_norme_classique | 1 | Méthode de normalisation ... |
matcher_debug_level | 0 | Niveau de débogage de l'interprète |
drapeaux_debug_matcher | 0 | Drapeaux de débogage du comparateur |
niveau_debug de classify_learning | 0 | Apprendre le niveau de débogage : |
matcher_permanent_classes_min | 1 | Nombre minimum de classes permanentes |
matcher_min_exemples_pour_ prototyping | 3 | Seuil de configuration fiable |
exemples_suffisants_de_matrice_de_matrice_de_matrice_de_matrice_de_matrice_de_matrice for_prototyping | 5 | Permettre l'adaptation même si les ambiguïtés n'ont pas été vues |
seuil_de_classification_d'adaptation_du_proto | 230 | Seuil pour les bons protos pendant l'adaptation 0-255 |
seuil_de_classification_d'adaptation_des_caractéristiques | 230 | Seuil pour les bonnes caractéristiques lors de l'adaptation 0-255 |
seuil_de_classification_du_pruner | 229 | Classe Seuil d'élagage 0-255 |
multiplicateur_de_classe_de_pruner | 15 | Multiplicateur d'élagueurs de classe 0-255 : |
classifier_cp_cutoff_strength | 7 | Classe Élagueur CoupeurRésistance : |
classifier_integer_matcher_multiplier | 10 | Multiplicateur de l'outil de recherche de nombres entiers 0-255 : |
dawg_debug_level | 0 | Régler sur 1 pour des informations générales de débogage, sur 2 pour plus de détails, sur 3 pour voir tous les messages de débogage |
trait d'union_niveau_debug | 0 | Niveau de débogage pour les mots à trait d'union. |
taille_des_mots_arrêtés | 2 | Taille du mot dicté à traiter comme un mot non dicté |
niveau_debug_stoppeur | 0 | Niveau de débogage de Stopper |
tessedit_truncate_wordchoice_log | 10 | Nombre maximal de mots à conserver dans la liste |
max_permuter_attempts | 10000 | Nombre maximum de choix de caractères différents à prendre en compte lors de la permutation. Cette limite est particulièrement utile lorsque des modèles d'utilisateur sont spécifiés, car des modèles trop génériques peuvent amener dawg search à explorer un nombre trop important d'options. |
repair_unchopped_blobs | 1 | Corriger les blobs qui ne sont pas hachés |
chop_debug | 0 | Chop debug |
chop_split_length | 10000 | Longueur de la fente |
chop_same_distance | 2 | Même distance |
chop_min_outline_points | 6 | Nombre minimum de points sur le schéma |
taille_de_la_pile_de_chop_seam | 150 | Nombre maximal de coutures dans la pile de coutures |
chop_inside_angle | -50 | Angle intérieur min |
chop_min_outline_area | 2000 | Superficie minimale des contours |
chop_centered_maxwidth | 90 | Largeur des taches (plus petites) hachées au-dessus de laquelle nous ne nous soucions pas qu'une tache ne soit pas près du centre. |
chop_x_y_weight | 3 | X / Y longueur poids |
wordrec_debug_level | 0 | Niveau de débogage pour wordrec |
wordrec_max_join_chunks | 4 | Nombre maximum de pièces cassées à associer |
segsearch_debug_level | 0 | Niveau de débogage de SegSearch |
segsearch_max_pain_points | 2000 | Nombre maximum de points de douleur stockés dans la file d'attente |
segsearch_max_futile_classifications | 20 | Nombre maximum de classifications de points douloureux par morceau qui n'ont pas permis de trouver un meilleur choix de mots. |
niveau_debug_du_modèle_de_langue | 0 | Niveau de débogage du modèle linguistique |
ordre_des_modèles_de_langues | 8 | Ordre maximum du modèle de ngrammes de caractères |
liste_de_viterbi_modèle_de_langue_de_langue_de_langue_de_viterbi max_num_prunable | 10 | Nombre maximal d'arbres élagables (ceux pour lesquels PrunablePath() est vrai) entries in each viterbi list recorded in BLOB_CHOICEs |
taille_max de_la_liste_de_viterbi_du_modèle_de_langue | 500 | Taille maximale des listes de viterbi enregistrées dans BLOB_CHOICEs |
longueur_composée_min_du_modèle_de_langue | 3 | Longueur minimale des mots composés |
wordrec_display_segmentations | 0 | Segmentation de l'affichage |
tessedit_pageseg_mode | 6 | Mode de segmentation des pages : 0=osd uniquement, 1=auto+osd, 2=auto uniquement, 3=auto, 4=colonne, 5=block_vert, 6=block, 7=ligne, 8=mot, 9=mot_cercle, 10=char,11=sparse_text, 12=sparse_text+osd, 13=raw_line (Valeurs de l'enum PageSegMode dans tesseract/publictypes.h) |
tessedit_ocr_engine_mode | 2 | Quel(s) moteur(s) d'OCR exécuter (Tesseract, LSTM, les deux). Par défaut, le moteur le plus précis est chargé et exécuté. |
pageseg_devanagari_split_strategy | 0 | Utilisation ou non du processus de division de la première ligne pour les documents Devanagari lors de la segmentation des pages. |
ocr_devanagari_split_strategy | 0 | Utiliser ou non le processus de découpage de la première ligne pour les documents Devanagari lors de l'ocr. |
bidi_debug | 0 | Niveau de débogage pour BiDi |
applybox_debug | 1 | Niveau de débogage |
applybox_page | 0 | Numéro de la page à partir de laquelle les cases doivent être appliquées |
tessedit_bigram_debug | 0 | Quantité de données de débogage pour la correction des bigrammes. |
debug_noise_removal | 0 | Déboguer la réaffectation des petits contours |
bruit_maxperblob | 8 | Nombre maximal de signes diacritiques à appliquer à un blob |
mot_maximum de bruit | 16 | Nombre maximal de signes diacritiques à appliquer à un mot |
debug_x_ht_level | 0 | Réestimer le débogage |
qualité_min_initiale_alphas_reqd | 2 | les alphas dans un bon mot |
tessedit_tess_adaption_mode | 39 | Algorithme de décision d'adaptation pour tess |
multilang_debug_level | 0 | Imprime les informations de débogage multilang. |
paragraphe_debug_level | 0 | Imprimer les informations de débogage du paragraphe. |
tessedit_preserve_min_wd_len | 2 | Ne conservez que les mots plus longs que celui-ci |
crunch_rating_max | 10 | Pour la longueur ajustée dans le classement par ch |
indicateurs_pots_crunch | 1 | Combien d'indicateurs potentiels sont nécessaires ? |
crunch_leave_lc_strings | 4 | Ne pas écraser les mots avec de longues chaînes de minuscules |
crunch_leave_uc_strings | 4 | Ne pas écraser les mots avec de longues chaînes de minuscules |
crunch_long_repetitions | 3 | Les mots croquants avec de longues répétitions |
crunch_debug | 0 | Comme le dit le texte |
fixsp_non_noise_limit | 1 | Combien d'ampoules non bruyantes de part et d'autre ? |
fixsp_done_mode | 1 | Ce qui constitue fait pour l'espacement |
debug_fix_space_level | 0 | Débogage contextuel de l'espace fixe |
x_ht_acceptance_tolerance | 8 | Déviation maximale autorisée du sommet du blob en dehors des données de la police |
x_ht_min_change | 8 | Changement minime dans le xht avant de l'essayer |
superscript_debug | 0 | Niveau de débogage for sub & superscript fixer |
qualité_jpg | 85 | Définir le niveau de qualité JPEG |
user_defined_dpi | 0 | Spécifier le DPI de l'image d'entrée |
min_character_to_try | 50 | Spécifier le nombre minimum de caractères à essayer pendant l'OSD |
niveau_de_suspicion | 99 | Niveau du marqueur suspect |
mots_courts_suspects | 2 | Ne soupçonnez pas de dict wds plus longs que cela |
tessedit_reject_mode | 0 | Algorithme de rejet |
tessedit_image_border | 2 | Rej blbs near image edge limit |
min_sane_x_ht_pixels | 8 | Rejeter tout x-ht lt ou eq que celui-ci |
tessedit_page_numéro | -1 | -1 -> Toutes les pages, ou une page spécifique à traiter |
tessedit_parallelize | 1 | Exécution en parallèle dans la mesure du possible |
lstm_choice_mode | 2 | Permet d'inclure des choix de symboles alternatifs dans la sortie hOCR. Les valeurs d'entrée valides sont 0, 1 et 2. 0 est la valeur par défaut. Avec 1, les choix de symboles alternatifs par pas de temps sont inclus. Avec 2, les choix de symboles alternatifs sont extraits du processus CTC au lieu du réseau. Les choix sont cartographiés par caractère. |
lstm_choice_iterations | 5 | Définit le nombre d'itérations en cascade pour la recherche de faisceau en mode lstm_choice_mode. Notez que lstm_choice_mode doit avoir une valeur supérieure à 0 pour produire des résultats. |
tosp_debug_level | 0 | Données de débogage |
tosp_enough_space_samples_for_median | 3 | ou devrions-nous utiliser la moyenne |
tosp_redo_kern_limit | 10 | Nombre d'échantillons nécessaires à la réestimation de la ligne |
tosp_few_samples | 40 | Nombre d'interstices requis avec 1 grand interstice à traiter comme une table |
tosp_short_row | 20 | Aucun espace n'est requis avec quelques espaces pour utiliser les certificats |
méthode_sanité_tosp | 1 | Comment éviter d'être ridicule |
taille_du_bruit_maximale | 7 | Taille des pixels du bruit |
textord_baseline_debug | 0 | Niveau de débogage de base |
textord_noise_sizefraction | 10 | Fraction de la taille pour les maxima |
textord_noise_translimit | 16 | Transitions pour un blob normal |
textord_noise_sncount | 1 | super norm blobs to save row |
utilisation_des_ambigs_pour_l'adaptation | 0 | Utiliser les ambigus pour décider de l'adaptation à un personnage |
allow_blob_division | 1 | Utiliser des blocs divisibles pour le hachage |
prioritize_division | 0 | Priorité à la division des blobs plutôt qu'au découpage |
classifier_activer_apprentissage | 1 | Activer le classificateur adaptatif |
tess_cn_matching | 0 | Correspondance normalisée des caractères |
tess_bn_matching | 0 | Correspondance normalisée de base |
classify_enable_adaptive_matcher | 1 | Activer le classificateur adaptatif |
classifier_utiliser_des_modèles_préadaptés | 0 | Utiliser des modèles de classificateurs préadaptés |
classifier_sauver_les_modèles_adaptés | 0 | Enregistrer les modèles adaptés dans un fichier |
classifier_activer_le_débogueur_adaptatif | 0 | Activer le débogueur de match |
classifier_non-linéaire_norm | 0 | Normalisation non linéaire de la densité des traits |
désactiver les fragments de caractères | 1 | Ne pas inclure les fragments de caractères dans les résultats du classificateur |
classifier les fragments de caractères de débogage | 0 | Afficher les fenêtres de débogage graphique pour la formation aux fragments |
matcher_debug_separate_windows | 0 | Utilisez deux fenêtres différentes pour le débogage de l'appariement : une pour les prototypes et une pour les fonctionnalités. |
mode_classique_bln_numerique | 0 | Supposons que l'entrée soit constituée de chiffres [0-9]. |
load_system_dawg | 1 | Chargez le mot système dawg. |
load_freq_dawg | 1 | Chargez les mots fréquents dawg. |
load_unambig_dawg | 1 | Chargez le mot sans ambiguïté dawg. |
load_punc_dawg | 1 | Chargez le dawg avec des schémas de ponctuation. |
load_number_dawg | 1 | Chargez le dawg avec des modèles de nombres. |
load_bigram_dawg | 1 | Charger dawg avec des mots spéciaux bigrammes. |
use_only_first_uft8_step | 0 | N'utiliser que la première étape UTF8 de la chaîne donnée lors du calcul des probabilités logarithmiques. |
stopper_les_choix_non_acceptables | 0 | Faire en sorte que AcceptableChoice() renvoie toujours false. Utile lorsqu'il est nécessaire d'explorer toutes les segmentations |
segment_nonalphabetic_script | 0 | Ne pas utiliser d'astuces spécifiques à l'alphabet. Défini à true dans le fichier de configuration de traineddata pour les scripts cursifs ou à hauteur fixe inhérente |
save_doc_words | 0 | Enregistrer les mots du document |
fusionner_fragments_dans_la_matrice | 1 | Fusionner les fragments dans la matrice d'évaluation et les supprimer après la fusion |
wordrec_enable_assoc | 1 | Activation de l'associateur |
force_word_assoc | 0 | force l'associateur à s'exécuter, quelle que soit la valeur de enable_assoc. Ceci est utilisé pour le CJK lorsque le regroupement des composants est nécessaire. |
chop_enable | 1 | Activation du hachoir |
chop_vertical_creep | 0 | Fluage vertical |
chop_new_seam_pile | 1 | Utiliser le nouveau seam_pile |
assume_fixed_pitch_char_segment | 0 | inclure une heuristique de hauteur fixe dans la segmentation des caractères |
wordrec_skip_no_truth_words | 0 | Ne lancer l'OCR que pour les mots dont la vérité a été enregistrée dans le BlamerBundle |
wordrec_debug_blamer | 0 | Imprimer les messages de débogage du blamer |
wordrec_run_blamer | 0 | Essayer de rejeter la responsabilité des erreurs |
save_alt_choices | 1 | Sauvegarder les chemins alternatifs trouvés lors de la recherche de découpage et de segmentation |
langue_modèle_ngramme_on | 0 | Activer/désactiver l'utilisation du modèle de ngrammes de caractères |
utilisation_du_modèle_de_langue_de_nagramme_de_langue only_first_uft8_step | 0 | N'utiliser que la première étape UTF8 de la chaîne donnée lors du calcul des probabilités logarithmiques. |
espace_du_modèle_de_langue_de_nagramme_de_langue delimited_language | 1 | Les mots sont délimités par des espaces |
incertitude_des_modèles_de_langue_utilisés_sigmoïdaux | 0 | Utiliser le score sigmoïdal pour la certitude |
tessedit_resegment_from_boxes | 0 | Prendre la segmentation et l'étiquetage dans le fichier de la boîte |
tessedit_resegment_from_line_boxes | 0 | Conversion d'un fichier de boîtes de mots/lignes en fichiers de boîtes de caractères |
tessedit_train_from_boxes | 0 | Générer des données d'apprentissage à partir de caractères encadrés |
tessedit_faire_des_boîtes_à_partir_de_boîtes | 0 | Générer plus de boîtes à partir des caractères encadrés |
tessedit_train_line_recognizer | 0 | Décomposition de l'entrée en lignes et remappage des cases si elles sont présentes |
tessedit_dump_pageseg_images | 0 | Vider les images intermédiaires réalisées lors de la segmentation de la page |
tessedit_do_invert | 1 | Essayez d'inverser l'image dans `LSTMRecognizeWord` |
tessedit_ambigs_training | 0 | Formation aux ambiguïtés |
tessedit_adaption_debug | 0 | Générer et imprimer des informations de débogage pour l'adaptation |
applybox_learn_chars_and_char_frags_mode | 0 | Apprenez à la fois les fragments de caractères (comme c'est le cas dans le mode spécial de faible exposition) et les caractères non fragmentés. |
applybox_learn_ngrams_mode | 0 | Chaque boîte de délimitation est supposée contenir des ngrammes. Seuls les ngrammes dont les contours se chevauchent horizontalement sont appris. |
tessedit_display_outwords | 0 | Dessiner des mots de sortie |
tessedit_dump_choices | 0 | Choix des caractères de vidage |
tessedit_timing_debug | 0 | Imprimer les statistiques de temps |
tessedit_fix_fuzzy_spaces | 1 | Essayer d'améliorer les espaces flous |
tessedit_unrej_any_wd | 0 | Ne vous souciez pas de la plausibilité des mots |
tessedit_fix_hyphens | 1 | Croquer des doubles traits d'union ? |
tessedit_enable_doc_dict | 1 | Ajouter des mots au dictionnaire du document |
tessedit_debug_fonts | 0 | Informations sur les polices de caractères par caractère |
tessedit_debug_block_rejection | 0 | Statistiques sur les blocs et les rangs |
tessedit_enable_bigram_correction | 1 | Activer la correction basée sur le dictionnaire de bigrammes de mots. |
tessedit_enable_dict_correction | 0 | Permet la correction d'un seul mot en fonction du dictionnaire. |
activation de l'élimination du bruit | 1 | Suppression et réaffectation conditionnelle des petits contours lorsqu'ils perturbent l'analyse de la mise en page, en déterminant les diacritiques par rapport au bruit |
tessedit_minimal_rej_pass1 | 0 | Effectuer un rejet minimal sur la sortie de la passe 1 |
tessedit_test_adaption | 0 | Critères d'adaptation des tests |
test_pt | 0 | Test de point |
paragraphe_texte_basé | 1 | Détection des paragraphes après la reconnaissance du texte (plus précise) |
lstm_use_matrix | 1 | Utiliser la matrice de notation/la recherche par faisceau avec lstm |
tessedit_good_quality_unrej | 1 | Réduire les rejets de bons documents |
tessedit_use_reject_spaces | 1 | Rejeter les espaces ? |
tessedit_preserve_blk_rej_perfect_wds | 1 | Ne rejette que les mots partiellement rejetés dans le bloc de rejet |
tessedit_preserve_row_rej_perfect_wds | 1 | Rejeter uniquement les mots partiellement rejetés dans la ligne de rejet |
tessedit_dont_blkrej_good_wds | 0 | Utiliser la métrique de qualité de la segmentation des mots |
tessedit_dont_rowrej_good_wds | 0 | Utiliser la métrique de qualité de la segmentation des mots |
tessedit_row_rej_good_docs | 1 | Appliquer le rejet des rangs aux bons documents |
tessedit_reject_bad_qual_wds | 1 | Rejeter tous les fichiers de mauvaise qualité |
tessedit_debug_doc_rejection | 0 | Statistiques de la page |
tessedit_debug_quality_metrics | 0 | Sortie des données dans le fichier de débogage |
bland_unrej | 0 | potentiel de non-réalisation en l'absence de contrôles |
unlv_tilde_crunching | 0 | Marquer les v. mauvais mots pour le croisement de tilde |
hocr_font_info | 0 | Ajouter des informations sur les polices de caractères à la sortie de hocr |
boîtes à caractères | 0 | Ajouter les coordonnées de chaque caractère à la sortie hocr |
crunch_early_merge_tess_fails | 1 | Avant la crise des mots ? |
crunch_early_convert_bad_unlv_chs | 0 | Sortir ~^ plus tôt que prévu ? |
crunch_terrible_garbage | 1 | Comme le dit le texte |
crunch_leave_ok_strings | 1 | Ne pas toucher aux cordes sensibles |
crunch_accept_ok | 1 | Utiliser l'acceptabilité dans okstring |
crunch_leave_accept_strings | 0 | Ne pas écraser les cordes sensibles |
crunch_include_numerals | 0 | Chiffres alpha du violon |
tessedit_prefer_joined_punct | 0 | Récompenser la ponctuation |
tessedit_write_block_separators | 0 | Écriture de séparateurs de blocs dans la sortie |
tessedit_write_rep_codes | 0 | Ecrire un code de répétition |
tessedit_write_unlv | 0 | Écrire un fichier de sortie .unlv |
tessedit_create_txt | 0 | Écriture d'un fichier de sortie .txt |
tessedit_create_hocr | 0 | Rédiger un fichier de sortie hOCR au format .html |
tessedit_create_alto | 0 | Écriture d'un fichier .xml ALTO |
tessedit_create_lstmbox | 0 | Écriture d'un fichier .box pour l'apprentissage du LSTM |
tessedit_create_tsv | 0 | Écriture d'un fichier de sortie .tsv |
tessedit_create_wordtrbox | 0 | Écriture d'un fichier de sortie .box au format WordStr |
tessedit_créer_pdf | 0 | Rédiger un fichier de sortie .pdf |
textonly_pdf | 0 | Créer un PDF avec une seule couche de texte invisible |
suspect_constrain_1Il | 0 | UNLV garder 1Il chars rejetés |
tessedit_minimal_rejection | 0 | Ne rejeter que les échecs de Tess |
tessedit_zero_rejection | 0 | Ne rejetez RIEN |
tessedit_word_for_word | 0 | Faire en sorte que la sortie comporte exactement un mot par WERD |
tessedit_zero_kelvin_rejection | 0 | Ne rejetez RIEN AT ALL |
tessedit_rejection_debug | 0 | Débogage de l'adaptation |
tessedit_flip_0O | 1 | Renversement contextuel 0O O0 |
rej_trust_doc_dawg | 0 | Utiliser DOC dawg dans le détecteur de conf. 11l |
rej_1Il_use_dict_word | 0 | Utiliser le test de dictée |
rej_1Il_trust_permuter_type | 1 | Ne pas vérifier deux fois |
rej_use_tess_accepted | 1 | Contrôle individuel des rejets |
rej_use_tess_blanks | 1 | Contrôle individuel des rejets |
rej_use_good_perm | 1 | Contrôle individuel des rejets |
rej_use_sensible_wd | 0 | Extension du contrôle des permutations |
rej_alphas_in_number_perm | 0 | Extension du contrôle des permutations |
tessedit_create_boxfile | 0 | Édition de texte avec des encadrés |
tessedit_write_images | 0 | Capture de l'image à partir de l'IPE |
mode_affichage_interactif | 0 | Exécuter de manière interactive ? |
tessedit_override_permuter | 1 | Selon dict_word |
tessedit_use_primary_params_model | 0 | En mode multilingue, utiliser le modèle params de la langue principale |
textord_tabfind_show_vlines | 0 | Recherche de ligne de débogage |
textord_use_cjk_fp_model | 0 | Utiliser le modèle CJK à pas fixe |
poly_allow_detailed_fx | 0 | Permettre aux extracteurs de caractéristiques de voir le contour original |
tessedit_init_config_only | 0 | Initialiser uniquement avec le fichier de configuration. Utile si l'instance n'est pas utilisée pour l'OCR mais uniquement pour l'analyse de la mise en page. |
textord_equation_detect | 0 | Activer le détecteur d'équations |
textord_tabfind_vertical_text | 1 | Activer la détection verticale |
textord_tabfind_force_vertical_text | 0 | Forcer l'utilisation du mode de page de texte vertical |
préserver_les_espaces_inter-mots | 0 | Préserver les espaces inter-mots multiples |
pageseg_apply_music_mask | 1 | Détecter la portée musicale et supprimer les éléments qui se croisent |
mode textord_single_height | 0 | Le script n'a pas de hauteur x, il faut donc utiliser un mode unique |
tosp_old_to_method | 0 | Les statistiques de l'espace utilisent le hachage préalable ? |
tosp_old_to_constrain_sp_kn | 0 | Limiter les valeurs relatives des écarts entre les mots et à l'intérieur des mots pour old_to_method. |
tosp_only_use_prop_rows | 1 | Les stats de blocs pour utiliser des rangs à pas fixe ? |
tosp_force_wordbreak_on_punct | 0 | Forcer les sauts de mots sur les ponctuels pour couper les longues lignes dans les langues non délimitées par des espaces |
tosp_use_pre_chopping | 0 | Les statistiques de l'espace utilisent le hachage préalable ? |
tosp_old_to_bug_fix | 0 | Correction d'un bogue suspecté dans un ancien code |
tosp_block_use_cert_spaces | 1 | Uniquement les espaces OBVIOUS |
tosp_row_use_cert_spaces | 1 | Uniquement les espaces OBVIOUS |
tosp_narrow_blobs_not_cert | 1 | Uniquement les espaces OBVIOUS |
tosp_row_use_cert_spaces1 | 1 | Uniquement les espaces OBVIOUS |
tosp_recovery_isolated_row_stats | 1 | Utiliser la rangée seule lorsque les espaces de certitude sont insuffisants |
tosp_only_small_gaps_for_kern | 0 | Meilleure estimation |
tosp_all_flips_fuzzy | 0 | Passez TOUT au contexte ? |
tosp_fuzzy_limit_all | 1 | Ne pas restreindre la limite floue kn->sp aux tableaux |
tosp_stats_use_xht_gaps | 1 | Utilisation à l'intérieur de l'espace xht pour les ruptures wd |
tosp_use_xht_gaps | 1 | Utilisation à l'intérieur de l'espace xht pour les ruptures wd |
tosp_only_use_xht_gaps | 0 | A n'utiliser qu'à l'intérieur de l'espace xht pour les ruptures de wd |
tosp_rule_9_test_punct | 0 | Ne pas changer de place à côté d'une ponctuation |
tosp_flip_fuzz_kn_to_sp | 1 | Retournement par défaut |
tosp_flip_fuzz_sp_to_kn | 1 | Retournement par défaut |
tosp_improve_thresh | 0 | Permettre une heuristique d'amélioration |
textord_no_rejects | 0 | Ne pas supprimer les blobs de bruit |
textord_show_blobs | 0 | Afficher les blobs non triés |
textord_show_boxes | 0 | Afficher les blobs non triés |
mots_bruits | 1 | Rejeter les mots bruyants |
textord_noise_rejrows | 1 | Rejeter les lignes bruyantes |
textord_noise_debug | 0 | Déboguer le détecteur de déchets des rangées |
classify_learn_debug_str | La classe str pour déboguer l'apprentissage | |
fichier_mots_utilisateur | Un nom de fichier contenant des mots fournis par l'utilisateur. | |
mots_utilisateur_suffixe | Un suffixe de mots fournis par l'utilisateur et situés dans tessdata. | |
fichier_modèles_utilisateur | Un nom de fichier de motifs fournis par l'utilisateur. | |
motifs_utilisateur_suffixe | Un suffixe de motifs fournis par l'utilisateur et situés dans tessdata. | |
fichier_de_mots_ambigus_de_sortie | Fichier de sortie pour les ambiguïtés trouvées dans le dictionnaire | |
mot_à_déboguer | Mot pour lequel les informations de débogage du stoppeur doivent être imprimées sur stdout | |
tessedit_char_blacklist | Liste noire des caractères à ne pas reconnaître | |
tessedit_char_whitelist | Liste blanche de caractères à reconnaître | |
tessedit_char_unblacklist | Liste de caractères à ignorer tessedit_char_blacklist | |
tessedit_write_params_to_file | Écrit tous les paramètres dans le fichier donné. | |
applybox_exposure_pattern | .exp | La valeur d'exposition suit ce modèle dans le nom du fichier image. Les noms des fichiers d'image doivent être de la forme [lang].[fontname].exp [num].tif |
chs_leading_punct ('`" | Ponctuation en tête | |
chs_trailing_punct1 | ).,;: ?! | 1er Ponctuation de fin |
chs_trailing_punct2 )'`" | 2ème ponctuation de fin | |
contours_odd | % | Nombre de contours non standard |
outlines_2 ij!?%": ; | Nombre de contours non standard | |
ponctuation_numérique | ., | Ponct. chs attendus DANS les nombres |
unrecognised_char | Caractère de sortie pour les blobs non identifiés | |
ok_repeated_ch_non_alphanum_wds | -?*= | Permettre au NN de se détacher |
conflict_set_I_l_1 | Il1 [] | Il1 conflict set |
type de fichier | .tif | Extension du nom de fichier |
tessedit_load_sublangs | Liste des langues à charger avec celle-ci | |
page_separator | Séparateur de pages (par défaut, le caractère de contrôle du saut de page) | |
classifier_char_norm_range | 0.2 | Plage de normalisation des caractères ... |
ratio_de_classification_max | 1.5 | Rapport de veto entre les notations des classificateurs |
marge_de_certitude_max | 5.5 | Veto différence entre les certitudes des classificateurs |
seuil_matcher_good | 0.125 | Bon match (0-1) |
résultat_adaptatif_fiable_matcher | 0 | Grand Match (0-1) |
seuil_parfait_du_matelier | 0.02 | Correspondance parfaite (0-1) |
matcher_bad_match_pad | 0.15 | Mauvais match pad (0-1) |
marge_rating_matcher | 0.1 | Marge du nouveau modèle (0-1) |
taille_du_bruit_de_la_matrice | 12 | Longueur moyenne du bruit |
matcher_clustering_max_angle_delta | 0.015 | Delta d'angle maximal pour le regroupement de prototypes |
classer_misfit_junk_penalty | 0 | Pénalité à appliquer lorsqu'un numéro autre qu'un numéro d'ordre se trouve verticalement en dehors de la position prévue de la ligne de texte |
échelle de notation | 1.5 | Facteur d'échelle du classement |
échelle de certitude | 20 | Facteur d'échelle de certitude |
tessedit_class_miss_scale | 0.00390625 | Facteur d'échelle pour les caractéristiques non utilisées |
facteur_d'élagage_adapté_à_la_classification | 2.5 | Élaguer les résultats mal adaptés qui sont beaucoup plus mauvais que le meilleur résultat |
seuil_d'élagage_adapté_à_la_classification | -1 | Threshold at which facteur_d'élagage_adapté_à_la_classification starts |
classer les fragments de caractères garbage_certainty_threshold | -3 | Exclure de la formation et de l'adaptation les fragments qui ne ressemblent pas à des personnages entiers |
speckle_large_max_size | 0.3 | Taille maximale du chatoiement |
pénalité_de_rating_de_speckle | 10 | Pénalité s'ajoutant à l'évaluation la plus défavorable en matière de bruit |
xheight_penalty_subscripts | 0.125 | Pénalité (0,1 = 10 %) ajoutée si le mot contient des indices ou des exposants, mais qu'il est correct par ailleurs. |
xheight_penalty_inconsistent | 0.25 | Pénalité de score (0,1 = 10%) ajoutée si une hauteur x est incohérente. |
segment_penalty_dict_frequent_word | 1 | Multiplicateur de score pour les correspondances de mots qui ont une bonne casse et qui sont fréquents dans la langue donnée (plus le score est faible, mieux c'est). |
segment_penalty_dict_case_ok | 1.1 | Multiplicateur de score pour les mots correspondant à une bonne casse (plus il est faible, mieux c'est). |
segment_penalty_dict_case_bad | 1.3125 | Multiplicateur de score par défaut pour les correspondances de mots, ce qui peut poser des problèmes de casse (plus il est faible, mieux c'est). |
segment_penalty_dict_nonword | 1.25 | Multiplicateur de score pour les segmentations de fragments de glyphes qui ne correspondent pas à un mot du dictionnaire (plus il est faible, mieux c'est). |
segment_penalty_garbage | 1.5 | Multiplicateur de score pour les chaînes mal casées qui ne figurent pas dans le dictionnaire et qui ressemblent généralement à des déchets (plus il est faible, mieux c'est). |
échelle de certitude | 20 | Facteur d'échelle de certitude |
stopper_nondict_certainty_base | -2.5 | Seuil de certitude pour les mots non-dictés |
stopper_phase2_certainty_rejection_offset | 1 | Rejeter la compensation de certitude |
stopper_certainty_per_char | -0.5 | Certitude d'ajouter pour chaque caractère de dictée au-delà de la petite taille du mot. |
stopper_la_mauvaiseté_des_caractères_autorisables | 3 | Variation de certitude maximale autorisée dans un mot (en sigma) |
doc_dict_pending_threshold | 0 | Pire certitude pour l'utilisation du dictionnaire en attente |
doc_dict_certainty_threshold | -2.25 | Pire certitude pour les mots qui peuvent être insérés dans le dictionnaire du document |
seuil d'incertitude | -2.25 | Bonne limite d'utilisation des blobs |
chop_split_dist_knob | 0.5 | Réglage de la longueur de la fente |
chop_overlap_knob | 0.9 | Ajustement du chevauchement fractionné |
chop_center_knob | 0.15 | Ajustement du centre de la fente |
bouton d'affûtage | 0.06 | Réglage de la netteté de l'image |
bouton de modification de la largeur du chop | 5 | Réglage de la largeur |
chop_ok_split | 100 | Limite de fractionnement OK |
chop_good_split | 50 | Bonne limite de fractionnement |
segsearch_max_char_wh_ratio | 2 | Rapport maximal entre la largeur et la hauteur des caractères |