Establecimiento de variables de configuración de Tesseract en C#

La interfaz IronOcr Tesseract permite un control total de las variables de configuración de Tesseract a través de la función

Clase IronOcr.TesseractConfiguration

Ejemplo de código de configuración de Tesseract

using IronOcr;

var Ocr = new IronTesseract();

Ocr.Language = OcrLanguage.English;
Ocr.Configuration.ReadBarCodes = false;
Ocr.Configuration.BlackListCharacters = "`ë
^";
Ocr.Configuration.RenderSearchablePdf = true;
Ocr.Configuration.RenderHocr = true;
Ocr.Configuration.PageSegmentationMode = TesseractPageSegmentationMode.AutoOsd;
Ocr.Configuration.TesseractVariables ["tessedit_parallelize"] = false;

using (var Input = new OcrInput(@"images\image.png"))
{
 var Result = Ocr.Read(Input);
 Console.WriteLine(Result.Text);
} 
using IronOcr;

var Ocr = new IronTesseract();

Ocr.Language = OcrLanguage.English;
Ocr.Configuration.ReadBarCodes = false;
Ocr.Configuration.BlackListCharacters = "`ë
^";
Ocr.Configuration.RenderSearchablePdf = true;
Ocr.Configuration.RenderHocr = true;
Ocr.Configuration.PageSegmentationMode = TesseractPageSegmentationMode.AutoOsd;
Ocr.Configuration.TesseractVariables ["tessedit_parallelize"] = false;

using (var Input = new OcrInput(@"images\image.png"))
{
 var Result = Ocr.Read(Input);
 Console.WriteLine(Result.Text);
} 
Imports IronOcr

Private Ocr = New IronTesseract()

Ocr.Language = OcrLanguage.English
Ocr.Configuration.ReadBarCodes = False
Ocr.Configuration.BlackListCharacters = "`ë ^"
Ocr.Configuration.RenderSearchablePdf = True
Ocr.Configuration.RenderHocr = True
Ocr.Configuration.PageSegmentationMode = TesseractPageSegmentationMode.AutoOsd
Ocr.Configuration.TesseractVariables ("tessedit_parallelize") = False

Using Input = New OcrInput("images\image.png")
 Dim Result = Ocr.Read(Input)
 Console.WriteLine(Result.Text)
End Using
VB   C#

Lista de todas las variables de configuración de Tesseract

Se pueden configurar mediante IronTesseract.Configuration.TesseractVariables ["llave"] = valor;

Tesseract Config VariablePor defectoSignificado
clasificar_num_cp_niveles3Número de niveles de podador de clase
textord_debug_tabfind0Búsqueda en la pestaña Debug
textord_debug_bugs0Activar la salida relacionada con errores en la búsqueda de fichas
textord_testregion_left-1Borde izquierdo del rectángulo de informe de depuración
textord_testregion_top-1Borde superior del rectángulo de informe de depuración
textord_testregion_right2147483647Borde derecho del rectángulo de depuración
textord_testregion_bottom2147483647Borde inferior del rectángulo de depuración
textord_tabfind_show_partitions0Mostrar límites de partición, esperar si >1
devanagari_split_debuglevel0Nivel de depuración para el proceso shiro-rekha dividido.
edges_max_children_per_outline10Número máximo de hijos dentro de un contorno de carácter
edges_max_children_layers5Capas máximas de niños anidados dentro de un contorno de carácter
edges_children_per_grandchild10Relación de importancia para los contornos de sujeción
edges_children_count_limit45Máximo de agujeros permitidos en la mancha
edges_min_nonhole12Píxeles mínimos para el carácter potencial en el recuadro
edges_patharea_ratio40Lente máxq/área para contorno de niño aceptable
textord_fp_chop_error2Flexión máxima permitida de las celdas de corte
textord_tabfind_show_images0Mostrar manchas de imagen
textord_skewsmooth_offset4Para el factor de suavidad
textord_skewsmooth_offset21Para el factor de suavidad
textord_test_x-2147483647coord of test pt
textord_test_y-2147483647coord of test pt
textord_min_blobs_in_row4Mínimas manchas antes de contar el gradiente
textord_spline_minblobs8Min blobs en cada segmento spline
textord_spline_medianwin6Tamaño de la ventana para la segmentación spline
textord_max_blob_overlaps4Número máximo de blobs que una blob grande puede solapar
textord_min_xheight10Mínimo creíble pixel xheight
textord_lms_line_trials12Número de ajustes de línea a realizar
oldbl_holed_losscount10Pérdida máxima antes de utilizar la línea de reserva
pitsync_version_lineal6Utilizar un nuevo algoritmo rápido
pitsync_fake_profundidad1Generación falsa de avance máximo
textord_tabfind_show_strokewidths0Mostrar anchos de trazo
textord_dotmatrix_gap3Separación máxima de píxeles para el paso pixelado roto
textord_debug_block0Bloque para depurar
textord_pitch_range2Prueba de alcance máximo en el terreno de juego
textord_words_veto_power5Filas necesarias para superar un veto
equationdetect_save_bi_image0Guardar imagen bi de entrada
equationdetect_save_spt_image0Guardar imagen de carácter especial
equationdetect_save_seed_image0Guardar la imagen semilla
equationdetect_save_merged_image0Guardar la imagen fusionada
poly_debug0Depurar old poly
poly_wide_objects_better1Más precisión aprox. en cosas anchas
wordrec_display_splits0Visualizar divisiones
textord_debug_printable0Hacer imprimibles las ventanas de depuración
textord_space_size_is_variable0Si es verdadero, se supone que los espacios delimitadores de palabras tienen anchura variable, aunque los caracteres tengan paso fijo.
textord_tabfind_show_initial_partitions0Mostrar límites de partición
textord_tabfind_show_reject_blobs0Mostrar las manchas rechazadas como ruido
textord_tabfind_show_columns0Mostrar límites de columna
textord_tabfind_show_blocks0Mostrar límites finales de bloque
textord_tabfind_find_tables1detección de la tabla de ejecución
devanagari_split_debugimage0Si crear una imagen de depuración para el proceso de shiro-rekha dividido.
textord_show_fixed_cuts0Dibujar límites de celda de paso fijo
edges_use_new_outline_complexity0Utilice el nuevo módulo de complejidad de esquemas
edges_debug0activar la depuración para este módulo
bordes_hijos_fijar0Elimina los padres encajonados de los hijos tipo char
gapmap_debug0Decir qué bloques tienen mesas
gapmap_use_ends0Utilice un espacio grande al principio y al final de las filas
gapmap_no_isolated_quanta0Asegúrese de que los huecos no tengan menos de 2cuantas de ancho
textord_heavy_nr0Eliminar enérgicamente el ruido
textord_show_initial_rows0Mostrar acumulación de filas
textord_show_parallel_rows0Mostrar filas correlacionadas con la página
textord_show_expanded_rows0Mostrar filas después de expandir
textord_show_final_rows0Mostrar filas tras el ajuste final
textord_show_final_blobs0Visualización de los límites de las manchas tras la preevaluación
textord_test_landscape0Las pruebas se refieren a tierra/puerto
textord_parallel_baselines1Forzar líneas de base paralelas
textord_straight_baselines0Forzar líneas de base rectas
textord_old_baselines1Utilizar el antiguo algoritmo de referencia
textord_old_xheight0Utilizar el antiguo algoritmo xheight
textord_fix_xheight_bug1Utilizar línea de base spline
textord_fix_makerow_bug1Evitar líneas de base múltiples
textord_debug_xheights0Probar algoritmos xheight
textord_biased_skewcalc1Estimaciones de sesgo con longitud de línea
textord_interpolating_skew1Interpolar huecos
textord_new_initial_xheight1Utilizar el mecanismo de prueba xheight
textord_debug_blob0Imprimir información sobre las manchas de prueba
textord_really_old_xheight0Utilizar el wiseowl xheight original
textord_oldbl_debug0Depurar la generación de líneas de base antiguas
textord_debug_baselines0Generación de líneas de base de depuración
textord_oldbl_paradef1Utilizar para mecanismo por defecto
textord_oldbl_split_splines1Estrías escalonadas divididas
textord_oldbl_merge_parts1Fusionar particiones sospechosas
oldbl_corrfix1Mejorar la correlación de alturas
oldbl_xhfix0Corregido error en el umbral de modos para xheights
textord_ocropus_mode0Hacer líneas de base para ocropus
textord_tabfind_only_strokewidths0Sólo ejecutar anchos de trazo
textord_tabfind_show_initialtabs0Mostrar candidatos a la ficha
textord_tabfind_show_finaltabs0Mostrar vectores de pestañas
textord_show_tables0Mostrar regiones de la tabla
textord_tablefind_show_mark0Tabla de depuración que marca los pasos en detalle
textord_tablefind_show_stats0Mostrar las estadísticas de página utilizadas en la búsqueda de tablas
textord_tablefind_recognize_tables0Activa el reconocedor de tablas para el diseño y filtrado de tablas.
textord_all_prop0Todo el documento es texto proporcional
textord_debug_pitch_test0Prueba de depuración en paso fijo
textord_disable_pitch_test0Desactivar el algoritmo de paso fijo dp
textord_fast_pitch_test0Hacer un algoritmo de paso aún más rápido
textord_debug_pitch_metric0Escribir cosas métricas completas
textord_show_row_cuts0Dibujar cortes a nivel de fila
textord_show_page_cuts0Dibujar cortes a nivel de página
textord_pitch_cheat0Utilice la respuesta correcta para fijo/hélice
textord_blockndoc_fixed0Intentar el paso fijo de todo el documento/bloque
textord_show_initial_words0Mostrar palabras separadas
textord_show_new_words0Mostrar palabras separadas
textord_show_fixed_words0Visualización de palabras de paso fijo forzado
textord_blocksall_fixed0Quejarse de los bloques de utilería
textord_blocksall_prop0Quejarse de los bloques de paso fijo
textord_blocksall_testing0Volcar las estadísticas al gemir
textord_test_mode0Prueba de corriente
textord_pitch_scalebigwords0Puntuaciones en la escala de palabras grandes
textord_restore_underlines1Cortar subrayados y volver a poner
textord_fp_chopping1Hacer picado de paso fijo
textord_force_make_prop_words0Forzar la segmentación proporcional de palabras en todas las filas
textord_chopper_test0El helicóptero está siendo probado.
wordrec_display_all_blobs0Visualizar Blobs
wordrec_blob_pause0Blob pausa
stream_filelist0Transmitir una lista de archivos desde stdin
archivo_depuraciónArchivo al que enviar la salida tprintf
clasificar_nombre_de_fuenteFuente desconocidaPor defecto font name to be used in training
título_documentoTítulo del documento de salida (utilizado para hOCR y PDF)
puntoproductoautoFunción utilizada para el cálculo del producto punto
classify_cp_angle_pad_loose45Almohadilla angular para podadora Class Suelta
classify_cp_angle_pad_medium20Almohadilla angular para podadora Class Mediana
classify_cp_angle_pad_tight10Almohadilla angular para podadora CLASS Tight
classify_cp_end_pad_loose0.5Almohadilla de extremo de podadora Class suelta
classify_cp_end_pad_medium0.5Almohadilla para podadora Class Mediana
classify_cp_end_pad_tight0.5Clase Podador Final Pad Tight
classify_cp_side_pad_loose2.5Almohadilla lateral para podadora Class Suelta
classify_cp_side_pad_medium1.2Almohadilla lateral para podadora Class Mediana
classify_cp_side_pad_tight0.6Almohadilla lateral para podadora Class Tight
classify_pp_angle_pad45Almohadilla angular para podadora Proto
classify_pp_end_pad0.5Almohadilla Proto Prune
classify_pp_side_pad2.5Almohadilla lateral para podadora Proto
clasificar_pendiente_min0.414214Pendiente por debajo de la cual las líneas se denominan horizontales
clasificar_pendiente_max2.41421Pendiente por encima de la cual las líneas se denominan verticales
clasificar_norm_adj_punto_medio32Norma ajustar punto medio ...
clasificar_norma_adj_curl2Norma ajustar rizo ...
classify_pico_feature_length0.05Pico Feature Length
textord_underline_threshold0.5Fracción de anchura ocupada
bordes_childarea0.5Fracción de área mínima del contorno del niño
bordes_boxarea0.875Fracción de área mínima del nieto para la caja
textord_fp_chop_snap0.5Distancia máxima del punto de corte al vértice
gapmap_big_gaps1.75multiplicador xht
textord_spline_shift_fraction0.02Fracción de espacio entre líneas para quad
textord_spline_outlier_fraction0.1Fracción de espacio entre líneas para el valor atípico
textord_skew_ile0.5Ile de gradients pour page skew
textord_skew_lag0.02Retraso por desviación en la acumulación de filas
textord_linespace_iqrlimit0.2Máx iqr/mediana para el espacio lineal
textord_width_limit8Anchura máxima de blobs para hacer filas
textord_chop_width1.5Anchura máxima antes de cortar
factor_expansión_texto1Factor por el que se amplían las filas en expand_rows
textord_overlap_x0.375Fracción de espacio lineal para un buen solapamiento
textord_minxh0.25fracción de tamaño de línea para altura x mínima
textord_min_linesize1.25* Altura de la mancha para el tamaño inicial de las líneas
textord_excess_blobsize1.3Se crea una nueva fila si la mancha hace que la fila sea así de grande
textord_occupancy_threshold0.4Fracción de barrio
textord_underline_width2Múltiplo del tamaño_de_línea para el subrayado
textord_min_blob_height_fraction0.75Altura/parte superior mínima de la nota para incluir la parte superior de la nota en las estadísticas de xheight
textord_xheight_mode_fraction0.4Altura mínima de la pila para hacer la altura x
textord_ascheight_mode_fraction0.08Altura mínima de la pila
textord_descheight_mode_fraction0.08Altura mínima de la pila
textord_ascx_ratio_min1.25Tapa/altura mín.
textord_ascx_ratio_max1.8Tapa/altura máx.
textord_descx_ratio_min0.25Min desc/xheight
textord_descx_ratio_max0.6Max desc/xheight
textord_xheight_error_margin0.1Variación aceptada
oldbl_xhfract0.4Fracción de est permitida en calc
oldbl_dot_error_size1.26Máxima relación de aspecto de un punto
textord_oldbl_jumplimit0.15Fracción X para la nueva partición
pitsync_joined_edge0.75Dist dentro de blob grande para picar
pitsync_offset_freecut_fraction0.25Fracción de corte para cortes libres
textord_tabvector_vertical_gap_fraction0.5fracción máxima de la anchura media de la mancha permitida para los huecos verticales en el texto vertical
textord_tabvector_vertical_box_ratio0.5Fracción de cerillas necesarias para declarar vertical una línea
textord_projection_scale0.2Tasa de abolladuras en los cortes intermedios
textord_balance_factor1Tasa de ding para células char desequilibradas
textord_wordstats_smooth_factor0.05Suavizar las estadísticas de las diferencias
textord_width_smooth_factor0.1Estadísticas de la anchura de alisado
textord_words_width_ile0.4Ile de blob widths for space est
textord_words_maxspace4Múltiplo de xaltura
textord_words_default_maxspace3.5Tercer espacio máximo creíble
textord_words_default_minspace0.6Fracción de xaltura
textord_words_min_minspace0.3Fracción de xaltura
textord_words_default_nonspace0.2Fracción de xaltura
textord_palabras_iniciales_inferiores0.25Tamaño máximo inicial del conglomerado
textord_palabras_iniciales_arriba0.15Espaciado inicial mínimo entre conglomerados
textord_words_minlarge0.75Fracción de huecos válidos necesarios
textord_words_pitchsd_threshold0.04Umbral de sincronización de tono
textord_words_def_fixed0.016Umbral fijo definitivo
textord_words_def_prop0.09Umbral de puntal definido
textord_pitch_rowsimilarity0.08Fracción de xaltura for sameness
palabras_iniciales_inferiores0.5Tamaño máximo inicial del conglomerado
palabras_iniciales_arriba0.15Espaciado inicial mínimo entre conglomerados
words_default_prop_nonspace0.25Fracción de xaltura
words_default_fixed_space0.75Fracción de xaltura
palabras_defecto_limite_fijo0.6Variación de tamaño permitida
textord_words_definite_spread0.3Región de separación no difusa
textord_spacesize_ratiofp2.8Relación mínima espacio/no espacio
textord_spacesize_ratioprop2Relación mínima espacio/no espacio
textord_fpiqr_ratio1.5Umbral IQR de paso/Gap IQR
textord_max_pitch_iqr0.2Xh fracción de ruido en el tono
textord_fp_min_width0.5Anchura mínima de las manchas decentes
textord_underline_offset0.1Fracción de x a ignorar
ambigs_debug_level0Nivel de depuración de ambigüedades unichar
clasificar_nivel_depuración0Clasificar el nivel de depuración
método_clasificar_normales1Método de normalización ...
matcher_debug_level0Nivel de depuración de Matcher
matcher_debug_flags0Indicadores de depuración del comparador
clasificar_aprendizaje_nivel_depuración0Aprendizaje del nivel de depuración:
matcher_permanent_classes_min1Número mínimo de clases permanentes
matcher_min_examples_for_ prototyping3Umbral de configuración fiable
matcher_sufficient_examples_ for_prototyping5Permitir la adaptación aunque no se hayan visto las ambigüedades
clasificar_adaptar_proto_umbral230Umbral de buenos protos durante la adaptación 0-255
classify_adapt_feature_threshold230Umbral de buenas características durante la adaptación 0-255
classify_class_pruner_threshold229Clase Umbral de poda 0-255
classify_class_pruner_multiplier15Multiplicador de podador de clase 0-255:
classify_cp_cutoff_strength7Podadora de clase CorteFuerza:
classify_integer_matcher_multiplier10Multiplicador 0-255:
dawg_debug_level0Seleccione 1 para información general de depuración, 2 para más detalles y 3 para ver todos los mensajes de depuración.
hyphen_debug_level0Nivel de depuración para palabras con guión.
tamaño_palabra_pequeña_tapón2Tamaño de la palabra dict a tratar como palabra no dict
stopper_debug_level0Nivel de depuración del tapón
tessedit_truncate_wordchoice_log10Máximo de palabras a mantener en la lista
intentos_permutadores_máximos10000Número máximo de opciones de caracteres diferentes a considerar durante la permutación. Este límite es especialmente útil cuando se especifican patrones de usuario, ya que los patrones demasiado genéricos pueden hacer que la búsqueda dawg explore un número excesivamente grande de opciones.
repair_unchopped_blobs1Arreglar las manchas que no se cortan
chop_debug0Cortar depuración
chop_split_length10000Longitud dividida
chop_same_distance2Misma distancia
chop_min_outline_points6Número mínimo de puntos en el esquema
chop_seam_pile_size150Número máximo de costuras en seam_pile
chop_inside_angle-50Ángulo interior mínimo
chop_min_outline_area2000Área mínima de contorno
chop_centered_maxwidth90Anchura de las picadas (más pequeñas) por encima de la cual no nos importa que una picada no esté cerca del centro.
chop_x_y_weight3X / Y longitud peso
wordrec_debug_level0Nivel de depuración para wordrec
wordrec_max_join_chunks4Número máximo de piezas rotas a asociar
segsearch_debug_level0Nivel de depuración de SegSearch
segsearch_max_pain_points2000Número máximo de pain points almacenados en la cola
segsearch_max_futile_classifications20Número máximo de clasificaciones de puntos dolorosos por fragmento que no permitieron encontrar una palabra mejor.
idioma_modelo_nivel_depuración0Nivel de depuración del modelo de lenguaje
orden_ngrama_modelo_de_lengua8Orden máximo del modelo de ngrama de caracteres
modelo_de_idioma_viterbi_list_ max_num_prunable10Número máximo de podas (aquellos para los que PrunablePath() es cierto) entries in each viterbi list recorded in BLOB_CHOICEs
idioma_modelo_viterbi_lista_tamaño_max500Tamaño máximo de las listas viterbi registradas en BLOB_CHOICEs
longitud_compuesta_mínima_del_modelo_de_idioma3Longitud mínima de las palabras compuestas
wordrec_display_segmentations0Segmentación de pantallas
tessedit_pageseg_mode6Modo de seg. de página: 0=sólo osd, 1=auto+osd, 2=sólo_auto, 3=auto, 4=columna, 5=block_vert, 6=block, 7=línea, 8=palabra, 9=circulo_palabra, 10=char,11=texto_esparcido, 12=texto_esparcido+osd, 13=línea_cruda (Valores de PageSegMode en tesseract/publictypes.h)
tessedit_ocr_engine_mode2Qué motor(es) de OCR ejecutar (Tesseract, LSTM, ambos). Por defecto se carga y ejecuta el más preciso disponible.
pageseg_devanagari_split_estrategia0Si se debe utilizar el proceso de división de línea superior para los documentos en devanagari al realizar la segmentación de páginas.
ocr_devanagari_split_strategy0Si se debe utilizar el proceso de división en línea superior para los documentos en devanagari al realizar la ocr.
bidi_debug0Nivel de depuración para BiDi
applybox_debug1Nivel de depuración
applybox_page0Número de página desde el que aplicar las casillas
tessedit_bigram_debug0Cantidad de salida de depuración para la corrección de bigramas.
debug_noise_removal0Depuración de la reasignación de pequeños contornos
ruido_maxperblob8Máximo de diacríticos a aplicar a una nota
ruido_maxperpalabra16Máximo de diacríticos a aplicar a una palabra
debug_x_ht_level0Reestimar depuración
calidad_minima_inicial_alfa_reqd2alfas en una buena palabra
tessedit_tess_adaption_mode39Algoritmo de decisión de adaptación para tess
multilang_debug_level0Imprimir información de depuración multilingüe.
párrafo_debug_level0Imprimir información de depuración de párrafos.
tessedit_preserve_min_wd_len2Sólo preservar wds más largo que esto
crunch_rating_max10Para longitud adj en rating por ch
crunch_pot_indicators1Cuántos indicadores potenciales se necesitan
crunch_leave_lc_strings4No machaques palabras con minúsculas largas
crunch_leave_uc_strings4No machaques palabras con minúsculas largas
crunch_repeticiones_largas3Palabras con repeticiones largas
crunch_debug0Como dice
fixsp_non_noise_limit1¿Cuántos blbs sin ruido a cada lado?
fixsp_done_mode1Lo que constituye el espaciado
debug_fix_space_level0Depuración del espacio fijo contextual
x_ht_acceptance_tolerance8Desviación máxima permitida de la parte superior de la mancha fuera de los datos de la fuente
x_ht_min_change8Cambio mínimo en xht antes de probarlo
superíndice_depuración0Nivel de depuración for sub & superscript fixer
jpg_calidad85Establecer el nivel de calidad JPEG
ppp_definidos_por_usuario0Especificar PPP para la imagen de entrada
min_characters_to_try50Especificar el mínimo de caracteres a intentar durante la OSD
nivel_sospechoso99Nivel del marcador sospechoso
palabras_cortas_sospechosas2No sospeche dict wds más largo que este
tessedit_reject_mode0Algoritmo de rechazo
tessedit_image_border2Rej blbs cerca del límite del borde de la imagen
min_sane_x_ht_pixels8Rechaza cualquier x-ht lt o eq que este
tessedit_page_number-1-1 -> Todas las páginas, sino página específica a procesar
tessedit_parallelize1Correr en paralelo siempre que sea posible
lstm_choice_mode2Permite incluir opciones de símbolos alternativos en la salida del hOCR. Los valores de entrada válidos son 0, 1 y 2. 0 es el valor por defecto. Con 1 se incluyen las opciones de símbolos alternativos por paso de tiempo. Con 2, las opciones de símbolos alternativos se extraen del proceso CTC en lugar de la red. Las opciones se asignan por carácter.
lstm_choice_iterations5Establece el número de iteraciones en cascada para el Beamsearch en lstm_choice_mode. Tenga en cuenta que lstm_choice_mode debe tener un valor superior a 0 para producir resultados.
tosp_debug_level0Depurar datos
tosp_espacio_suficiente_muestras_para_mediana3o deberíamos utilizar la media
tosp_redo_kern_limit10Número de muestras necesarias para reestimar la fila
tosp_pocas_muestras40No.gaps reqd con 1 gran brecha para tratar como una tabla
tosp_short_row20No.gaps reqd with few cert spaces to use certs
tosp_sanity_method1Cómo evitar ser tonto
textord_max_noise_size7Tamaño en píxeles del ruido
textord_baseline_debug0Nivel de depuración inicial
textord_noise_sizefraction10Fracción de tamaño para los máximos
textord_noise_translimit16Transiciones para una mancha normal
textord_noise_sncount1super norm blobs para guardar fila
utilizar_ambigs_para_adaptación0Utiliza ambigs para decidir si te adaptas a un personaje
allow_blob_division1Utilizar trozos divisibles
priorizar_división0Priorizar la división de manchas sobre el troceado
clasificar_activar_aprendizaje1Activar el clasificador adaptativo
tess_cn_matching0Coincidencia normalizada de caracteres
tess_bn_matching0Coincidencia normalizada de referencia
classify_enable_adaptive_matcher1Activar el clasificador adaptativo
clasificar_utilizar_plantillas_preadaptadas0Utilizar plantillas de clasificación preadaptadas
clasificar_guardar_plantillas_adaptadas0Guardar plantillas adaptadas en un archivo
classify_enable_adaptive_debugger0Activar el depurador de partidos
clasificar_norma_no_lineal0Normalización no lineal de la densidad del trazo
disable_character_fragments1No incluir fragmentos de caracteres en los resultados del clasificador
classify_debug_character_fragments0Mostrar ventanas de depuración gráfica para la formación de fragmentos
matcher_debug_separate_windows0Utiliza dos ventanas diferentes para depurar la concordancia: una para los protos y otra para las características.
classify_bln_numeric_mode0Supongamos que la entrada son números [0-9].
load_system_dawg1Sistema de carga palabra dawg.
load_freq_dawg1Carga frecuente palabra dawg.
carga_unambig_dawg1Cargar sin ambigüedades la palabra dawg.
load_punc_dawg1Carga dawg con patrones de puntuación.
load_number_dawg1Cargar dawg con patrones numéricos.
load_bigram_dawg1Carga dawg con bigramas de palabras especiales.
use_only_first_uft8_step0Utiliza sólo el primer paso UTF8 de la cadena dada al calcular las probabilidades de registro.
stopper_no_acceptable_choices0Hacer que AcceptableChoice() devuelva siempre false. Útil cuando es necesario explorar todas las segmentaciones.
segment_nonalphabetic_script0No utilice trucos específicos para alfabetos. Establecer a true en el archivo de configuración de traineddata para escrituras que son cursivas o inherentemente de tono fijo.
guardar_doc_palabras0Guardar palabras del documento
fusionar_fragmentos_en_matriz1Fusionar los fragmentos en la matriz de valoraciones y eliminarlos tras la fusión
wordrec_enable_assoc1Habilitación del Asociador
force_word_assoc0fuerza al asociador a ejecutarse independientemente de cuál sea enable_assoc. Se utiliza para CJK cuando es necesario agrupar componentes.
chop_enable1Habilitar picado
chop_vertical_creep0Fluencia vertical
chop_new_seam_pile1Utilizar nueva seam_pile
assume_fixed_pitch_char_segment0incluir la heurística del tono fijo en la segmentación de los caracteres
wordrec_skip_no_truth_words0Ejecutar OCR sólo para palabras que tenían verdad registrada en BlamerBundle
wordrec_debug_blamer0Imprimir mensajes de depuración de blamer
wordrec_run_blamer0Intentar echar la culpa de los errores
save_alt_choices1Guardar rutas alternativas encontradas durante la búsqueda de troceado y segmentación
modelo_de_lengua_ngrama_on0Activar/desactivar el uso del modelo de ngramas de caracteres
modelo_de_lengua_uso_de_ngramas only_first_uft8_step0Utiliza sólo el primer paso UTF8 de la cadena dada al calcular las probabilidades de registro.
modelo_de_lengua_espacio_de_ngramas delimited_language1Las palabras están delimitadas por espacios
modelo_de_lenguaje_utilizar_certidumbre_sigmoidal0Utilizar la puntuación sigmoidal para la certeza
tessedit_resegment_from_boxes0Tomar segmentación y etiquetado del fichero de cajas
tessedit_resegment_from_line_boxes0Conversión de archivo de buzón de texto/línea a archivo de buzón de caracteres
tessedit_train_from_boxes0Generar datos de entrenamiento a partir de caracteres en caja
tessedit_hacer_cajas_de_cajas0Generar más cajas a partir de caracteres en caja
tessedit_train_line_recognizer0Divida la entrada en líneas y reasigne las casillas si las hay
tessedit_dump_pageseg_images0Volcado de imágenes intermedias realizadas durante la segmentación de páginas
tessedit_do_invert1Prueba a invertir la imagen en `LSTMRecognizeWord`.
tessedit_ambigs_training0Realizar formación sobre ambigüedades
tessedit_adaption_debug0Generar e imprimir información de depuración para la adaptación
applybox_learn_chars_and_char_frags_mode0Aprende tanto fragmentos de caracteres (como se hace en el modo especial de baja exposición) como caracteres sin fragmentar.
applybox_learn_ngrams_mode0Se supone que cada cuadro delimitador contiene ngramas. Sólo se aprenden los ngramas cuyos contornos se solapan horizontalmente.
tessedit_display_outwords0Dibujar palabras de salida
tessedit_dump_choices0Opciones de volcado
tessedit_timing_debug0Imprimir estadísticas de tiempo
tessedit_fix_fuzzy_spaces1Intentar mejorar los espacios difusos
tessedit_unrej_any_wd0No se moleste con la palabra plausibilidad
tessedit_fix_hyphens1¿Crujir guiones dobles?
tessedit_enable_doc_dict1Añadir palabras al diccionario del documento
tessedit_debug_fonts0Información de fuente de salida por carácter
tessedit_debug_block_rejection0Estadísticas de bloques y filas
tessedit_enable_bigram_correction1Habilitar la corrección basada en el diccionario de bigramas de palabras.
tessedit_enable_dict_correction0Activar la corrección de una sola palabra basada en el diccionario.
enable_noise_removal1Eliminar y reasignar condicionalmente pequeños contornos cuando confunden el análisis del trazado, determinando diacríticos frente a ruido.
tessedit_minimal_rej_pass10Rechazo mínimo en la salida del paso 1
tessedit_test_adaption0Criterios de adaptación de las pruebas
test_pt0Prueba de punto
párrafo_basado_en_texto1Ejecutar la detección de párrafos en el post-reconocimiento de texto (más preciso)
lstm_utilizar_matriz1Utilizar la búsqueda de matrices/haces con lstm
tessedit_buena_calidad_unrej1Reducir el rechazo de buenos documentos
tessedit_use_reject_spaces1¿Rechazar espacios?
tessedit_preserve_blk_rej_perfect_wds1Rechazar sólo palabras parcialmente rechazadas en bloque
tessedit_preserve_row_rej_perfect_wds1Rechazar sólo palabras parcialmente rechazadas
tessedit_dont_blkrej_good_wds0Utilizar la métrica de calidad de segmentación de palabras
tessedit_dont_rowrej_good_wds0Utilizar la métrica de calidad de segmentación de palabras
tessedit_row_rej_good_docs1Aplicar el rechazo de filas a los buenos documentos
tessedit_reject_bad_qual_wds1Rechazar todos los wds de mala calidad
tessedit_debug_doc_rejection0Estadísticas de la página
tessedit_debug_quality_metrics0Salida de datos al archivo de depuración
bland_unrej0unrej potencial sin controles
unlv_tilde_crunching0Marca v.bad palabras para tilde crunch
hocr_font_info0Añadir información de fuentes a la salida hocr
hocr_char_boxes0Añade las coordenadas de cada carácter a la salida hocr
crunch_early_merge_tess_fails1¿Antes de la crisis de las palabras?
crunch_early_convert_bad_unlv_chs0¿Sacar ~^ temprano?
crunch_terrible_garbage1Como dice
crunch_leave_ok_strings1No toques cuerdas sensibles
crunch_accept_ok1Utilizar la aceptabilidad en okstring
crunch_leave_accept_strings0No crujan las cuerdas sensibles
crunch_include_numerals0Figuras alfa del violín
tessedit_prefer_joined_punct0La puntuación se une a la recompensa
tessedit_write_block_separators0Escribir separadores de bloque en la salida
tessedit_write_rep_codes0Escribir código char de repetición
tessedit_write_unlv0Escribir archivo de salida .unlv
tessedit_create_txt0Escribir archivo de salida .txt
tessedit_create_hocr0Escribir archivo de salida .html hOCR
tessedit_create_alto0Escribir archivo .xml ALTO
tessedit_create_lstmbox0Escribir archivo .box para entrenamiento LSTM
tessedit_create_tsv0Escribir archivo de salida .tsv
tessedit_create_wordstrbox0Escribir archivo de salida .box en formato WordStr
tessedit_crear_pdf0Escribir archivo de salida .pdf
textonly_pdf0Crear PDF con una sola capa de texto invisible
suspect_constrain_1Il0UNLV mantener 1Il cartas rechazadas
tessedit_minimal_rejection0Sólo rechaza los fallos de Tess
tessedit_zero_rejection0No rechaces NADA
tessedit_palabra_por_palabra0Hacer que la salida tenga exactamente una palabra por WERD
tessedit_zero_kelvin_rejection0No rechaces NADA AT ALL
tessedit_rejection_debug0Adaptación depuración
tessedit_flip_0O1Contextual 0O O0 flips
rej_trust_doc_dawg0Use DOC dawg en 11l conf. detector
rej_1Il_use_dict_word0Utilizar la prueba dictword
rej_1Il_trust_permuter_type1No compruebe dos veces
rej_use_tess_accepted1Control de rechazo individual
rej_use_tess_blanks1Control de rechazo individual
rej_use_good_perm1Control de rechazo individual
rej_use_sensible_wd0Ampliar la comprobación permutante
rej_alphas_in_number_perm0Ampliar la comprobación permutante
tessedit_create_boxfile0Salida de texto con recuadros
tessedit_write_images0Capturar la imagen del IPE
modo_visualización_interactiva0¿Se ejecuta de forma interactiva?
tessedit_override_permuter1Según dict_word
tessedit_use_primary_params_model0En modo multilingüe, utilice el modelo params de la lengua principal
textord_tabfind_show_vlines0Localización de líneas de depuración
textord_use_cjk_fp_model0Utilizar el modelo de paso fijo CJK
poly_allow_detailed_fx0Permitir que los extractores de características vean el contorno original
tessedit_init_config_only0Sólo inicializar con el archivo de configuración. Útil si la instancia no se va a utilizar para el OCR, sino para el análisis del diseño.
textord_equation_detect0Encender el detector de ecuaciones
textord_tabfind_vertical_text1Activar la detección vertical
textord_tabfind_force_vertical_text0Forzar el uso del modo de página de texto vertical
preservar_espacios_entre_palabras0Conservar múltiples espacios entre palabras
pageseg_apply_music_mask1Detectar el pentagrama musical y eliminar los componentes de intersección
textord_single_height_mode0El script no tiene xheight, así que usa un único modo
tosp_old_to_method0¿Las estadísticas espaciales utilizan prechopping?
tosp_old_to_constrain_sp_kn0Limitar los valores relativos de los espacios inter e intrapalabra para old_to_method.
tosp_only_use_prop_rows1¿Bloquea estadísticas para utilizar filas de paso fijo?
tosp_force_wordbreak_on_punct0Forzar saltos de palabra en punct para romper líneas largas en langs no delimitados por espacios.
tosp_use_pre_chopping0¿Las estadísticas espaciales utilizan prechopping?
tosp_old_to_bug_fix0Corrección de un posible error en el código antiguo
tosp_block_use_cert_spaces1Sólo stat espacios OBVIOSOS
tosp_row_use_cert_spaces1Sólo stat espacios OBVIOSOS
tosp_narrow_blobs_not_cert1Sólo stat espacios OBVIOSOS
tosp_row_use_cert_spaces11Sólo stat espacios OBVIOSOS
tosp_recovery_isolated_row_stats1Utilizar la fila sola cuando los espacios de cert sean inadecuados
tosp_only_small_gaps_for_kern0Mejor adivinar
tosp_all_flips_fuzzy0¿Pasar CUALQUIER voltereta al contexto?
tosp_fuzzy_limit_all1No restringir el límite difuso kn->sp a las tablas
tosp_stats_use_xht_gaps1Utilizar dentro del espacio xht para las roturas wd
tosp_use_xht_gaps1Utilizar dentro del espacio xht para las roturas wd
tosp_only_use_xht_gaps0Utilizar sólo dentro del espacio xht para roturas wd
tosp_rule_9_test_punct0No chng kn a espacio junto a punct
tosp_flip_fuzz_kn_to_sp1Voltear por defecto
tosp_flip_fuzz_sp_to_kn1Voltear por defecto
tosp_improve_thresh0Habilitar la heurística de mejora
textord_no_rejects0No elimine las manchas de ruido
textord_show_blobs0Visualizar blobs sin clasificar
textord_show_boxes0Visualizar blobs sin clasificar
textord_noise_rejwords1Rechazar palabras ruidosas
textord_noise_rejrows1Rechazar filas con ruido
textord_noise_debug0Depurar el detector de basura de filas
classify_learn_debug_strClase str para depurar el aprendizaje
archivo_palabras_usuarioUn nombre de archivo de palabras proporcionadas por el usuario.
palabras_usuario_suffixUn sufijo de palabras proporcionadas por el usuario y ubicadas en tessdata.
archivo_patrones_usuarioUn nombre de archivo de patrones proporcionados por el usuario.
usuario_patrones_suffixUn sufijo de patrones proporcionados por el usuario ubicados en tessdata.
output_ambig_words_fileArchivo de salida para las ambigüedades encontradas en el diccionario
palabra_a_depurarPalabra para la que debe imprimirse la información de depuración del tapón en stdout
tessedit_char_blacklistLista negra de caracteres no reconocibles
tessedit_char_whitelistLista blanca de caracteres a reconocer
tessedit_char_unblacklistLista de caracteres a anular tessedit_char_blacklist
tessedit_write_params_to_fileEscribe todos los parámetros en el archivo dado.
applybox_exposure_pattern.expEl valor de exposición sigue este patrón en el nombre del archivo de imagen. Se espera que el nombre de los archivos de imagen tenga la forma [lang].[fontname].exp [num].tif
chs_leading_punct ('`"Puntuación inicial
chs_trailing_punct1¡).,;:?!1ª Puntuación final
chs_trailing_punct2 )'`"2º Puntuación final
contornos_impares%Número no estándar de esquemas
outlines_2 ij!?%":;Número no estándar de esquemas
puntuación_numérica.,Punct. chs esperados DENTRO de los números
carácter_no_reconocidoCarácter de salida para las manchas no identificadas
ok_repeated_ch_non_alphanum_wds-?*=Permitir que NN se unrej
conflict_set_I_l_1Il1 []Conjunto de conflictos Il1
tipo_archivo.tifExtensión del archivo
tessedit_load_sublangsLista de idiomas para cargar con éste
separador_páginaSeparador de página (por defecto es el carácter de control de avance de página)
classify_char_norm_range0.2Rango de normalización de caracteres ...
classify_max_rating_ratio1.5Relación de veto entre clasificaciones
classify_max_certainty_margin5.5Diferencia de veto entre las certezas del clasificador
matcher_good_threshold0.125Buen partido (0-1)
matcher_reliable_adaptive_result0Gran partido (0-1)
matcher_perfect_threshold0.02Combinación perfecta (0-1)
matcher_bad_match_pad0.15Bad Match Pad (0-1)
matcher_rating_margin0.1Margen de la nueva plantilla (0-1)
matcher_avg_noise_size12Longitud media de la mancha de ruido
matcher_clustering_max_angle_delta0.015Ángulo delta máximo para la agrupación de prototipos
classify_misfit_junk_penalty0Penalización a aplicar cuando un no-alnum está verticalmente fuera de su posición de línea de texto esperada.
escala_calificación1.5Factor de escala de calificación
escala_certeza20Factor de escala de certidumbre
tessedit_class_miss_scale0.00390625Factor de escala para características no utilizadas
classify_adapted_pruning_factor2.5Podar los malos resultados adaptados esta mucho peor que el mejor resultado
classify_adapted_pruning_threshold (clasificar umbral de poda adaptado)-1Umbral a partir del cual comienza classify_adapted_pruning_factor
clasificar_fragmentos_caracteres garbage_certainty_threshold-3Excluir de la formación y la adaptación los fragmentos que no se parezcan a personajes enteros.
moteado_gran_tamaño_max0.3Tamaño máximo del moteado
penalización del índice de moteado10Penalización a añadir a la peor calificación por ruido
xheight_penalty_subscripts0.125Penalización de puntuación (0,1 = 10%) añadida si hay subíndices o superíndices en una palabra, pero por lo demás está bien.
xheight_penalty_inconsistent0.25Penalización de puntuación (0,1 = 10%) añadida si una altura x es incoherente.
segment_penalty_dict_frequent_word1Multiplicador de puntuación para las coincidencias de palabras que tienen un buen caso y son frecuentes en el idioma dado (cuanto más bajo, mejor).
segment_penalty_dict_case_ok1.1Multiplicador de puntuación para coincidencias de palabras que tengan mayúsculas y minúsculas (cuanto más bajo, mejor).
segmento_penalty_dict_case_bad1.3125Multiplicador de puntuación por defecto para las coincidencias de palabras, que puede tener problemas de mayúsculas y minúsculas (cuanto más bajo, mejor).
segmento_penalty_dict_nonword1.25Multiplicador de puntuación para las segmentaciones de fragmentos de glifos que no coinciden con una palabra del diccionario (cuanto más bajo, mejor).
segmento_penalty_garbage1.5Multiplicador de puntuación para las cadenas mal escritas que no están en el diccionario y que, en general, parecen basura (cuanto más bajo, mejor).
escala_certeza20Factor de escala de certidumbre
stopper_nondict_certainty_base-2.5Umbral de certeza para palabras no diccionarias
stopper_phase2_certainty_rejection_offset1Rechazar la compensación de certeza
tapón_certeza_por_carácter-0.5Certeza de añadir para cada dict char por encima de tamaño de palabra pequeño.
stopper_allowable_character_badness3Máxima variación de certeza permitida en una palabra (en sigma)
doc_dict_pending_threshold0La peor certeza para usar el diccionario pendiente
doc_dict_certeza_umbral-2.25Peor certeza para las palabras que pueden insertarse en el diccionario del documento
tessedit_certeza_umbral-2.25Buen límite de manchas
chop_split_dist_knob0.5Ajuste de la longitud de división
pomo_superpuesto0.9Ajuste de solapamiento dividido
pomo_central0.15Ajuste central dividido
pomo_afilado0.06Ajuste de la nitidez de división
pomo_cambio_ancho_cortado5Ajuste de cambio de anchura
chop_ok_split100Límite de división OK
chop_good_split50Buen límite de división
segsearch_max_char_wh_ratio2Relación máxima entre la anchura y la altura de los caracteres