Wie man den Iron Tesseract verwendet

This article was translated from English: Does it need improvement?
Translated
View the article in English

IronOCR bietet eine intuitive API für die Nutzung des angepassten und optimierten Tesseract 5, bekannt als Iron Tesseract. Mit IronOCR und IronTesseract können Sie Textbilder und gescannte Dokumente in Text und durchsuchbare PDFs umwandeln.

C# NuGet-Bibliothek für OCR

Installieren mit NuGet

Install-Package IronOcr
oder
Java PDF JAR

Herunterladen DLL

DLL herunterladen

Manuelle Installation in Ihr Projekt

C# NuGet-Bibliothek für OCR

Installieren mit NuGet

Install-Package IronOcr
oder
Java PDF JAR

Herunterladen DLL

DLL herunterladen

Manuelle Installation in Ihr Projekt

Fangen Sie noch heute an, IronPDF in Ihrem Projekt mit einer kostenlosen Testversion zu verwenden.

Erster Schritt:
green arrow pointer

Schau dir an IronOCR an Nuget Für schnelle Installation und Bereitstellung. Mit über 8 Millionen Downloads verwandelt es OCR mit C#.

C# NuGet-Bibliothek für OCR nuget.org/packages/IronOcr/
Install-Package IronOcr

Erwägen Sie die Installation der IronOCR DLL direkt. Laden Sie es herunter und installieren Sie es manuell für Ihr Projekt oder die GAC-Form: IronOcr.zip

Manuelle Installation in Ihr Projekt

DLL herunterladen

Erstellen einer IronTesseract-Instanz

Initialisieren Sie einfach ein Tesseract-Objekt wie folgt:

:path=/static-assets/ocr/content-code-examples/how-to/irontesseract-initialize-irontesseract.cs
using IronOcr;

IronTesseract ocr = new IronTesseract();
IRON VB CONVERTER ERROR developers@ironsoftware.com
VB   C#

Sie können das Verhalten von IronTesseract anpassen, indem Sie verschiedene Sprachen auswählen, das Lesen von Barcodes aktivieren und Zeichen auf die Whitelist oder die Blacklist setzen:

:path=/static-assets/ocr/content-code-examples/how-to/irontesseract-configure-irontesseract.cs
IronTesseract ocr = new IronTesseract
{
    Configuration = new TesseractConfiguration
    {
        ReadBarCodes = false,
        RenderHocr = true,
        TesseractVariables = null,
        WhiteListCharacters = null,
        BlackListCharacters = "`ë|^",
    },
    MultiThreaded = false,
    Language = OcrLanguage.English,
    EnableTesseractConsoleMessages = true, // False as default
};
Dim ocr As New IronTesseract With {
	.Configuration = New TesseractConfiguration With {
		.ReadBarCodes = False,
		.RenderHocr = True,
		.TesseractVariables = Nothing,
		.WhiteListCharacters = Nothing,
		.BlackListCharacters = "`ë|^"
	},
	.MultiThreaded = False,
	.Language = OcrLanguage.English,
	.EnableTesseractConsoleMessages = True
}
VB   C#

Danach können Sie die Tesseract-Funktionalität zum Lesen von "OcrInput"-Objekten nutzen:

:path=/static-assets/ocr/content-code-examples/how-to/irontesseract-read.cs
IronTesseract ocr = new IronTesseract();

using OcrInput input = new OcrInput();
input.LoadImage("attachment.png");
OcrResult result = ocr.Read(input);
string text = result.Text;
Dim ocr As New IronTesseract()

Using input As New OcrInput()
	input.LoadImage("attachment.png")
	Dim result As OcrResult = ocr.Read(input)
	Dim text As String = result.Text
End Using
VB   C#

Erweiterte Tesseract-Konfigurationsvariablen

Die IronOcr Tesseract-Schnittstelle ermöglicht die vollständige Kontrolle der Tesseract-Konfigurationsvariablen durch die IronOcr.TesseractConfiguration-Klasse

Beispiel für Tesseract-Konfigurationscode

:path=/static-assets/ocr/content-code-examples/how-to/irontesseract-tesseract-configuration.cs
using IronOcr;
using System;

IronTesseract Ocr = new IronTesseract();

Ocr.Language = OcrLanguage.English;
Ocr.Configuration.PageSegmentationMode = TesseractPageSegmentationMode.AutoOsd;

// Configure Tesseract Engine
Ocr.Configuration.TesseractVariables["tessedit_parallelize"] = false;

using var input = new OcrInput();
input.LoadImage("/path/file.png");

OcrResult Result = Ocr.Read(input);
Console.WriteLine(Result.Text);
Imports IronOcr
Imports System

Private Ocr As New IronTesseract()

Ocr.Language = OcrLanguage.English
Ocr.Configuration.PageSegmentationMode = TesseractPageSegmentationMode.AutoOsd

' Configure Tesseract Engine
Ocr.Configuration.TesseractVariables("tessedit_parallelize") = False

Dim input = New OcrInput()
input.LoadImage("/path/file.png")

Dim Result As OcrResult = Ocr.Read(input)
Console.WriteLine(Result.Text)
VB   C#

Liste aller Tesseract-Konfigurationsvariablen

Diese können mit IronTesseract.Configuration.TesseractVariables' gesetzt werden["Schlüssel"] = Wert;

Tesseract-Konfigurationsvariable Standard Bedeutung
classify_num_cp_levels3Anzahl der Stufen des Klassenschneiders
textord_debug_tabfind0Suche auf der Registerkarte Debug
textord_debug_bugs0Ausgabe von Fehlern bei der Registersuche einschalten
textord_testregion_links-1Linker Rand des Rechtecks für Debugmeldungen
textord_testregion_top-1Oberer Rand des Rechtecks für die Fehlerberichterstattung
textord_testregion_rechts2147483647Rechter Rand des Debug-Rechtecks
textord_testregion_unten2147483647Unterer Rand des Debug-Rechtecks
textord_tabfind_show_partitions0Partitionsgrenzen anzeigen, warten, wenn >1
devanagari_split_debuglevel0Debug-Ebene für den geteilten Shiro-Rekha-Prozess.
edges_max_children_per_outline10Maximale Anzahl von Kindern innerhalb einer Zeichenkontur
edges_max_children_layers5Maximale Anzahl verschachtelter Kinder innerhalb einer Zeichenkontur
edges_children_per_grandchild10Wichtigkeitsverhältnis für Spannkonturen
edges_children_count_limit45Maximal zulässige Löcher im Blob
kanten_min_nicht-loch12Mindestpixel für potenzielle Zeichen in der Box
kanten_patharea_ratio40Max. Linsenquadrat/Fläche für akzeptable Kinderumrisse
textord_fp_chop_error2Maximal zulässige Biegung der Häckselzellen
textord_tabfind_show_images0Bildkleckse anzeigen
textord_skewsmooth_offset4Für glatten Faktor
textord_skewsmooth_offset21Für glatten Faktor
textord_test_x-2147483647koordinate des Testpunkts
textord_test_y-2147483647koordinate des Testpunkts
textord_min_blobs_in_row4Min. Blobs vor Gradient gezählt
textord_spline_minblobs8Min. Blobs in jedem Spline-Segment
textord_spline_medianwin6Größe des Fensters für die Spline-Segmentierung
textord_max_blob_overlaps4Maximale Anzahl von Blobs, die ein großer Blob überlappen kann
textord_min_xheight10Min. glaubwürdiges Pixel xheight
textord_lms_line_trials12Anzahl der zu erledigenden Linienanpassungen
oldbl_holed_losscount10Maximaler Verlust vor Verwendung der Ausweichleitung
pitsync_linear_version6Neuen schnellen Algorithmus verwenden
pitsync_fake_depth1Maximale Vorab-Erzeugung von Fälschungen
textord_tabfind_show_strokewidths0Strichstärken anzeigen
textord_dotmatrix_gap3Maximaler Pixelabstand bei gebrochenem Raster
textord_debug_block0Block zum Debuggen von
textord_pitch_range2Test der maximalen Reichweite auf dem Spielfeld
textord_words_veto_power5Erforderliche Zeilen, um ein Veto zu überstimmen
gleichungerkennen_speichern_bi_bild0Speichern des eingegebenen Bi-Bildes
equationdetect_save_spt_image0Sonderzeichenbild speichern
equationdetect_save_seed_image0Speichern Sie das Startbild
equationdetect_save_merged_image0Speichern Sie das zusammengefügte Bild
poly_debug0Altes Poly debuggen
poly_wide_objects_better1Genauere Annäherung an weite Dinge
wordrec_display_splits0Splits anzeigen
textord_debug_printable0Debug-Fenster druckbar machen
textord_space_size_is_variable0Bei "true" wird angenommen, dass die Worttrennzeichen eine variable Breite haben, auch wenn die Zeichen einen festen Abstand haben.
textord_tabfind_show_initial_partitions0Partitionsgrenzen anzeigen
textord_tabfind_show_reject_blobs0Als Lärm zurückgewiesene Blobs anzeigen
textord_tabfind_show_columns0Spaltenbegrenzungen anzeigen
textord_tabfind_show_blocks0Endgültige Blockgrenzen anzeigen
textord_tabfind_find_tables1erkennung von Lauftabellen
devanagari_split_debugimage0Ob ein Debug-Image für den geteilten shiro-rekha-Prozess erstellt werden soll.
textord_show_fixed_cuts0Zeichnen von Zellengrenzen mit festem Abstand
kanten_benutzen_neue_aussenlinie_komplexität0Verwenden Sie das neue Modul für die Gliederungskomplexität
kanten_debug0die Fehlersuche für dieses Modul einschalten
kanten_Kinder_fix0Boxige Eltern von charähnlichen Kindern entfernen
gapmap_debug0Sagen, welche Blöcke Tabellen haben
gapmap_use_ends0Großes Leerzeichen am Anfang und Ende der Zeilen verwenden
gapmap_kein_isoliertes_Quantum0Sicherstellen, dass die Lücken nicht weniger als 2 Quanten breit sind
textord_heavy_nr0Lärm energisch entfernen
textord_show_initial_rows0Zeilenakkumulation anzeigen
textord_show_parallel_rows0Seitenbezogene Zeilen anzeigen
textord_show_expanded_rows0Zeilen nach dem Expandieren anzeigen
textord_show_final_rows0Zeilen nach der endgültigen Anpassung anzeigen
textord_show_final_blobs0Blob-Grenzen nach Pre-Ass anzeigen
textord_test_landscape0Tests beziehen sich auf Land/Hafen
textord_parallel_baselines1Parallele Grundlinien erzwingen
textord_gerade_baselines0Gerade Grundlinien erzwingen
textord_alt_baselines1Alten Basisalgorithmus verwenden
textord_old_xheight0Alten xheight-Algorithmus verwenden
textord_fix_xheight_bug1Spline-Basislinie verwenden
textord_fix_makerow_bug1Verhindern mehrerer Baselines
textord_debug_xheights0Test der xheight-Algorithmen
textord_biased_skewcalc1Schätzungen der Verzerrung mit der Linienlänge
textord_interpolating_skew1Interpolieren über Lücken hinweg
textord_new_initial_xheight1Testmechanismus xheight verwenden
textord_debug_blob0Testblob-Informationen drucken
textord_really_old_xheight0Ursprüngliches Wiseowl xheight verwenden
textord_oldbl_debug0Debuggen der alten Baseline-Generierung
textord_debug_baselines0Erzeugung einer Debug-Basislinie
textord_oldbl_paradef1Para-Standard-Mechanismus verwenden
textord_oldbl_split_splines1Geteilte Stufenverzahnung
textord_oldbl_merge_parts1Verdächtige Partitionen zusammenführen
oldbl_corrfix1Verbesserung der Korrelation von Höhen
oldbl_xhfix0Fehler in den Modi Schwellenwert für xHöhen beheben
textord_ocropus_mode0Basislinien für Ocropus erstellen
textord_tabfind_only_strokewidths0Nur Strichstärken ausführen
textord_tabfind_show_initialtabs0Registerkarte Kandidaten anzeigen
textord_tabfind_show_finaltabs0Registerkarte Vektoren anzeigen
textord_show_tables0Tabellenregionen anzeigen
textord_tablefind_show_mark0Debugging-Tabelle Markierungsschritte im Detail
textord_tablefind_show_stats0Seitenstatistiken für die Tabellensuche anzeigen
textord_tablefind_recognize_tables0Aktiviert den Tabellenerkenner für das Tabellenlayout und die Filterung.
textord_all_prop0Alle Dokumente sind proportionaler Text
textord_debug_pitch_test0Fehlersuche beim Test mit festem Abstand
textord_disable_pitch_test0Ausschalten des dp-Algorithmus für feste Tonhöhen
textord_fast_pitch_test0Noch schnellerer Pitch-Algorithmus
textord_debug_pitch_metric0Vollständig metrisches Material schreiben
textord_show_row_cuts0Schnitte auf Zeilenebene zeichnen
textord_show_page_cuts0Schnitte auf Seitenebene zeichnen
textord_pitch_cheat0Richtige Antwort für fest/prop verwenden
textord_blockndoc_fixed0Ganzes Dokument/Block mit festem Abstand anstreben
textord_show_initial_words0Separate Wörter anzeigen
textord_show_new_words0Separate Wörter anzeigen
textord_show_fixed_words0Anzeige erzwungener Wörter mit fester Tonhöhe
textord_blocksall_fixed0Stöhnen über Stützenblöcke
textord_blocksall_prop0Stöhnen über feste Tonhöhenblöcke
textord_blocksall_testing0Statistiken beim Jammern wegwerfen
textord_test_mode0Stromtest durchführen
textord_pitch_scalebigwords0Skalenwerte für große Wörter
textord_restore_underlines1Unterstreichungen abschneiden und wieder einsetzen
textord_fp_chopping1Häckseln mit festem Abstand
textord_force_make_prop_words0Proportionale Wortsegmentierung für alle Zeilen erzwingen
textord_chopper_test0Der Chopper wird getestet.
wordrec_display_all_blobs0Blobs anzeigen
wordrec_blob_pause0Blob-Pause
stream_filelist0Streamen einer Dateiliste von stdin
debug_file Datei zum Senden der tprintf-Ausgabe an
klassifizieren_schrift_nameUnknownFontStandard font name to be used in training
dokument_titel Titel des Ausgabedokuments (wird für die hOCR- und PDF-Ausgabe verwendet)
dotproductautoFunktion für die Berechnung des Punktprodukts
classify_cp_angle_pad_loose45Klasse Pruner Angle Pad Lose
classify_cp_angle_pad_medium20Class Pruner Angle Pad Medium
classify_cp_angle_pad_tight10CLass Pruner Angle Pad Tight
classify_cp_end_pad_loose0.5Klasse Pruner End Pad Lose
klassifizieren_cp_end_pad_medium0.5Klasse Pruner End Pad Medium
klassifizieren_cp_end_pad_tight0.5Klasse Pruner End Pad Tight
classify_cp_side_pad_loose2.5Klasse Pruner Seitenpolster lose
classify_cp_side_pad_medium1.2Klasse Pruner Side Pad Medium
klassifizieren_cp_seite_pad_dicht0.6Klasse Pruner Seite Pad Dicht
classify_pp_angle_pad45Proto Pruner Angle Pad
klassifizieren_pp_end_pad0.5Proto Prune End Pad
klassifizieren_pp_side_pad2.5Proto Pruner Seitenpad
klassifizieren_min_neigung0.414214Steigung, unter der Linien als horizontal bezeichnet werden
klassifizieren_max_neigung2.41421Steigung, ab der Linien als senkrecht bezeichnet werden
classify_norm_adj_midpoint32Norm anpassen Mittelpunkt ...
klassifizieren_norm_adj_curl2Norm einstellen locken ...
classify_pico_feature_length0.05Pico Feature Länge
textord_underline_threshold0.5Anteil der belegten Breite
kanten_Kinderbereich0.5Minimaler Flächenanteil des Kinderumrisses
kanten_boxarea0.875Minimaler Flächenanteil des Enkels für die Box
textord_fp_chop_snap0.5Maximaler Abstand des Kotelettpunkts vom Scheitelpunkt
gapmap_big_gaps1.75xht-Multiplikator
textord_spline_shift_fraction0.02Bruchteil des Zeilenabstands für Quad
textord_spline_ausreißer_fraktion0.1Bruchteil des Zeilenabstands für Ausreißer
textord_skew_ile0.5Ile von Gradienten für Seitenschräglage
textord_skew_lag0.02Verzögerung für Schräglage bei Zeilenakkumulation
textord_linespace_iqrlimit0.2Max. iqr/Median für Linespace
textord_width_limit8Maximale Breite der Blobs zur Bildung von Reihen
textord_chop_width1.5Maximale Breite vor dem Schneiden
textord_expansion_factor1Faktor für die Erweiterung der Zeilen in expand_rows
textord_overlap_x0.375Anteil des Zeilenabstands für eine gute Überlappung
textord_minxh0.25bruchteil der Zeilengröße für minimale x-Höhe
textord_min_linesize1.25* blobhöhe für anfängliche Zeilengröße
textord_excess_blobsize1.3Neue Zeile erstellt, wenn Blob Zeile so groß macht
textord_belegung_schwellenwert0.4Bruchteil der Nachbarschaft
textord_underline_width2Vielfaches von line_size für Unterstreichung
textord_min_blob_height_fraction0.75Minimale Höhe/Oberkante des Blob, um die Oberkante des Blob in die xheight-Statistik einzubeziehen
textord_xheight_mode_fraction0.4Minimale Stapelhöhe, um xHöhe zu erreichen
textord_ascheight_mode_fraction0.08Minimale Stapelhöhe für die Herstellung einer Höhe
textord_descheight_mode_fraction0.08Mindesthöhe des Stapels für die Herstellung der Fallhöhe
textord_ascx_ratio_min1.25Min. Kappe/xHöhe
textord_ascx_ratio_max1.8Maximale Kappe/xHöhe
textord_descx_ratio_min0.25Min desc/xheight
textord_descx_ratio_max0.6Maximaler Abstieg/xHöhe
textord_xheight_error_margin0.1Akzeptierte Variation
oldbl_xhfract0.4Erlaubter Anteil von est in calc
oldbl_dot_error_size1.26Maximales Seitenverhältnis eines Punktes
textord_oldbl_jumplimit0.15X-Fraktion für neue Partition
pitsync_joined_edge0.75Dist innen großer Klecks zum Hacken
pitsync_offset_freecut_fraction0.25Bruchteil des Schnittes bei freien Schnitten
textord_tabvector_vertical_gap_fraction0.5maximal zulässiger Anteil der mittleren Blobbreite für vertikale Lücken im vertikalen Text
textord_tabvector_vertical_box_ratio0.5Bruchteil der Streichhölzer, die erforderlich sind, um eine Linie für senkrecht zu erklären
textord_projektion_skala0.2Abschneiderate für mittlere Schnitte
textord_balance_factor1Ding-Rate für unausgewogene Char-Zellen
textord_wordstats_smooth_factor0.05Glättung von Lückenstatistiken
textord_width_smooth_factor0.1Statistiken über die Glättungsbreite
textord_words_width_ile0.4Ile von Blobbreiten für Raum est
textord_words_maxspace4Vielfaches von xheight
textord_words_default_maxspace3.5Maximal glaubwürdiger dritter Raum
textord_words_default_minspace0.6Bruchteil von xheight
textord_words_min_minspace0.3Bruchteil von xheight
textord_words_default_nonspace0.2Bruchteil von xheight
textord_wörter_einfach_unten0.25Maximale anfängliche Clustergröße
textord_wörter_anfänge_ober0.15Minimaler anfänglicher Abstand zwischen den Clustern
textord_words_minlarge0.75Anteil der benötigten gültigen Lücken
textord_words_pitchsd_threshold0.04Schwellenwert für die Tonhöhensynchronisation
textord_words_def_fixed0.016Schwellenwert für die endgültige Festlegung
textord_words_def_prop0.09Schwellenwert für die endgültige Stütze
textord_pitch_rowsimilarity0.08Bruchteil von xheight for sameness
wörter_einfach_unten0.5Maximale anfängliche Clustergröße
wörter_anfänge_ober0.15Minimaler anfänglicher Abstand zwischen den Clustern
words_default_prop_nonspace0.25Bruchteil von xheight
words_default_fixed_space0.75Bruchteil von xheight
words_default_fixed_limit0.6Zulässige Größenabweichung
textord_words_definite_spread0.3Nicht-unscharfer Abstandsbereich
textord_spacesize_ratiofp2.8Minimalverhältnis Raum/Nichtraum
textord_spacesize_ratioprop2Minimalverhältnis Raum/Nichtraum
textord_fpiqr_ratio1.5Pitch IQR/Gap IQR Schwelle
textord_max_pitch_iqr0.2Xh Bruchteil Lärm in Tonhöhe
textord_fp_min_width0.5Minimale Breite der anständigen Kleckse
textord_unterline_offset0.1Zu ignorierender Bruchteil von x
ambigs_debug_level0Debug-Ebene für unichare Zweideutigkeiten
klassifizieren_debug_level0Klassifizierung der Debug-Ebene
klassifizieren_norm_methode1Normalisierungsmethode ...
matcher_debug_level0Matcher Debug Level
matcher_debug_flags0Matcher-Debug-Flags
classify_learning_debug_level0Debug Level lernen:
matcher_permanent_classes_min1Mindestanzahl der ständigen Klassen
matcher_min_examples_for_ prototyping3Zuverlässiger Schwellenwert für die Konfiguration
matcher_sufficient_examples_ for_prototyping5Ermöglicht die Anpassung, auch wenn die Mehrdeutigkeiten nicht gesehen wurden
classify_adapt_proto_threshold230Schwellenwert für gute Protos während der adaptiven 0-255
classify_adapt_feature_threshold230Schwellenwert für gute Merkmale während der adaptiven 0-255
classify_class_pruner_threshold229Klasse Pruner Schwellenwert 0-255
klassifizieren_klasse_pruner_multiplikator15Klasse Pruner Multiplikator 0-255:
classify_cp_cutoff_strength7Klasse Pruner CutoffStrength:
klassifizieren_ganzzahliger_Vermittler_Multiplikator10Integer Matcher Multiplikator 0-255:
dawg_debug_level0Setzen Sie den Wert 1 für allgemeine Debug-Informationen, den Wert 2 für mehr Details und den Wert 3, um alle Debug-Meldungen zu sehen
hyphen_debug_level0Debug-Level für Wörter mit Bindestrichen.
stopper_kleinwort_grösse2Größe des Diktatwortes, das als Nicht-Diktatwort behandelt werden soll
stopper_debug_level0Debuglevel des Stoppers
tessedit_truncate_wordchoice_log10Maximal zu behaltende Wörter in der Liste
max_permuter_attempts10000Maximale Anzahl der verschiedenen Zeichen, die bei der Permutation berücksichtigt werden. Diese Grenze ist besonders nützlich, wenn Benutzermuster angegeben werden, da zu allgemeine Muster dazu führen können, dass Dawg Search eine zu große Anzahl von Optionen untersucht.
repair_unchopped_blobs1Nicht zerhackte Kleckse korrigieren
chop_debug0Debuggen hacken
chop_split_length10000Geteilte Länge
chop_same_distance2Gleiche Entfernung
chop_min_outline_points6Minimale Anzahl von Punkten auf der Gliederung
chop_seam_pile_size150Maximale Anzahl von Nähten in seam_pile
chop_inside_angle-50Min. Innenwinkel Biegung
chop_min_outline_area2000Min. Umrissfläche
chop_centered_maxwidth90Breite der (kleineren) geschnittenen Kleckse, bei denen es egal ist, dass ein Stück nicht in der Mitte liegt.
chop_x_y_weight3X / Y Länge Gewicht
wordrec_debug_level0Debuglevel für wordrec
wordrec_max_join_chunks4Maximale Anzahl der zuzuordnenden Bruchstücke
segsearch_debug_level0SegSearch-Debug-Ebene
segsearch_max_pain_points2000Maximale Anzahl der in der Warteschlange gespeicherten Schmerzpunkte
segsearch_max_futile_classifications20Maximale Anzahl von Schmerzpunktklassifizierungen pro Chunk, die nicht zu einer besseren Wortwahl geführt haben.
sprache_modell_debug_level0Sprachmodell-Debuglevel
sprachen_modell_ngramm_ordnung8Maximale Ordnung des Zeichen-Ngramm-Modells
sprache_modell_viterbi_liste_ max_num_prunable10Maximale Anzahl von beschneidbaren (diejenigen, für die PrunablePath() ist wahr) entries in each viterbi list recorded in BLOB_CHOICEs
sprache_modell_viterbi_liste_max_grösse500Maximale Größe der in BLOB_CHOICEs gespeicherten Viterbi-Listen
sprache_modell_min_zusammengesetzte_länge3Mindestlänge von zusammengesetzten Wörtern
wordrec_display_segmentations0Segmentierungen anzeigen
tessedit_pageseg_mode6Seitentrennungsmodus: 0=nurosd, 1=auto+osd, 2=auto_only, 3=auto, 4=column, 5=block_vert, 6=block, 7=line, 8=word, 9=word_circle, 10=char,11=sparse_text, 12=sparse_text+osd, 13=raw_line (Werte aus PageSegMode enum in tesseract/publictypes.h)
tessedit_ocr_engine_mode2Welche OCR-Engine(s) ausgeführt werden soll(en) (Tesseract, LSTM, beide). Es wird standardmäßig die genaueste verfügbare Engine geladen und ausgeführt.
pageseg_devanagari_split_strategy0Ob bei der Seitensegmentierung das Top-Line-Splitting-Verfahren für Devanagari-Dokumente verwendet werden soll.
ocr_devanagari_split_strategy0Ob das Top-Line-Splitting-Verfahren für Devanagari-Dokumente bei der Ausführung von OCR verwendet werden soll.
bidi_debug0Debug-Ebene für BiDi
applybox_debug1Debug-Ebene
applybox_page0Seitenzahl für die Anwendung der Felder von
tessedit_bigram_debug0Umfang der Debug-Ausgabe für die Bigram-Korrektur.
debug_noise_removal0Neuzuweisung von kleinen Umrissen debuggen
noise_maxperblob8Maximal anzuwendende diakritische Zeichen für einen BLOB
noise_maxperword16Maximal zu verwendende diakritische Zeichen für ein Wort
debug_x_ht_level0Neuberechnung der Fehlersuche
quality_min_initial_alphas_reqd2alphas auf ein gutes Wort
tessedit_tess_adaption_mode39Anpassungsentscheidungsalgorithmus für Tess
multilang_debug_level0Multilang-Debug-Informationen ausgeben.
absatz_debug_level0Absatz-Debug-Informationen drucken.
tessedit_preserve_min_wd_len2Nur längerfristig bewahren
crunch_rating_max10Für zusätzliche Länge in der Bewertung pro Kanal
crunch_pot_indikatoren1Wie viele potenzielle Indikatoren werden benötigt?
crunch_leave_lc_strings4Wörter mit langen Kleinbuchstaben nicht unterdrücken
crunch_leave_uc_strings4Wörter mit langen Kleinbuchstaben nicht unterdrücken
crunch_long_repetitions3Knackige Wörter mit langen Wiederholungen
crunch_debug0Wie es heißt
fixsp_geraeuschfrei_limit1Wie viele lärmfreie Blbs auf jeder Seite?
fixsp_done_mode1Was für den Abstand getan wird
debug_fix_space_level0Debuggen des kontextabhängigen Fixbereichs
x_ht_akzeptanz_toleranz8Maximal zulässige Abweichung der Blob-Oberseite außerhalb der Schriftdaten
x_ht_min_change8Minimaländerung in xht vor dem eigentlichen Versuch
superscript_debug0Debug-Ebene for sub & superscript fixer
jpg_Qualität85JPEG-Qualitätsstufe einstellen
benutzer_definiert_dpi0DPI für das Eingabebild festlegen
min_characters_to_try50Legen Sie fest, welche Zeichen während des OSD mindestens versucht werden sollen
verdächtige_ebene99Verdächtiger Markerwert
verdächtige_kurze_Wörter2Verdächtigen Sie dict wds nicht länger als dies
tessedit_reject_mode0Ablehnungsalgorithmus
tessedit_image_border2Rej blbs nahe der Bildrandgrenze
min_sane_x_ht_pixels8Jedes x-ht lt oder eq als dies ablehnen
tessedit_page_number-1-1 -> Alle Seiten, sonst bestimmte zu verarbeitende Seite
tessedit_parallelisieren1Parallelbetrieb, wo möglich
lstm_choice_mode2Ermöglicht die Einbeziehung alternativer Symbolwahlen in die hOCR-Ausgabe. Gültige Eingabewerte sind 0, 1 und 2. 0 ist der Standardwert. Bei 1 werden die alternativen Symbolwahlen pro Zeitschritt einbezogen. Bei 2 werden alternative Symbolwahlen aus dem CTC-Prozess anstelle des Gitters extrahiert. Die Auswahlmöglichkeiten werden pro Zeichen abgebildet.
lstm_choice_iterations5Setzt die Anzahl der kaskadierenden Iterationen für die Beamsearch im lstm_choice_mode. Beachten Sie, dass lstm_choice_mode auf einen Wert größer als 0 gesetzt werden muss, um Ergebnisse zu erzielen.
tosp_debug_level0Debug-Daten
tosp_ausreichend_Stichproben_für_den_Median3oder sollten wir mean verwenden
tosp_redo_kern_limit10Anzahl der Stichproben, die für eine Neuschätzung für eine Zeile erforderlich sind
tosp_wenige_Stichproben40Anzahl der Lücken mit 1 großen Lücke zur Behandlung als Tabelle
tosp_short_row20No.gaps reqd mit wenigen Zertifikatsplätzen zur Verwendung von Zertifikaten
tosp_sanity_method1Wie man Dummheit vermeidet
textord_max_noise_size7Pixelgröße des Rauschens
textord_baseline_debug0Grundlegende Fehlerbehebungsstufe
textord_noise_sizefraction10Bruchteil der Größe für Maxima
textord_noise_translimit16Übergänge für normale Kleckse
textord_noise_sncount1super Norm Blobs zum Speichern von Zeilen
verwendung_von_Ambigs_zur_Anpassung0Verwenden Sie Ambigs, um zu entscheiden, ob Sie sich an ein Zeichen anpassen wollen
allow_blob_division1Teilbare Kleckse zum Hacken verwenden
priorisierung_Aufteilung0Vorrang der Blobteilung vor dem Hacken
klassifizieren_aktivieren_lernen1Adaptiven Klassifikator einschalten
tess_cn_matching0Normalisierter Abgleich von Zeichen
tess_bn_matching0Baseline Normalisiertes Matching
classify_enable_adaptive_matcher1Adaptiven Klassifikator einschalten
classify_use_pre_adapted_templates0Vorgefertigte Klassifikatorvorlagen verwenden
classify_save_adapted_templates0Angepasste Vorlagen in einer Datei speichern
classify_enable_adaptive_debugger0Match-Debugger einschalten
klassifizieren_nichtlinear_norm0Nichtlineare Hubdichtennormierung
zeichen_fragmente_deaktivieren1Zeichenfragmente nicht in die Ergebnisse des Klassifikators aufnehmen
classify_debug_character_fragments0Grafische Debugging-Fenster für das Training von Fragmenten einblenden
matcher_debug_separate_windows0Verwenden Sie zwei verschiedene Fenster zum Debuggen des Matchings: Eines für die Protos und eines für die Features.
klassifizieren_bln_numerisch_mode0Angenommen, die Eingabe besteht aus Zahlen [0-9].
last_system_dawg1Laden Sie das System Wort Dawg.
last_freq_dawg1Häufiges Wort laden.
load_unambig_dawg1Laden Sie das eindeutige Wort Dawg.
load_punc_dawg1Laden Sie Dawg mit Interpunktionsmustern.
load_number_dawg1Lade Dawg mit Zahlenmustern.
last_bigram_dawg1Lade Dawg mit speziellen Wort-Bigrammen.
use_only_first_uft8_step0Verwendet nur den ersten UTF8-Schritt der angegebenen Zeichenkette bei der Berechnung der Protokollwahrscheinlichkeiten.
stopper_keine_akzeptablen_Auswahlen0AcceptableChoice() soll immer false zurückgeben. Nützlich, wenn die Notwendigkeit besteht, alle Segmentierungen zu untersuchen
segment_nonalphabetisch_script0Verwenden Sie keine alphabetisch spezifischen Tricks. In der Konfigurationsdatei von traineddata auf true setzen, wenn es sich um kursive Schriften oder Schriften mit festem Zeichenabstand handelt
dokumente_Wörter_speichern0Dokument Wörter speichern
fragmente_in_der_Matrix_zusammenführen1Zusammenführen der Fragmente in der Bewertungsmatrix und Löschen der Fragmente nach dem Zusammenführen
wordrec_enable_assoc1Assoziator Aktivieren
force_word_assoc0erzwingt die Ausführung des Assoziators unabhängig von der Einstellung enable_assoc. Dies wird für CJK verwendet, wo die Gruppierung von Komponenten erforderlich ist.
chop_enable1Häckseln aktivieren
chop_vertical_creep0Vertikales Kriechen
chop_new_seam_pile1Neue seam_pile verwenden
assume_fixed_pitch_char_segment0einbeziehung von Heuristiken mit fester Tonhöhe in die Zeichensegmentierung
wordrec_skip_no_truth_words0OCR nur für Wörter ausführen, deren Wahrheit in BlamerBundle aufgezeichnet wurde
wordrec_debug_blamer0Blamer-Debug-Meldungen drucken
wordrec_run_blamer0Versuchen Sie, die Schuld für Fehler zuzuweisen
auswahlen_alt_speichern1Speichern von alternativen Pfaden, die bei der Zerschneidungs- und Segmentierungssuche gefunden wurden
sprachen_modell_ngramm_ein0Aktivieren/deaktivieren Sie die Verwendung des Zeichen-Ngramm-Modells
sprachenmodell_ngramm_verwendung_ only_first_uft8_step0Verwendet nur den ersten UTF8-Schritt der angegebenen Zeichenkette bei der Berechnung der Protokollwahrscheinlichkeiten.
sprachen_modell_ngramm_raum_ delimited_language1Wörter werden durch Leerzeichen getrennt
sprachen_modell_verwendung_sigmoidale_gewissheit0Verwenden Sie die sigmoidale Punktzahl für die Gewissheit
tessedit_resegment_from_boxes0Segmentierung und Beschriftung aus der Box-Datei übernehmen
tessedit_resegment_aus_line_boxes0Konvertierung von Wort-/Zeilen-Box-Dateien in Zeichen-Box-Dateien
tessedit_train_from_boxes0Erzeugen von Trainingsdaten aus verschlüsselten Zeichen
tessedit_boxen_aus_boxen_herstellen0Mehr Boxen aus Box-Zeichen generieren
tessedit_train_line_recognizer0Eingabe in Zeilen umbrechen und Felder neu zuordnen, falls vorhanden
tessedit_dump_pageseg_images0Während der Seitensegmentierung erstellte Zwischenbilder ausgeben
tessedit_do_invert1Versuchen Sie, das Bild in `LSTMRecognizeWord` zu invertieren
tessedit_ambigs_training0Training für Mehrdeutigkeiten durchführen
tessedit_adaption_debug0Erzeugen und Drucken von Debug-Informationen für die Adaption
applybox_learn_chars_and_char_frags_mode0Lernen Sie sowohl Zeichenfragmente (wie im speziellen Modus für niedrige Belichtung) als auch nicht fragmentierte Zeichen.
applybox_learn_ngrams_mode0Es wird davon ausgegangen, dass jede Bounding Box Ngramme enthält. Lernen Sie nur die Ngramme, deren Umrisse sich horizontal überschneiden.
tessedit_display_outwords0Ausgabewörter zeichnen
tessedit_dump_choices0Dump-Char-Auswahlen
tessedit_timing_debug0Zeitstatistiken drucken
tessedit_fix_fuzzy_spaces1Versuchen Sie, unscharfe Räume zu verbessern
tessedit_unrej_any_wd0Bemühen Sie sich nicht um Wortplausibilität
tessedit_fix_hyphens1Doppelte Bindestriche knacken?
tessedit_enable_doc_dict1Wörter in das Dokumentwörterbuch aufnehmen
tessedit_debug_fonts0Ausgabe von Schriftinformationen pro Zeichen
tessedit_debug_block_rejection0Block- und Reihenstatistiken
tessedit_enable_bigram_correction1Aktivieren Sie die Korrektur auf der Grundlage des Bigram-Wörterbuchs.
tessedit_enable_dict_correction0Aktivieren Sie die Korrektur einzelner Wörter auf der Grundlage des Wörterbuchs.
geräusch_entfernen_aktivieren1Entfernen und bedingte Neuzuweisung von kleinen Umrissen, wenn sie die Layout-Analyse verwirren, Bestimmung von diakritischen Zeichen und Geräuschen
tessedit_minimal_rej_pass10Minimale Zurückweisung am Ausgang von Pass 1
tessedit_test_adaption0Kriterien für die Testanpassung
test_pt0Test für Punkt
absatz_text_basiert1Absatzerkennung bei der Post-Text-Erkennung (genauer)
lstm_gebrauch_matrix1Verwendung von Bewertungen Matrix/Strahlensuche mit lstm
tessedit_gute_Qualität_unrej1Verringerung der Ablehnung von guten Dokumenten
tessedit_verwendet_zurückgewiesene_Spaces1Räume ablehnen?
tessedit_preserve_blk_rej_perfect_wds1Nur teilweise abgelehnte Wörter in der Blockrückweisung zurückweisen
tessedit_preserve_row_rej_perfect_wds1Nur teilweise abgelehnte Wörter in der Zeilenablehnung zurückweisen
tessedit_dont_blkrej_good_wds0Qualitätsmetrik für die Wortsegmentierung verwenden
tessedit_dont_rowrej_good_wds0Qualitätsmetrik für die Wortsegmentierung verwenden
tessedit_row_rej_good_docs1Ablehnung von Zeilen auf gute Dokumente anwenden
tessedit_reject_bad_qual_wds1Ablehnen aller qualitativ schlechten Wds
tessedit_debug_doc_rejection0Seitenstatistiken
tessedit_debug_quality_metrics0Daten in Debug-Datei ausgeben
bland_unrej0unkontrolliertes Potenzial
unlv_tilde_crunching0Mark v.bad words for tilde crunch
hocr_font_info0Schriftart-Infos zur hocr-Ausgabe hinzufügen
hocr_char_boxes0Hinzufügen von Koordinaten für jedes Zeichen zur hocr-Ausgabe
crunch_early_merge_tess_fails1Vor der Wortklauberei?
crunch_early_convert_bad_unlv_chs0~^ früh herausnehmen?
crunch_terrible_garbage1Wie es heißt
crunch_leave_ok_strings1Sensible Saiten nicht anfassen
crunch_accept_ok1Akzeptanz in okstring verwenden
crunch_leave_accept_strings0Vernünftige Saiten nicht zerkleinern
crunch_include_numerals0Fiddle-Alpha-Zahlen
tessedit_prefer_joined_punct0Belohnung Interpunktion verbindet sich
tessedit_write_block_separators0Blocktrennzeichen in die Ausgabe schreiben
tessedit_write_rep_codes0Wiederholungszeichencode schreiben
tessedit_write_unlv0.unlv-Ausgabedatei schreiben
tessedit_create_txt0.txt-Ausgabedatei schreiben
tessedit_erstellen_hocr0.html hOCR-Ausgabedatei schreiben
tessedit_erstellen_alto0.xml ALTO-Datei schreiben
tessedit_create_lstmbox0Schreiben einer .box-Datei für das LSTM-Training
tessedit_create_tsv0.tsv-Ausgabedatei schreiben
tessedit_erstellen_Wortfeld0Schreiben einer Ausgabedatei im WordStr-Format .box
tessedit_erstellen_pdf0.pdf-Ausgabedatei schreiben
textonly_pdf0PDF mit nur einer unsichtbaren Textebene erstellen
verdächtiger_Einschränkung_1Il0UNLV behält 1Il Zeichen zurückgewiesen
tessedit_minimale_Ablehnung0Nur tess-Misserfolge zurückweisen
tessedit_zero_zurückweisung0Lehnen Sie nicht ALLES ab
tessedit_Wort_für_Wort0Die Ausgabe soll genau ein Wort pro WERD enthalten
tessedit_zero_kelvin_ablehnung0Lehnen Sie nicht ALLES ab AT ALL
tessedit_zurückweisung_debug0Debuggen von Anpassungen
tessedit_flip_0O1Kontextuelle 0O O0-Flips
rej_trust_doc_dawg0DOC-Dawg in 11l konf. Detektor verwenden
rej_1Il_Verwendung_dict_word0Dictword-Test verwenden
rej_1Il_trust_permuter_type1Überprüfen Sie nicht doppelt
rej_use_tess_accepted1Individuelle Ablehnungskontrolle
rej_use_tess_blanks1Individuelle Ablehnungskontrolle
rej_benutzen_gut_perm1Individuelle Ablehnungskontrolle
rej_use_sensible_wd0Permuterkontrolle ausweiten
rej_alphas_in_zahl_perm0Permuterkontrolle ausweiten
tessedit_create_boxfile0Text mit Boxen ausgeben
tessedit_write_images0Erfassen Sie das Bild vom IPE
interaktiver_Anzeigemodus0Interaktiv ausführen?
tessedit_override_permuter1Nach dict_word
tessedit_verwendet_primäre_Parameter_Modell0Im mehrsprachigen Modus verwenden Sie das Modell params der Primärsprache
textord_tabfind_show_vlines0Debug-Zeilenfindung
textord_use_cjk_fp_model0CJK-Modell mit fester Tonhöhe verwenden
poly_allow_detailed_fx0Erlauben Sie den Merkmalsextraktoren, die ursprüngliche Kontur zu sehen
tessedit_init_config_only0Nur mit der Konfigurationsdatei initialisieren. Nützlich, wenn die Instanz nicht für OCR, sondern z. B. nur für die Layout-Analyse verwendet werden soll.
textord_equation_detect0Gleichungsdetektor einschalten
textord_tabfind_vertical_text1Vertikale Erkennung einschalten
textord_tabfind_force_vertical_text0Verwendung des vertikalen Textseitenmodus erzwingen
wortzwischenräume_erhalten0Mehrere Wortzwischenräume beibehalten
pageseg_apply_music_mask1Erkennen von Notensystemen und Entfernen von sich überschneidenden Komponenten
textord_single_height_mode0Das Skript hat keine x-Höhe, also verwenden Sie einen einzelnen Modus
tosp_old_to_method0Platzstatistiken mit Vorhacken?
tosp_old_to_constrain_sp_kn0Einschränkung der relativen Werte der Lücken zwischen und innerhalb von Wörtern für old_to_method.
tosp_only_use_prop_rows1Blockstatistiken zur Verwendung von Reihen mit festem Abstand?
tosp_force_wordbreak_on_punct0Wortumbrüche bei Punkt erzwingen, um lange Zeilen in nicht durch Leerzeichen getrennten Sprachen umzubrechen
tosp_nutzen_vor_hacken0Platzstatistiken mit Vorhacken?
tosp_old_to_bug_fix0Behebung eines vermuteten Fehlers im alten Code
tosp_block_use_cert_spaces1Nur stat OBVIOUS Räume
tosp_row_use_cert_spaces1Nur stat OBVIOUS Räume
tosp_narrow_blobs_not_cert1Nur stat OBVIOUS Räume
tosp_row_use_cert_spaces11Nur stat OBVIOUS Räume
tosp_recovery_isolated_row_stats1Bei unzureichendem Platzangebot nur Reihe verwenden
tosp_nur_kleine_lücken_für_kern0Besser raten
tosp_alle_flips_fuzzy0Pass ANY flip to context?
tosp_fuzzy_limit_all1Kn->sp fuzzy limit nicht auf Tabellen beschränken
tosp_stats_use_xht_gaps1Verwendung innerhalb der xht-Lücke für wd-Pausen
tosp_use_xht_gaps1Verwendung innerhalb der xht-Lücke für wd-Pausen
tosp_only_use_xht_gaps0Nur innerhalb der xht-Lücke für wd-Pausen verwenden
tosp_rule_9_test_punct0Nicht in den Raum neben dem Punkt einfügen
tosp_flip_fuzz_kn_to_sp1Standard-Flip
tosp_flip_fuzz_sp_to_kn1Standard-Flip
tosp_improve_thresh0Verbesserungsheuristik aktivieren
textord_no_rejects0Rauschflecken nicht entfernen
textord_show_blobs0Unsortierte Blobs anzeigen
textord_show_boxes0Unsortierte Blobs anzeigen
textord_noise_rejwords1Geräuschhafte Wörter ablehnen
textord_noise_rejrows1Geräuschhafte Zeilen ablehnen
textord_geräusch_debug0Debug row garbage detector
classify_learn_debug_strKlasse str zu debuggen Lernen
user_words_fileEin Dateiname mit vom Benutzer bereitgestellten Wörtern.
user_words_suffixEin Suffix von benutzerdefinierten Wörtern, die sich in tessdata befinden.
user_patterns_fileEin Dateiname für vom Benutzer bereitgestellte Muster.
benutzer_muster_suffixEin Suffix der vom Benutzer bereitgestellten Muster, die sich in tessdata befinden.
output_ambig_words_fileAusgabedatei für im Wörterbuch gefundene Mehrdeutigkeiten
word_to_debugWort, für das die Stopper-Debug-Informationen auf stdout ausgegeben werden sollen
tessedit_char_blacklistSchwarze Liste der nicht zu erkennenden Zeichen
tessedit_char_whitelistWhitelist der zu erkennenden Zeichen
tessedit_char_unblacklistListe der zu überschreibenden Zeichen tessedit_char_blacklist
tessedit_schreibe_params_zu_dateiSchreibt alle Parameter in die angegebene Datei.
applybox_exposure_pattern.expDer Belichtungswert folgt diesem Muster im Dateinamen des Bildes. Die Namen der Bilddateien werden in der Form [lang].[Schriftname].exp [num].tif erwartet
chs_leading_punct ('`"Führende Interpunktion
chs_trailing_punct1).,;:?!1. Nachgestelltes Satzzeichen
chs_trailing_punct2 )'`"2. Satzzeichen am Ende
umrisse_ungewohnt% Nicht standardmäßige Anzahl von Umrissen
umrisse_2 ij!?%":;Nicht standardmäßige Anzahl von Umrissen
numerische_Zeichensetzung.,Punct. chs erwartet WITHIN Nummern
unerkanntes_Zeichen Ausgabezeichen für nicht identifizierte Blobs
ok_repeated_ch_non_alphanum_wds-?*=Erlauben Sie NN, zu rej
konflikt_set_I_l_1Il1 []Il1-Konfliktsatz
dateityp.tifErweiterung des Dateinamens
tessedit_load_sublangsListe der zu ladenden Sprachen mit dieser einen
seiten_trennzeichen Seitentrennzeichen (Standard ist das Steuerzeichen für den Seitenvorschub)
klassifizieren_zeichen_norm_bereich0.2Zeichen Normierungsbereich ...
klassifizieren_max_rating_ratio1.5Veto-Verhältnis zwischen Klassifikatorbewertungen
classify_max_certainty_margin5.5Veto Differenz zwischen Klassifizierungssicherheiten
matcher_good_threshold0.125Gutes Spiel (0-1)
matcher_reliable_adaptive_result0Großes Spiel (0-1)
matcher_perfect_threshold0.02Perfektes Spiel (0-1)
matcher_bad_match_pad0.15Schlechtes Spiel Pad (0-1)
matcher_rating_margin0.1Neuer Vorlagenrand (0-1)
matcher_avg_noise_size12Durchschnittliche Länge des Rauschflecks
matcher_clustering_max_angle_delta0.015Maximales Winkeldelta für Prototyp-Clustering
falsches_Schrottgeld_klassifizieren0Strafe, die anzuwenden ist, wenn eine Nicht-Alnum vertikal außerhalb der erwarteten Textzeilenposition liegt
rating_skala1.5Bewertungsskalierungsfaktor
gewissheit_skala20Sicherheitsskalierungsfaktor
tessedit_class_miss_scale0.00390625Skalierungsfaktor für nicht verwendete Merkmale
klassifizieren_angepasste_Beschneidung_Faktor2.5Prune schlecht angepasste Ergebnisse so viel schlechter als das beste Ergebnis
classify_adapted_pruning_threshold-1Threshold at which klassifizieren_angepasste_Beschneidung_Faktor starts
zeichen_fragmente_klassifizieren garbage_certainty_threshold-3Fragmente, die nicht wie ganze Zeichen aussehen, vom Training und der Anpassung ausschließen
speckle_large_max_size0.3Max. große Fleckengröße
speckle_rating_penalty10Strafzuschlag für die schlechteste Bewertung bei Lärm
xheight_penalty_subscripts0.125Punktabzug (0,1 = 10 %), wenn ein Wort tief- oder hochgestellte Buchstaben enthält, aber sonst in Ordnung.
xheight_penalty_inconsistent0.25Punktabzug (0,1 = 10%), wenn eine x-Höhe nicht konsistent ist.
segment_penalty_dict_frequent_word1Punktemultiplikator für Wortübereinstimmungen, die eine gute Groß-/Kleinschreibung aufweisen und in der gegebenen Sprache häufig vorkommen (niedriger ist besser).
segment_penalty_dict_case_ok1.1Punktemultiplikator für Wortübereinstimmungen, die eine gute Groß- und Kleinschreibung aufweisen (kleiner ist besser).
segment_penalty_dict_case_bad1.3125Standardmultiplikator für Wortübereinstimmungen, der Probleme mit der Groß- und Kleinschreibung haben kann (niedriger ist besser).
segment_penalty_dict_nonword1.25Punktemultiplikator für Glyphenfragment-Segmentierungen, die nicht mit einem Wörterbuchwort übereinstimmen (niedriger ist besser).
segment_strafen_müll1.5Punktemultiplikator für schlecht geschriebene Zeichenketten, die nicht im Wörterbuch stehen und generell wie Müll aussehen (niedriger ist besser).
gewissheit_skala20Sicherheitsskalierungsfaktor
stopper_nondict_certainty_base-2.5Gewissheitsschwelle für Nicht-Diktat-Wörter
stopper_phase2_gewissheit_zurueckweisung_offset1Ablehnung der Sicherheitsverschiebung
stopper_gewissheit_pro_char-0.5Gewissheit, für jedes Diktatzeichen über kleine Wortgröße hinzuzufügen.
stopper_allowable_character_badness3Maximal zulässige Sicherheitsabweichung in einem Wort (in Sigma)
doc_dict_pending_threshold0Schlechteste Sicherheit bei der Verwendung von anhängigen Wörterbüchern
doc_dict_certainty_threshold-2.25Schlimmste Sicherheit für Wörter, die in das Dokumentwörterbuch eingefügt werden können
tessedit_gewissheit_schwelle-2.25Gute Blobgrenze
chop_split_dist_knob0.5Einstellung der geteilten Länge
chop_overlap_knob0.9Einstellung der geteilten Überlappung
chop_center_knob0.15Einstellung der geteilten Mitte
chop_sharpness_knob0.06Einstellung der geteilten Schärfe
chop_width_change_knob5Einstellung der Breitenänderung
chop_ok_split100OK Splitgrenze
chop_good_split50Gute Splitgrenze
segsearch_max_char_wh_ratio2Maximales Verhältnis von Zeichenbreite zu -höhe