ダヴィッド・ジョーンズとAgorusがIron Suiteで新たな効率を生み出す
ミラン・ヨヴァノヴィッチがIronPDFを使用
チームが製品をデモ
完璧な結果を得るためにOCRエンジンを微調整します。パフォーマンスと精度に対する詳細なコントロールを得ることができ、125以上の言語に対する即時サポートがあります。
Tesseractのコアエンジンは、数十ものパラメータを細かく制御することができます。特定の文書タイプ、言語、品質上の課題に対してパフォーマンスを最適化したい上級ユーザー向けに、詳細なカスタマイズが可能です。
IronTesseract ocr = new IronTesseract { Configuration = new TesseractConfiguration { ReadBarCodes = false, RenderHocr = true, TesseractVariables = null, WhiteListCharacters = null, BlackListCharacters = "`ë|^", }, MultiThreaded = false, Language = OcrLanguage.English, EnableTesseractConsoleMessages = true, // False as default };
OCRのコンフィギュレーション設定と、Advanced OCRの読み取り方式で使用可能な言語については、こちらをご覧ください。
using IronOcr; IronTesseract ocr = new IronTesseract { Configuration = new TesseractConfiguration { // Whitelist alphanumeric characters and common punctuation WhiteListCharacters = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789.,-?!$() /", // Blacklist uncommon characters BlackListCharacters = "`ë|^", }, // Languages available for advanced reading are English, Japanese, Korean, LatinAlphabet Language = OcrLanguage.English };
OCRエンジンを最適化し、最高速度を実現します。絶対的な精度よりもパフォーマンスを優先するように設定を調整することで、スピードが重要な要素となる大量の文書を迅速に処理できます。
125以上の国際言語で高い精度を達成します。当社のパックには、非ラテン文字(アラビア語、中国語、ヘブライ語など)や発音区分符号のある言語に対する強力なサポートが含まれています。1行のコードで簡単に言語の追加や切り替えができます。
using IronOcr; var ocr = new IronTesseract(); // Set the OCR to use Chinese Simplified ocr.Language = OcrLanguage.ChineseSimplified; using (var input = new OcrInput()) { var result = ocr.Read(input); // Store the recognized text in a string string testResult = result.Text; }
同じページに複数の言語が含まれるドキュメントからテキストを正確に抽出します。IronOcrは指定された言語を自動的に検出し、切り替えるため、各言語のコンテンツに対して個別の処理を行う必要がありません。
using IronOcr; // Instantiate IronTesseract IronTesseract ocrTesseract = new IronTesseract() { // Set primary language to English Language = OcrLanguage.EnglishBest, }; // Set secondary language to Russian ocrTesseract.AddSecondaryLanguage(OcrLanguage.Russian); // Add PDF using var pdfInput = new OcrPdfInput(@"example.pdf"); // Perform OCR OcrResult result = ocrTesseract.Read(pdfInput); // Output extracted text to console Console.WriteLine(result.Text);
独自の学習済み言語データを提供することで、組み込みの言語パックを超えることができます。希少な言語、特殊なフォント、独自の文字セットを使用したドキュメントで高い精度を達成します。
using IronOcr; var ocrTesseract = new IronTesseract(); ocrTesseract.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata"); using var ocrInput = new OcrInput(); ocrInput.LoadImage(@"sample.png"); var ocrResult = ocrTesseract.Read(ocrInput); Console.WriteLine(ocrResult.Text);
Install-Package IronOcr
無料で始める
トライアルフォームが正常に送信されました。試用キーはメールに届いているはずです。もし届いていない場合はsupport@ironsoftware.comにご連絡ください。
試用キーはメールに届いているはずです。もし届いていない場合はsupport@ironsoftware.comにご連絡ください。
ウォーターマークなしで本番環境でテスト。必要な場所で動作します。
完全に機能する製品を30日間利用できます。数分でセットアップして稼働します。
製品試用期間中、サポートエンジニアリングチームへのフルアクセス
製品とその主要機能のライブデモをご覧いただけます。
NuGetでインストール
あなたが必要なすべての情報を持っていることを確認するために、すべての質問にお答えします。(コミットメントは一切ありません)。
トライアルライセンスキーについては、メールをご確認ください。
メールが届かない場合は、ライブチャットを開始するか、support@ironsoftware.com
義務のない相談を予約
下記のフォームを記入するか、sales@ironsoftware.comにメールしてください。
あなたの詳細は常に守秘されます。
30分間の個別デモを予約してください。
契約なし、カード詳細なし、コミットメントなし。
著作権 © Iron Software 2013-2025