IronOCRで数式の文字認識・テキスト抽出を行う方法

This article was translated from English: Does it need improvement?
Translated
View the article in English

IronOCR は数式を読み取ることができますか?

IronOCR は Tesseract 4/5 を使用しており、そのままでも数式の文字認識・テキスト抽出に問題なく動作しますが、詳細な設定オプションを試してみるのもよいでしょう。

Tesseract 構成変数を調べる

IronOCRにカスタム言語パックを追加することもできます。カスタム言語パックについて学ぶ

EQU 方程式検出言語パックもあります: EQU 言語パック

// C# Example to demonstrate reading equations using IronOCR

using IronOcr; // Import the IronOcr namespace

public class EquationOcrExample
{
    public void ReadEquations(string imagePath)
    {
        // Instantiate the IronTesseract object
        var Ocr = new IronTesseract();

        // Load the custom EQU language for better equation detection
        Ocr.Language = Ocr.Languages.Add("equ");

        // Read and OCR the image containing equations
        using (var Input = new OcrInput(imagePath))
        {
            // Extract OcrResult from the image
            var Result = Ocr.Read(Input);

            // Output the contents of the OCR result as text
            System.Console.WriteLine(Result.Text);
        }
    }
}
// C# Example to demonstrate reading equations using IronOCR

using IronOcr; // Import the IronOcr namespace

public class EquationOcrExample
{
    public void ReadEquations(string imagePath)
    {
        // Instantiate the IronTesseract object
        var Ocr = new IronTesseract();

        // Load the custom EQU language for better equation detection
        Ocr.Language = Ocr.Languages.Add("equ");

        // Read and OCR the image containing equations
        using (var Input = new OcrInput(imagePath))
        {
            // Extract OcrResult from the image
            var Result = Ocr.Read(Input);

            // Output the contents of the OCR result as text
            System.Console.WriteLine(Result.Text);
        }
    }
}
' C# Example to demonstrate reading equations using IronOCR

Imports IronOcr ' Import the IronOcr namespace

Public Class EquationOcrExample
	Public Sub ReadEquations(ByVal imagePath As String)
		' Instantiate the IronTesseract object
		Dim Ocr = New IronTesseract()

		' Load the custom EQU language for better equation detection
		Ocr.Language = Ocr.Languages.Add("equ")

		' Read and OCR the image containing equations
		Using Input = New OcrInput(imagePath)
			' Extract OcrResult from the image
			Dim Result = Ocr.Read(Input)

			' Output the contents of the OCR result as text
			System.Console.WriteLine(Result.Text)
		End Using
	End Sub
End Class
$vbLabelText   $csharpLabel

上記の例では、 IronOCRはTesseract OCRエンジンを利用して画像ファイルから数式を読み取ります。数式用のカスタム言語パック(equ)が読み込まれることで、検出精度が向上します。 ReadEquations メソッドは、数式を含む画像へのファイル パスを受け入れ、OCR を実行し、認識されたテキストを出力します。

カーティス・チャウ
テクニカルライター

Curtis Chauは、カールトン大学でコンピュータサイエンスの学士号を取得し、Node.js、TypeScript、JavaScript、およびReactに精通したフロントエンド開発を専門としています。直感的で美しいユーザーインターフェースを作成することに情熱を持ち、Curtisは現代のフレームワークを用いた開発や、構造の良い視覚的に魅力的なマニュアルの作成を楽しんでいます。

開発以外にも、CurtisはIoT(Internet of Things)への強い関心を持ち、ハードウェアとソフトウェアの統合方法を模索しています。余暇には、ゲームをしたりDiscordボットを作成したりして、技術に対する愛情と創造性を組み合わせています。

準備はできましたか?
Nuget ダウンロード 5,570,591 | バージョン: 2026.4 リリース
Still Scrolling Icon

まだスクロールしていますか?

すぐに証拠が欲しいですか? PM > Install-Package IronOcr
サンプルを実行 あなたの画像が検索可能なテキストになるのをご覧ください。