IronOCRの特徴

This article was translated from English: Does it need improvement?
Translated
View the article in English

IronOCRは、開発者が画像からテキストやバーコードをスキャンして読み取ることができる.NETライブラリです。

互換性

.NET言語

申し訳ありませんが、翻訳を行うための具体的なコンテンツが提供されていません。翻訳したい英語のテキストを入力してください。 C# ([日本語への翻訳です:

チュートリアル](/csharp/ocr/tutorials/how-to-read-text-from-an-image-in-csharp-net/) APIリファレンス)

  * 画像からテキストやバーコードをスキャンして読み取る(jpg、png、gif、tiff、bmp)C#で

申し訳ありませんが、翻訳を行うための具体的なコンテンツが提供されていません。翻訳したい英語のテキストを入力してください。 VB.NET

  • 画像からテキストやバーコードをスキャンして読み取る(jpg、png、gif、tiff、bmp)VB.NETで。
  • F#(エフシャープ)

    • 画像からテキストやバーコードをスキャンして読み取る(jpg、png、gif、tiff、bmp)F#で。

プラットフォーム

  • .NET 5、6、7、および8 ([日本語への翻訳です:

チュートリアル](/csharp/ocr/tutorials/how-to-read-text-from-an-image-in-csharp-net/))

  * IronOCRは、.NET 5、6、7、および8に対応しています。
  • .NET Core 2および3 ([日本語への翻訳です:

チュートリアル](/csharp/ocr/tutorials/how-to-read-text-from-an-image-in-csharp-net/))

  * IronOCRは、.NET Core 2および3で利用可能です。

  * 現在のリリースは、Linux、Unix、macOSクライアントオペレーティングシステム、ならびにMono上で.NET Coreをサポートしています。

  * 将来的なリリースでは、MAUIおよびXamarinをサポートします。

申し訳ありませんが、翻訳を行うための具体的なコンテンツが提供されていません。翻訳したい英語のテキストを入力してください。 .NET Standard 2+ (APIリファレンス)

  • IronOCRは.NET Standard 2およびそれ以降のバージョンと互換性があります。
  • .NET Framework 4.6.2以降 (コード例 APIリファレンス)

    • .NET Framework 4.6.2以上で画像からテキストやバーコードをスキャンおよび読み取ります。

アプリの種類

  • コンソール、ウェブ、デスクトップ ([日本語への翻訳です:

チュートリアル](/csharp/ocr/docs/) APIリファレンス)

  * IronOCR を使用して、Web、デスクトップ、およびコンソール向けのアプリを作成します。

オペレーティングシステム

  • マイクロソフト ウィンドウズ ([日本語への翻訳です:

チュートリアル](/csharp/ocr/docs/))

  • Linux (リナックス) ([日本語への翻訳です:

チュートリアル](/csharp/ocr/how-to/tesseract-ocr-setup-linux-ubuntu-debian/))

申し訳ありませんが、翻訳を行うための具体的なコンテンツが提供されていません。翻訳したい英語のテキストを入力してください。 macOS

  • Docker (ドッカー) ([日本語への翻訳です:

チュートリアル](/csharp/ocr/how-to/csharp-tesseract-ocr-docker-linux-setup-tutorial/)

  • Azure (アジュール) ([日本語への翻訳です:

チュートリアル](/csharp/ocr/how-to/iron-ocr-azure-tutorial/)

申し訳ありませんが、翻訳を行うための具体的なコンテンツが提供されていません。翻訳したい英語のテキストを入力してください。 AWS

IDE(統合開発環境)

  • マイクロソフト ビジュアル スタジオ ([日本語への翻訳です:

チュートリアル](/csharp/ocr/docs/))

  • Jetbrains ReSharper および Rider

認証

  • マイクロソフト Authenticode

    • DigiCert Trusted G4 コードサイニング RSA4096 SHA384 2021 CA1

OCRエンジン

基盤となるOCRエンジン

  • テッセラクト5 ([日本語への翻訳です:

チュートリアル](/csharp/ocr/tutorials/c-sharp-tesseract-ocr/) コード例)

  • Tesseractはオープンソースのテキスト認識です。(OCR (光学式文字認識))エンジンは、Apache 2.0ライセンスの下で利用可能です。 C#.NET向けに最も正確で高速なライブラリの1つが利用可能です。 現在、Tesseract 5は最も安定したバージョンです。
  • 詳細な設定(コード例)

    • IronTesseract.Configurationオブジェクトは、高度なユーザーのために設定を構成するためにC# / .NET の基盤となるTesseract APIへのアクセスを提供します。

    • セットアップは、OCRを実行した後の出力を改善するのに役立ちます。

    • OCR速度を改善するには、次を確認してくださいこのコード例迅速なOCR設定のために。

国際的な言語

チュートリアル

テキストとバーコード読み取り

専門文書(ハウツー

このメソッドは機械学習を使用してテキスト認識を強化します。

  • ドキュメント
  • スキャンされた文書やテキストが多い紙の文書の写真を読むために最適化されています。
  • ナンバープレート
  • 写真からナンバープレートを読み取るために最適化されています。
  • パスポート
  • 機械読み取り領域をスキャンして写真からパスポート情報を読み取り抽出するように最適化されています(MRZ)内容
  • 写真
  • 読み取りにくいテキストを含む画像の読み取りに最適化されています。
  • スクリーンショット

    • スクリーンショットに含まれる読みづらいテキストの読み取りに最適化されています。

同時実行

  • シングルスレッドおよびマルチスレッド (ハウツー コード例)
  • 非同期サポート (ハウツー APIリファレンス)
  • 中止トークン (コード例)
  • プログラムやアプリケーションが実行中に大きな入力ファイルの読み込みで停止が発生する場合、指定されたミリ秒の間現在のスレッドを中断することをユーザーに許可します。
  • タイムアウト (コード例)

    • OCR読み取りがキャンセルされるまでのオプションのタイムアウトをミリ秒単位で提供します。

コンピュータビジョン

ハウツー APIリファレンス

  • コンピュータビジョンを使用して、当社の高度なトレーニングモデルに基づいたテキストを検出します。 IronOCRは、OpenCVを利用して、画像内にテキストが存在する領域をコンピュータビジョンで検出します。 これは、多くのノイズが含まれている画像、異なる場所にテキストがある画像、およびテキストが湾曲している画像に役立ちます。 Use of computer vision in IronOCR will determine where text regions exists and then use Tesseract to attempt to read those regions.

OCR入力

コード例

さまざまな形式から読み取る

フィルター

  • フィルタウィザード (コード例 APIリファレンス)
  • 画像にどのフィルターを適用すべきか分からない場合、Filter WizardはOCR入力に適したフィルターのリストを、最大の自信を持つ組み合わせを返すブルートフォース法を用いて提供します。
  • OCR画像フィルター (ハウツー チュートリアル コード例)

    • シャープン (APIリファレンス)

      * ぼやけたOCRドキュメントを鮮明にします。 アルファチャンネルを白にフラット化します。
    • 解像度を強化する (APIリファレンス)

      * 低品質画像の解像度を向上させます。
    • ノイズ除去 (APIリファレンス)

      * デジタルノイズを除去します。このフィルタは、ノイズが予想される場合にのみ使用する必要があります。 アルファチャンネルを白にフラット化します。
    • 膨張 (APIリファレンス)

      * 高度な形態学。 _Dilation_は、画像内のオブジェクトの境界にピクセルを追加します。 「Erode」の反対語
    • Erode (イローディ) (APIリファレンス)
  • 高度な形態学。 エロージョンはオブジェクトの境界上のピクセルを削除します。 拡大の反対
  • 画像の向きを修正する (ハウツー チュートリアル コード例)

    • 回転 ([日本語への翻訳です:

チュートリアル](/csharp/ocr/tutorials/c-sharp-ocr-image-filters/#rotate) APIリファレンス)

        * 画像を時計回りに指定度数だけ回転させます。反時計回りにする場合は、負の数を使用してください。

   * <span id="anchor-ocrinput-deskew">デスクュー</span> ([日本語への翻訳です:

チュートリアル](/csharp/ocr/tutorials/c-sharp-ocr-image-filters/#deskew) APIリファレンス)

        * 画像を正しい向きにし、直交させます。 これは非常に有用です。なぜなら、Tesseractのスキャンの歪みに対する許容度が5度程度と低いからです。

   * <span id="anchor-ocrinput-scale">スケール</span>  ([日本語への翻訳です:

チュートリアル](/csharp/ocr/tutorials/c-sharp-ocr-image-filters/#scale) APIリファレンス)

チュートリアル](/csharp/ocr/tutorials/c-sharp-ocr-image-filters/#binarize) APIリファレンス)

        * この画像フィルターは、すべてのピクセルを白か黒に変え、中間の色を排除します。 OCRのパフォーマンスをテキストと背景のコントラストが非常に低い場合に改善する可能性があります。

  * <span id="anchor-ocrinput-to-grayscale">ToGrayscale (グレースケールに変換する)</span>  ([APIリファレンス](/csharp/ocr/object-reference/api/IronOcr.OcrInput.html#IronOcr_OcrInput_ToGrayScale))

        * この画像フィルターは、すべてのピクセルをグレースケールの色調に変換します。 OCRの精度は向上しない可能性がありますが、速度は向上する場合があります。

   * <span id="anchor-ocrinput-invert">`反転`</span>  ([日本語への翻訳です:

チュートリアル](/csharp/ocr/tutorials/c-sharp-ocr-image-filters/#invert) APIリファレンス)

        * すべての色を反転します。 例えば、白が黒になります:黒が白になります。

   申し訳ありませんが、翻訳を行うための具体的なコンテンツが提供されていません。翻訳したい英語のテキストを入力してください。 <span id="anchor-ocrinput-replace-colors">`ReplaceColor`</span>  ([APIリファレンス](/csharp/ocr/object-reference/api/IronOcr.OcrInput.html#IronOcr_OcrInput_ReplaceColor_IronSoftware_Drawing_Color_IronSoftware_Drawing_Color_System_Int32_))

        * あるしきい値で画像内の色を別の色に置き換えます。

  * <span id="anchor-ocrinput-select-text-color">`SelectTextColor(テキストカラーを選択)`</span>  ([APIリファレンス](/csharp/ocr/object-reference/api/IronOcr.OcrInput.html#IronOcr_OcrInput_ReplaceColor_IronSoftware_Drawing_Color_IronSoftware_Drawing_Color_System_Int32_))

        * あるしきい値で画像内の色を別の色に置き換えます。

クロップ領域を適用

OCR結果

簡単なデータ出力

ハウツー コード例

  • .NET テキスト文字列
  • バーコードおよびQRデータ
  • 画像

構造化データ出力

ハウツー コード例

  • ページ
  • ブロック
  • 段落
  • ライン

    • 以下の内容を日本語に翻訳してください:

Words

  • キャラクター

ドキュメントのエクスポート

デバッグのためにページ上のテキストをハイライト

  • 文字、単語、行、または段落の検出結果をハイライトとして赤色の枠で囲み、デバッグのために.png形式で保存します。

ステータスと分析