フッターコンテンツにスキップ
IRONOCRの使い方

より高速かつ効率的なOCR処理のための最適化されたパフォーマンス

In 2024.12, IronOCR introduced a feature that significantly reduced the file size of generated searchable PDFs when processing multi-page TIFF images. この改善により、出力ファイルのサイズを小さくすることができましたが、処理速度とメモリ使用量にパフォーマンスの課題が生じました。

2025.1での初期最適化により、これらのパフォーマンス問題への対処が始まりました。 包括的なパフォーマンスの改善は、後に2025.2リリースで提供され、複数ページのドキュメントを処理する際の速度とメモリの問題を解決しながら、より小さなファイルサイズを維持しました。


ボトルネックの特定:ページの回転と処理時間</p

パフォーマンスの大きなボトルネックの1つは、ページの回転でした。 各操作は、既存のインスタンスを再利用するのではなく、新しいインスタンスを作成するため、不必要な処理時間とメモリ消費につながります。 この非効率性は、特に大きなTIFFをsearchablePDFに変換するときに、処理時間とメモリ消費の増加をもたらしました。

最適化バージョン(IronOCR 2025.2)

IronOCR 2025.1での最初の修正は、ページローテーションのためのインスタンス再利用の最適化に焦点を当てました。 この結果、処理時間が63秒から57秒に短縮され、10%の改善が見られました。 しかし、これは始まりにすぎません。

さらに深く掘り下げると、他にもいくつかの強化すべき点が見つかりました。


システム パフォーマンスの向上</p

主な改善点 </strong

  • 繰り返し操作のためのインスタンスの再利用
  • 並行処理の最適化
  • メモリ割り当てとオブジェクトのライフサイクル管理
  • 検索可能なPDFレンダリングの改善

このような最適化の積み重ねが、IronOcr 2025.2の画期的な改善につながりました。


主な考察:何が変わったのか</p

これらの機能強化により、IronOcr 2025.2アップデートは大幅なパフォーマンス向上を実現しました:

より速い処理

  • 24ページの検索可能なPDF49%速く処理されるようになりました(63s → 32s)。
  • マルチドキュメント処理45%改善されました。
  • 単一画像OCR35%高速です。

より効率的なメモリ使用

  • オブジェクトの割り当てを最大63%削減。
  • メモリの断片化が少なくなり、パフォーマンスがスムーズになりました。

ベンチマーク結果

ReadSimpleImage:をお読みください。

  • 2025.2バージョン:867.1ミリ秒、2024.11バージョンより16.27%高速、2025.1バージョンより34.83%高速。

最適化されたOCR処理1

  • メモリ:81.65 MB、2024.11 バージョンより 31.27% 少ない、2024.12 バージョンより 42.12% 少ない。

最適化されたOCR処理2

ReadMultipleDocs:をお読みください。

最適化バージョン(2025.2): 20706.6ms、(2024.11)バージョンより15.61%高速。

最適化されたOCR処理3

  • メモリ:1.2GB、レガシーより4.76%少ない。
  • Pdfiumバージョン:ベンチマークに失敗しました

最適化されたOCR処理4

実世界のアプリケーション:企業はどのように利益を得るか</p

法律とコンプライアンス:より迅速な文書のデジタル化</p

契約書をデジタル化する法律事務所では、複数ページの契約書をスキャンする際、OCR処理に時間がかかるという問題に直面していました。 IronOcr 2025.2により、契約書を検索可能なPDFに50%近く速く変換できるようになり、ケースリサーチとコンプライアンスチェックが効率化されました。

ヘルスケア:効率的な医療記録処理</p

病院や診療所では、患者記録の大きなTIFFスキャンを扱うことがよくあります。 以前は、24ページの病歴文書を検索可能なPDFに変換するのに1分以上かかっていました。 現在では、改良されたメモリ管理と並行処理により、このタスクはわずか32秒で完了し、重要な患者データへの迅速なアクセスが可能になりました。

財務と監査:一括レポートの処理</p

何百ページもの財務報告書をスキャンする会計事務所では、検索可能なテキストを維持しながらファイルサイズを管理できるソリューションが必要でした。 IronOCRの洗練されたレンダリングにより、複数のドキュメントのスキャンをより効率的に処理できるようになり、処理時間と最終的なファイルサイズの両方が削減されました。

リサーチ&アーカイブ:歴史的文書の保存</p

スキャンした研究論文や歴史的文書を扱うアーキビストには、高精度のテキスト認識が要求される一方、ファイルを軽量化して保管する必要があります。 最新の最適化により、処理オーバーヘッドを大幅に削減しながら、大規模な文書変換を処理することができます。


検索可能なPDFの進化:単なるジャンプではないプロセス</p

最適化は一足飛びに進むものではなく、現実の課題によって形作られた段階的なプロセスです。

1.2024.11: 検索可能なPDFのファイル サイズ削減を導入しましたが、パフォーマンス上の制限が発生しました。
2.2024.12: レンダリングの改善により PDF ファイル サイズが縮小されましたが、大きな TIFF での速度とメモリの問題が明らかになりました。
3.2025.1: ページ回転処理の最初のボトルネックに対処し、処理時間を 10% 改善しました。
4.2025.2:包括的な最適化により、49% のパフォーマンス向上、メモリ効率の改善、および検索可能な大きな PDF のスムーズな処理を実現しました。

各アップデートは前回の教訓を基に構築されており、その結果、より速く、より効率的で、需要の高いワークロードに対応できるOCRエンジンになりました。


最新のIronOcrアップデートのパワーを体験してください

もしあなたのビジネスが高速、効率的、正確なOCR処理に依存しているなら、このIronOCR 2025.2アップデートはあなたが必要とする速度と最適化を提供します。

30日間無料トライアルキーを試して、プロセスを体験してください!

よくある質問

OCRプロセスでインスタンス再利用を使用する利点は何ですか?

IronOCR 2025.2で実装されたように、OCRプロセスでのインスタンス再利用は、各操作のために新しいインスタンスを作成するオーバーヘッドを減少させ、処理速度を増加させメモリ消費を低下させます。

並列処理はどのようにしてOCRのパフォーマンスを向上させますか?

IronOCR 2025.2での並列処理は、複数のOCRタスクを同時に処理可能にし、ドキュメント処理の全体的な速度と効率を大幅に向上させます。

最新のOCRアップデートでは、PDFレンダリングにどのような最適化が行われましたか?

IronOCR 2025.2の最新アップデートには、検索可能なPDF文書に画像を変換する際の品質と速度を向上させる、改良されたPDFレンダリングが含まれています。

最新バージョンのOCRソフトウェアではどのようにメモリ使用量が改善されましたか?

IronOCR 2025.2では、メモリの割り当てを最適化し、断片化を減少させることで、メモリ使用量が最大63%削減されています。

OCRソフトウェアの処理速度を改善するために解決された問題は何ですか?

IronOCR 2025.2は、非効率的なページ回転プロセスなどの以前のパフォーマンスボトルネックに対応し、処理時間を大幅に短縮しました。

法務機関は最新のOCRソフトウェアアップデートからどのように利益を得られますか?

法務機関はIronOCR 2025.2から利益を得て、法的文書を検索可能なPDFにほぼ50%高速に変換し、効率的な調査とコンプライアンス管理を支援します。

多ページTIFFを処理する際のOCRアップデートの利点は何ですか?

IronOCR 2025.2のアップデートは、大規模な多ページTIFFの効率的な処理を可能にし、最大49%の高速化とメモリ管理の改善を提供し、大量のドキュメント処理に適しています。

医療業界はどのようにしてより高速なOCR処理から利益を得ていますか?

医療業界はIronOCR 2025.2を活用して、患者記録や大規模なTIFFスキャンをより早く処理し、重要な医療情報への迅速なアクセスを可能にします。

複数の文書を読む上でどのような改善がなされましたか?

IronOCR 2025.2は、ReadMultipleDocs機能を改善し、大量の文書変換を扱う際の処理時間とメモリ使用の効率を向上させました。

OCRアップデートはどのようにアーカイブと研究を助けますか?

アーカイブ管理者や研究者は、処理オーバーヘッドを削減しつつ、大量の文書を効率的に保存し、文書の完全性を保ちながらIronOCR 2025.2を活用できます。

Kannaopat Udonpant
ソフトウェアエンジニア
ソフトウェアエンジニアになる前に、Kannapatは北海道大学で環境資源の博士号を修了しました。博士号を追求する間に、彼はバイオプロダクションエンジニアリング学科の一部である車両ロボティクスラボラトリーのメンバーになりました。2022年には、C#のスキルを活用してIron Softwareのエンジニアリングチームに参加し、IronPDFに注力しています。Kannapatは、IronPDFの多くのコードを執筆している開発者から直接学んでいるため、この仕事を大切にしています。同僚から学びながら、Iron Softwareでの働く社会的側面も楽しんでいます。コードやドキュメントを書いていない時は、KannapatはPS5でゲームをしたり、『The Last of Us』を再視聴したりしていることが多いです。