IRONOCRの使い方 IronOCRを使用したスキャン画像からのテーブルデータ抽出:ライブデモの概要 Kannapat Udonpant 更新日:6月 22, 2025 Download IronOCR NuGet Download テキストの検索と置換 テキストと画像のスタンプ Start Free Trial Copy for LLMs Copy for LLMs Copy page as Markdown for LLMs Open in ChatGPT Ask ChatGPT about this page Open in Gemini Ask Gemini about this page Open in Grok Ask Grok about this page Open in Perplexity Ask Perplexity about this page Share Share on Facebook Share on X (Twitter) Share on LinkedIn Copy URL Email article Extracting data from scanned images is a common challenge, especially when it involves structured data like tables. With IronOCR's advanced machine learning capabilities, you can now seamlessly extract table data including cell values and their positions. In this demo, Shadman Majid, Software Sales Engineer, walks through the code implementation step-by-step, while Anne Lazarakis, Sales and Marketing Director, shares real-world use cases from Iron Software customers. Real-World Use Cases Explained by Anne Lazarakis, Sales and Marketing Director* Insurance Claim Processing (Opyn Market) In the highly regulated healthcare insurance industry in the U.S., companies like Opyn Market still receive many documents via fax. These scanned documents often contain tabular data that must be accurately extracted and entered into internal systems. With IronOCR, they’re able to automate this process, reducing manual work and eliminating the potential for human error. Logistics & Food Distribution (iPAP) iPAP, the largest cheese distributor in the U.S., uses IronOCR to manage over 200 client orders. Their invoices come in various formats with inconsistent table layouts. IronOCR helps them extract purchase order numbers, shipment dates, and item details from scanned documents efficiently, even with varied formatting. This automation has saved them between $40,000 and $45,000 annually. Technical Overview Live Coding Session With Shadman Majid, Software Sales Engineer* IronOCR uses proprietary machine learning models to detect and extract table data from scanned documents. This feature supports: Extraction of table cells and coordinates OCR of scanned images and multi-frame PDFs Compatibility with C#, VB.NET, .NET Standard, .NET Framework, and .NET Core To access this functionality, you'll need: IronOCR NuGet package IronOcr.Extensions.AdvancedScanning NuGet package for table detection via ML models These packages include the trained ML models necessary for table structure detection and accurate OCR. Example Code for Extracting Tables Below is a sample C# code snippet that demonstrates how to use IronOCR for extracting table data from images: // Import the necessary IronOCR namespaces using IronOcr; // Initialize the IronTesseract to handle OCR processes var Ocr = new IronTesseract(); // Load the image containing the table using (var input = new OcrInput("invoice.jpg")) { // Perform OCR and extract text data including tables var result = Ocr.Read(input); // Iterate through each page in the document foreach (var page in result.Pages) { // Iterate through each table found on the page foreach (var table in page.Tables) { Console.WriteLine("Table found:"); // Iterate through each row in the table foreach (var row in table.Rows) { // Convert the row of cells to a comma-separated string var cells = string.Join(", ", row.Cells.Select(cell => cell.Text)); Console.WriteLine(cells); } } } } // Import the necessary IronOCR namespaces using IronOcr; // Initialize the IronTesseract to handle OCR processes var Ocr = new IronTesseract(); // Load the image containing the table using (var input = new OcrInput("invoice.jpg")) { // Perform OCR and extract text data including tables var result = Ocr.Read(input); // Iterate through each page in the document foreach (var page in result.Pages) { // Iterate through each table found on the page foreach (var table in page.Tables) { Console.WriteLine("Table found:"); // Iterate through each row in the table foreach (var row in table.Rows) { // Convert the row of cells to a comma-separated string var cells = string.Join(", ", row.Cells.Select(cell => cell.Text)); Console.WriteLine(cells); } } } } ' Import the necessary IronOCR namespaces Imports IronOcr ' Initialize the IronTesseract to handle OCR processes Private Ocr = New IronTesseract() ' Load the image containing the table Using input = New OcrInput("invoice.jpg") ' Perform OCR and extract text data including tables Dim result = Ocr.Read(input) ' Iterate through each page in the document For Each page In result.Pages ' Iterate through each table found on the page For Each table In page.Tables Console.WriteLine("Table found:") ' Iterate through each row in the table For Each row In table.Rows ' Convert the row of cells to a comma-separated string Dim cells = String.Join(", ", row.Cells.Select(Function(cell) cell.Text)) Console.WriteLine(cells) Next row Next table Next page End Using $vbLabelText $csharpLabel Loading an Image: The script begins by initializing the IronTesseract engine and loading an image file named invoice.jpg that you want to process. OCR Execution: It performs OCR on the input to extract text data, particularly focusing on any tables. Table Extraction: The script iterates through each detected table and its rows, outputting cell contents in a structured way. Ensure you have installed the necessary NuGet packages for IronOCR before running this script. Conclusion IronOCR makes it easy to automate the extraction of complex table data from scanned documents. Whether you're in healthcare, logistics, finance, or manufacturing, this solution offers reliability, accuracy, and cost-saving efficiency. With just a few lines of code, you can eliminate manual data entry and reduce human error. Want to see it in action? Book a live Demo with one of our engineers here. よくある質問 C#を使用してスキャン画像からテーブルデータを抽出するにはどうすればよいですか? IronOCRの高度な機械学習機能を使用して、スキャンした画像からテーブルデータを抽出することができます。このプロセスには、IronTesseractエンジンを使用して画像に対してOCRを実行し、セルの値やその座標を含む情報を抽出することが含まれます。 スキャンされた文書からテーブルデータを抽出する実世界の応用例は何ですか? 実際のアプリケーションには、ファックスした文書から表形式のデータを抽出することによる保険請求処理の自動化や、さまざまな形式で不定のテーブルレイアウトの請求書を含むクライアントの注文管理などがあり、Opyn MarketやiPAPのような企業によって示されています。 IronOCRがテーブルデータ抽出用に提供する技術的能力とは何ですか? IronOCRはテーブルセルとその座標の抽出、スキャン画像やマルチフレームPDFのOCR、C#、VB.NET、.NET Standard、.NET Framework、.NET Coreとの互換性を提供します。 IronOCRを使用してテーブルデータを抽出するためのコードにはどのような手順が含まれていますか? このプロセスには、IronTesseractエンジンの初期化、画像の読み込み、テキストデータを抽出するためのOCRの実行、そして検出された各テーブルとその行を繰り返し処理してセル内容を出力することが含まれます。 IronOCRを使用してテーブルデータを抽出するために必要なパッケージは何ですか? テーブル検出と正確なOCRに必要な訓練済みのMLモデルを活用するには、IronOCR NuGetパッケージとIronOcr.Extensions.AdvancedScanningパッケージが必要です。 IronOCRは医療および物流産業の効率をどのように向上させますか? IronOCRは、スキャンした文書からの複雑なテーブルデータの抽出を自動化することで手作業と人的エラーを削減し、医療や物流産業において実質的な効率とコスト削減を提供します。 IronOCRの機能のライブデモを見ることができますか? はい、Iron Softwareのエンジニアと一緒にライブデモを予約することで、IronOCRの実際の動作を見て、テーブルデータを抽出する能力についてもっと学ぶことができます。 Kannapat Udonpant 今すぐエンジニアリングチームとチャット ソフトウェアエンジニア ソフトウェアエンジニアになる前に、Kannapatは北海道大学で環境資源の博士号を修了しました。博士号を追求する間に、彼はバイオプロダクションエンジニアリング学科の一部である車両ロボティクスラボラトリーのメンバーになりました。2022年には、C#のスキルを活用してIron Softwareのエンジニアリングチームに参加し、IronPDFに注力しています。Kannapatは、IronPDFの多くのコードを執筆している開発者から直接学んでいるため、この仕事を大切にしています。同僚から学びながら、Iron Softwareでの働く社会的側面も楽しんでいます。コードやドキュメントを書いていない時は、KannapatはPS5でゲームをしたり、『The Last of Us』を再視聴したりしていることが多いです。 関連する記事 公開日 9月 29, 2025 IronOCRを使用して.NET OCR SDKを作成する方法 IronOCRの.NET SDKで強力なOCRソリューションを構築。シンプルなAPI、エンタープライズ機能、クロスプラットフォーム対応。 詳しく読む 公開日 9月 29, 2025 IronOCRを使用してC# GitHubプロジェクトにOCRを統合する方法 OCR C# GitHubチュートリアル:IronOCRを使用してGitHubプロジェクトにテキスト認識を実装。コードサンプルとバージョン管理のヒントを含む。 詳しく読む 更新日 9月 4, 2025 私たちが文書処理メモリを98%削減した方法:IronOCRのエンジニアリングブレークスルー IronOCR 2025.9は、TIFF処理メモリを98%削減するストリーミングアーキテクチャを採用し、クラッシュを回避し、企業のワークフローのために速度を向上。 詳しく読む なぜIronOCRがLLMよりもOCRに最適なのかより高速かつ効率的なOCR...
公開日 9月 29, 2025 IronOCRを使用して.NET OCR SDKを作成する方法 IronOCRの.NET SDKで強力なOCRソリューションを構築。シンプルなAPI、エンタープライズ機能、クロスプラットフォーム対応。 詳しく読む
公開日 9月 29, 2025 IronOCRを使用してC# GitHubプロジェクトにOCRを統合する方法 OCR C# GitHubチュートリアル:IronOCRを使用してGitHubプロジェクトにテキスト認識を実装。コードサンプルとバージョン管理のヒントを含む。 詳しく読む
更新日 9月 4, 2025 私たちが文書処理メモリを98%削減した方法:IronOCRのエンジニアリングブレークスルー IronOCR 2025.9は、TIFF処理メモリを98%削減するストリーミングアーキテクチャを採用し、クラッシュを回避し、企業のワークフローのために速度を向上。 詳しく読む