How to Read Table in Documents

This article was translated from English: Does it need improvement?
Translated
View the article in English

文書中の表の読み方について説明しましょう。 Tesseractを使用してテーブルからデータを抽出することは、テキストがセルに存在し、ドキュメントにまばらに散らばっていることが多いため、困難な場合があります。 しかし、私たちのライブラリは、テーブルデータを正確に検出し、抽出するために訓練され、微調整された機械学習モデルを備えています。

単純なテーブルの場合は、まっすぐなテーブル検出を頼りにすることができますが、より複雑な構造の場合は、当社独自の ReadDocumentAdvanced メソッドが堅牢な結果を提供し、テーブルを効果的に解析してデータを配信します。

クイックスタート: 1回の呼び出しで複雑なテーブルセルを抽出

この例では、ReadDocumentAdvancedを使用してIronOCRを呼び出すだけで、複雑なドキュメントから詳細なテーブル・セル・データを取得する方法を示しています。 PDFを読み込み、高度なテーブル検出を適用し、セル情報のリストを直接返すことで、使いやすさを示しています。

Nuget IconGet started making PDFs with NuGet now:

  1. Install IronOCR with NuGet Package Manager

    PM > Install-Package IronOcr

  2. Copy and run this code snippet.

    var cells = new IronTesseract().ReadDocumentAdvanced(new OcrInput().LoadPdf("invoiceTable.pdf")).Tables.First().CellInfos;
  3. Deploy to test on your live environment

    Start using IronOCR in your project today with a free trial
    arrow pointer

以下のステップはIronOCRを使ってテーブルを読み始めるためのガイドです:

よくある質問

C# を使用してドキュメントのテーブルデータ抽出を改善するにはどうすればよいですか?

C#を使用して文書内のテーブルデータ抽出を強化できます。IronOCRの機械学習モデルを利用することで、複雑なテーブルデータを正確に検出および抽出できます。このアプローチは、Tesseractのような標準的なOCRツールを使用するよりも効果的です。

IronOCR の ReadDocumentAdvanced メソッドの目的は何ですか?

IronOCR の ReadDocumentAdvanced メソッドは、効果的な解析とデータ抽出を通じて堅牢な結果を提供することで複雑なテーブルを処理するように設計されています。それは、複雑な構造を持つテーブルを扱うのに特に有用です。

IronOCR を使用したテーブル抽出の開始方法は?

IronOCR を使用してテーブルを抽出するには、C# ライブラリをダウンロードし、ドキュメントを準備し、ReadDataTables プロパティを設定してテーブル検出を有効にし、複雑なテーブルに ReadDocumentAdvanced メソッドを使用します。

IronOCRで高度なテーブル抽出に必要な追加のパッケージは何ですか?

IronOCR での高度なテーブル抽出には、Windows 固有の複雑なテーブル構造を効果的に管理するための IronOcr.Extensions.AdvancedScan パッケージが必要です。

IronOCR を使用して抽出されたテーブルデータをどのように整理できますか?

IronOCR は、座標ごとに抽出されたテーブルデータを整理するためのヘルパーメソッドを提供し、複数のテーブルを処理し、特定の行をインデックス別に抽出してデータ管理を改善できます。

IronOCR で抽出されたテーブルセルに含まれるメタデータは何ですか?

IronOCR で抽出されたテーブルセルには、各セル内の X および Y 座標、セルの寸法、テキスト内容などのメタデータが含まれており、詳細なデータ分析と整理が可能です。

.NET Framework との互換性をどのように確保しますか?

IronOCR を使用してテーブル抽出をする際、.NET Frameworkとの互換性を確保するには、プロジェクトをx64アーキテクチャで実行し、プロジェクト設定で「32ビット優先」をチェックオフしてください。

Curtis Chau
テクニカルライター

Curtis Chauは、カールトン大学でコンピュータサイエンスの学士号を取得し、Node.js、TypeScript、JavaScript、およびReactに精通したフロントエンド開発を専門としています。直感的で美しいユーザーインターフェースを作成することに情熱を持ち、Curtisは現代のフレームワークを用いた開発や、構造の良い視覚的に魅力的なマニュアルの作成を楽しんでいます。

開発以外にも、CurtisはIoT(Internet of Things)への強い関心を持ち、ハードウェアとソフトウェアの統合方法を模索しています。余暇には、ゲームをしたりDiscordボットを作成したりして、技術に対する愛情と創造性を組み合わせています。

によってレビュー

A PHP Error was encountered

Severity: Warning

Message: Illegal string offset 'name'

Filename: sections/author_component.php

Line Number: 70

Backtrace:

File: /var/www/ironpdf.com/application/views/main/sections/author_component.php
Line: 70
Function: _error_handler

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 63
Function: view

File: /var/www/ironpdf.com/application/views/products/sections/three_column_docs_page_structure.php
Line: 64
Function: main_view

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 88
Function: view

File: /var/www/ironpdf.com/application/views/products/how-to/index.php
Line: 2
Function: view

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 88
Function: view

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 552
Function: view

File: /var/www/ironpdf.com/application/controllers/Products/Howto.php
Line: 31
Function: render_products_view

File: /var/www/ironpdf.com/index.php
Line: 292
Function: require_once

">

A PHP Error was encountered

Severity: Warning

Message: Illegal string offset 'title'

Filename: sections/author_component.php

Line Number: 84

Backtrace:

File: /var/www/ironpdf.com/application/views/main/sections/author_component.php
Line: 84
Function: _error_handler

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 63
Function: view

File: /var/www/ironpdf.com/application/views/products/sections/three_column_docs_page_structure.php
Line: 64
Function: main_view

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 88
Function: view

File: /var/www/ironpdf.com/application/views/products/how-to/index.php
Line: 2
Function: view

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 88
Function: view

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 552
Function: view

File: /var/www/ironpdf.com/application/controllers/Products/Howto.php
Line: 31
Function: render_products_view

File: /var/www/ironpdf.com/index.php
Line: 292
Function: require_once

A PHP Error was encountered

Severity: Warning

Message: Illegal string offset 'comment'

Filename: sections/author_component.php

Line Number: 85

Backtrace:

File: /var/www/ironpdf.com/application/views/main/sections/author_component.php
Line: 85
Function: _error_handler

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 63
Function: view

File: /var/www/ironpdf.com/application/views/products/sections/three_column_docs_page_structure.php
Line: 64
Function: main_view

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 88
Function: view

File: /var/www/ironpdf.com/application/views/products/how-to/index.php
Line: 2
Function: view

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 88
Function: view

File: /var/www/ironpdf.com/application/libraries/Render.php
Line: 552
Function: view

File: /var/www/ironpdf.com/application/controllers/Products/Howto.php
Line: 31
Function: render_products_view

File: /var/www/ironpdf.com/index.php
Line: 292
Function: require_once