IronOCR 疑難排解 PDF 的內容區域與裁切區域 使用 IronOCR 處理作物區域和矩形 Curtis Chau 更新:6月 1, 2025 下載 IronOCR NuGet 下載 DLL 下載 Windows 安裝程式 開始免費試用 法學碩士副本 法學碩士副本 將頁面複製為 Markdown 格式,用於 LLMs 在 ChatGPT 中打開 請向 ChatGPT 諮詢此頁面 在雙子座打開 請向 Gemini 詢問此頁面 在雙子座打開 請向 Gemini 詢問此頁面 打開困惑 向 Perplexity 詢問有關此頁面的信息 分享 在 Facebook 上分享 分享到 X(Twitter) 在 LinkedIn 上分享 複製連結 電子郵件文章 This article was translated from English: Does it need improvement? Translated View the article in English 如何使用 IronOCR 設定 PDF 的內容區域? 內容區域和 PDF OcrInput.LoadPdf和LoadPdfPage方法都提供了新增ContentArea 的選項。 問題是-PDF 檔案的大小不是以像素為單位的,但內容區域通常是以像素為單位的,我該如何知道我的內容區域有多大? 選項 1 OcrInput.TargetDPI預設值為 225 - 這決定了 PDF 影像的像素大小。 IronOCR 會看到這則訊息。 方案二(理想使用場景) 使用OcrInput.LoadPdf()載入您的 PDF 範本。 使用OcrInput.GetPages()取得輸入框的寬度和高度。 使用OcrInput.GetPages().First().ToBitmap()取得 OCR 引擎將讀取的確切影像。 現在您可以測量匯出影像中內容區域的像素大小。 目標座標可用於特定的 OCR 區域(請參閱最終結果)。 取得您的資訊: using System.Linq; // Needed for First() using IronOcr; var ocr = new IronTesseract(); using (var input = new OcrInput()) { // Load the PDF document input.LoadPdf("example.pdf"); // Save the first page as a bitmap to measure it input.GetPages().First().ToBitmap().SaveAs("measure-me.bmp"); // Get the dimensions of the first page var width = input.GetPages().First().Width; var height = input.GetPages().First().Height; // Optionally, output the dimensions to understand the scale Console.WriteLine($"Width: {width}px, Height: {height}px"); } using System.Linq; // Needed for First() using IronOcr; var ocr = new IronTesseract(); using (var input = new OcrInput()) { // Load the PDF document input.LoadPdf("example.pdf"); // Save the first page as a bitmap to measure it input.GetPages().First().ToBitmap().SaveAs("measure-me.bmp"); // Get the dimensions of the first page var width = input.GetPages().First().Width; var height = input.GetPages().First().Height; // Optionally, output the dimensions to understand the scale Console.WriteLine($"Width: {width}px, Height: {height}px"); } Imports System.Linq ' Needed for First() Imports IronOcr Private ocr = New IronTesseract() Using input = New OcrInput() ' Load the PDF document input.LoadPdf("example.pdf") ' Save the first page as a bitmap to measure it input.GetPages().First().ToBitmap().SaveAs("measure-me.bmp") ' Get the dimensions of the first page Dim width = input.GetPages().First().Width Dim height = input.GetPages().First().Height ' Optionally, output the dimensions to understand the scale Console.WriteLine($"Width: {width}px, Height: {height}px") End Using $vbLabelText $csharpLabel 最終結果: using IronOcr; using IronSoftware.Drawing; // Needed for Rectangle var ocr = new IronTesseract(); using (var input = new OcrInput()) { // Define the content area rectangle with specific pixel coordinates var contentArea = new Rectangle { X = 215, Y = 1250, Height = 280, Width = 1335 }; //<-- the area you want in px // Load the specific content area of the PDF input.LoadPdf("example.pdf", contentArea: contentArea); // Perform OCR on the defined content area var result = ocr.Read(input); // Optionally, print the OCR result Console.WriteLine(result.Text); } using IronOcr; using IronSoftware.Drawing; // Needed for Rectangle var ocr = new IronTesseract(); using (var input = new OcrInput()) { // Define the content area rectangle with specific pixel coordinates var contentArea = new Rectangle { X = 215, Y = 1250, Height = 280, Width = 1335 }; //<-- the area you want in px // Load the specific content area of the PDF input.LoadPdf("example.pdf", contentArea: contentArea); // Perform OCR on the defined content area var result = ocr.Read(input); // Optionally, print the OCR result Console.WriteLine(result.Text); } Imports IronOcr Imports IronSoftware.Drawing ' Needed for Rectangle Private ocr = New IronTesseract() Using input = New OcrInput() ' Define the content area rectangle with specific pixel coordinates Dim contentArea = New Rectangle With { .X = 215, .Y = 1250, .Height = 280, .Width = 1335 } ' Load the specific content area of the PDF input.LoadPdf("example.pdf", contentArea:= contentArea) ' Perform OCR on the defined content area Dim result = ocr.Read(input) ' Optionally, print the OCR result Console.WriteLine(result.Text) End Using $vbLabelText $csharpLabel API 參考: OcrInput | OcrInput.Page Curtis Chau 立即與工程團隊聊天 技術作家 Curtis Chau 擁有卡爾頓大學計算機科學學士學位,專注於前端開發,擅長於 Node.js、TypeScript、JavaScript 和 React。Curtis 熱衷於創建直觀且美觀的用戶界面,喜歡使用現代框架並打造結構良好、視覺吸引人的手冊。除了開發之外,Curtis 對物聯網 (IoT) 有著濃厚的興趣,探索將硬體和軟體結合的創新方式。在閒暇時間,他喜愛遊戲並構建 Discord 機器人,結合科技與創意的樂趣。 準備好開始了嗎? Nuget 下載 5,167,857 | Version: 2025.11 剛發表 免費下載 NuGet 下載總數:5,167,857 檢視授權