如何使用 IronOCR 用 C# 閱讀照片。

This article was translated from English: Does it need improvement?
Translated
View the article in English

IronOCR 的 ReadPhoto 方法可從 TIFF 和 GIF 等複雜照片格式中提取文字,提供具有文字區域和置信度分數的結構化結果,針對需要精確 OCR 處理的高品質掃描文件進行了優化。

在處理大量文件,特別是 TIFF 檔案等掃描影像時,手動擷取文字會變得既耗時又容易出錯。 光學字元識別 (OCR) 將這個過程自動化,將影像中的文字轉換成數位資料。 OCR技術可處理複雜的影像,例如掃描文件和照片,將其轉換成可搜尋、可編輯的文字。 這樣可以加快文件處理速度,並確保資料提取的準確性。

<! -- 引言實作示意圖 --> <!--說明:說明程式碼概念的圖表或截圖 -->

TIFF 和 GIF 等格式上使用 OCR,可以快速將大量資料數位化,儘管它們在大小、色彩深度或壓縮方面有困難。 透過 IronOCR 的 ReadPhoto 功能,開發人員可從影像中擷取文字,並執行進階操作,例如關鍵字搜尋或將掃描的資料轉換成可搜尋的 PDF。 此技術可讓處理法律文件、檔案或收據等對資料檢索效率要求極高的產業受惠。

本教學示範使用 ReadPhoto 以及操作 results 物件。 我們將討論何時使用 ReadPhoto 取代 IronOCR 的標準 Read 。 對於一般的影像處理,請探索 讀取各種影像格式

若要使用此功能,請安裝 IronOcr.Extension.AdvancedScan套件。

快速入門:使用 ReadPhoto 從複雜圖像中提取文字

快速上手:在載入圖像框架的 OcrInput 上使用 IronOCR 的 ReadPhoto 方法來擷取所有文字和區域。 針對 TIFF、GIF 及類似的相片格式進行最佳化。

Nuget Icon立即開始使用 NuGet 建立 PDF 檔案:

  1. 使用 NuGet 套件管理器安裝 IronOCR

    PM > Install-Package IronOcr

  2. 複製並運行這段程式碼。

    var result = new IronTesseract().ReadPhoto(new OcrInput().LoadImageFrame("photo.tiff", 0));
  3. 部署到您的生產環境進行測試

    立即開始在您的專案中使用 IronOCR,免費試用!
    arrow pointer

如何使用 ReadPhoto 從 TIFF 影像中萃取文字? 使用 IronOcr 可以直接讀取 TIFF 和 GIF 等高品質照片格式。 首先,建立一個 `OcrInput` 變數,並使用 `LoadImageFrame` 載入影像。 然後使用 `ReadPhoto` 方法取得結果。 [ 多頁 TIFF OCR 教學](https://ironsoftware.com/csharp/ocr/examples/csharp-tesseract-multipage-tiff/)提供額外的多頁文件範例。 [{i:(@ - TIFF 包含多個框架; `PageNumber` 參數必須使用基於零的索引。 - 本方法目前支援英文、中文、日文、韓文和拉丁字母。 - 在 .NET Framework 上使用進階掃描需要 x64 架構。 @@--括號關閉--@@

我應該使用何種輸入格式? 由於瀏覽器原生不支援 TIFF 格式,請下載 TIFF 輸入 [這裡](/static-assets/ocr/how-to/read-photo/input.tiff)。 以下顯示的版本已轉換為 WEBP。 ![Input](/static-assets/ocr/how-to/read-photo/input.webp)

如何實作 ReadPhoto 方法? 本實作示範從 TIFF 影像中抽取文字和區域資訊。 如需更多範例,請參閱我們的 [圖片讀碼範例](https://ironsoftware.com/csharp/ocr/examples/read-photo/)。 ```csharp :path=/static-assets/ocr/content-code-examples/how-to/read-photo-read-photo.cs ```

OcrPhotoResult 提供哪些屬性? ![顯示 OCR 文字擷取的除錯輸出,包含電話號碼、座標,以及從處理過的影像中擷取的置信分數](/static-assets/ocr/how-to/read-photo/output.webp)。 `OcrPhotoResult` 類提供了分析擷取文字的關鍵屬性。 如需處理 OCR 結果的詳細資訊,請參閱我們的 [ 資料輸出與結果處理指南](https://ironsoftware.com/csharp/ocr/how-to/read-results/)。 **`Text`** :從 OCR 輸入中提取的文字。 **`置信度`**:統計準確度置信度(0-1 標準,1 為最高)。 進一步瞭解 [結果信心分數](https://ironsoftware.com/csharp/ocr/how-to/tesseract-result-confidence/)。 **`TextRegions`**:包含位置資料的文字區域清單。 類似於[定義 OCR 區域](https://ironsoftware.com/csharp/ocr/how-to/ocr-region-of-an-image/)以進行目標擷取。

何時應該使用 ReadPhoto 而非 Read? <!--說明:螢幕截圖或圖表 --> `ReadPhoto` 與標準 `Read` 的主要差異在於 `result` 物件和支援的檔案格式。 `LoadImageFrame` 特別接受 TIFF 和 GIF,而非 JPEG 等格式。 `ReadPhoto` 已針對複雜的影像格式進行最佳化,而標準 `Read` 則適合較簡單的影像和一般 [文字擷取工作](https://ironsoftware.com/csharp/ocr/features/document/)。

為什麼 ReadPhoto 只支援 TIFF 和 GIF 格式? TIFF 是一種無損格式,可將多個頁面和畫面壓縮成一個檔案。它用於高品質、多影像的儲存,例如法律文件和醫療影像。 由於比 JPEG 更為複雜,因此需要不同的文字擷取方法。 專業級的處理方式可確保最佳的結果,並採用專業級的影像格式。 TIFF 影像使用不同的壓縮方法,因此 IronOCR 採用專門的演算法來解讀文字。 `ReadPhoto` 中的先進演算法可處理 TIFF 壓縮特性,確保從複雜的多層文件中準確擷取。 以下是 TIFF 和 JPEG 格式的比較:
特點 TIFF(帶標籤的圖像檔案格式) JPG/JPEG(聯合影像專家小組)
壓縮 無損或未壓縮(保持音質) 有損壓縮(以降低品質為代價減少檔案大小)
文件大小 大號(由於品質高且可選無壓縮) 體積更小,針對網頁使用進行了最佳化,載入速度更快
影像品質 高品質(非常適合專業用途,保留所有細節) 較低(因有損壓縮,部分音質有所損失)
色深 支援高色彩深度(每聲道最高可達 16 位元或 32 位元) 24 位元色彩(1670 萬種顏色)
用例 專業攝影、出版、掃描、存檔 網路圖片、社群媒體、日常照片
透明度 支援透明度和 Alpha 通道 支援透明度
編輯 適合多次編輯(重新儲存不會損失品質) 反覆編輯和保存會導致品質下降。
相容性 專業軟體廣泛支持 在所有平台和裝置上通用
卡通 不支援動畫 不支援動畫
元數據 儲存大量元資料(EXIF、圖層等) 儲存 EXIF 元數據,但功能較為有限。

如何為我的應用程式選擇 ReadPhoto 和 Read? 考慮每個生產使用個案,以最佳化應用程式效能。 雖然 `ReadPhoto` 適合複雜的 TIFF 影像,但處理速度較慢。 JPEG 的處理速度較快,但品質較低,可能會導致 OCR 置信度較低。 必要時使用 [ 影像品質修正篩選器](https://ironsoftware.com/csharp/ocr/how-to/image-quality-correction/) 來改善結果。 `OcrPhotoResults` 或任何 `IOcrResult` 介面類別中的 `confidence` 屬性表示結果的精確度,讓開發人員可以進行測試和最佳化。對於最高的精確度要求,`ReadPhoto` 與高品質的 TIFF 影像可提供最佳的結果,特別是對於精確度很重要的檔案或法律文件處理。 透過確保影像符合特定的品質臨界值,在效率與精確度之間找到平衡。 對於混合的文件類型,實施混合方法:對於需要高準確性的關鍵文件,使用 `ReadPhoto` ;對於以速度為優先的例行任務,則使用標準 `Read` 。

常見問題解答

ReadPhoto 方法支持什么图像格式?

IronOCR 的 ReadPhoto 方法針對 TIFF 和 GIF 等複雜照片格式進行了最佳化。它專門用於從高品質的掃描文件和照片中萃取文字,提供具有文字區域和置信度分數的結構化結果。

如何從 TIFF 影像中萃取文字?

若要使用 IronOCR 從 TIFF 影像中萃取文字,請建立一個 OcrInput 變數,使用 LoadImageFrame 載入影像,然後應用 ReadPhoto 方法。過程簡單直接:var result = new IronTesseract().ReadPhoto(new OcrInput().LoadImageFrame("photo.tiff", 0));

使用 ReadPhoto 功能需要哪些額外套件?

要在 IronOCR 中使用 ReadPhoto 功能,您需要從 NuGet 安裝 IronOcr.Extension.AdvancedScan 套件。此擴充套件提供 ReadPhoto 方法所需的進階掃描功能。

何時應該使用 ReadPhoto 來取代標準的 Read 方法?

在處理 TIFF 和 GIF 等複雜照片格式時,請使用 IronOCR 的 ReadPhoto 方法,特別是需要進行精確 OCR 處理的高品質掃描文件。標準的 Read 方法更適合一般的影像處理工作。

ReadPhoto 能提供什麼樣的結果?

IronOCR 的 ReadPhoto 方法可提供結構化的 OCR 結果,其中包括擷取的文字區域與置信度分數。您可以透過 OcrPhotoResult 屬性存取這些結果,以檢視和處理擷取的資料。

ReadPhoto 可以處理多頁文件嗎?

是的,IronOCR 的 ReadPhoto 方法可以處理多頁文件,尤其是經常包含多個畫格的 TIFF 檔案。LoadImageFrame 方法允許您指定在多頁文件中處理哪一格。

哪些產業可從使用 OCR 技術處理照片中獲益?

IronOCR 可讓處理法律文件、檔案、收據的行業,以及任何處理大量掃描文件的企業獲益,在這些行業中,高效率的資料檢索至關重要。ReadPhoto 方法可自動從這些複雜的影像格式中提取文字。

Curtis Chau
技術作家

Curtis Chau 擁有卡爾頓大學計算機科學學士學位,專注於前端開發,擅長於 Node.js、TypeScript、JavaScript 和 React。Curtis 熱衷於創建直觀且美觀的用戶界面,喜歡使用現代框架並打造結構良好、視覺吸引人的手冊。

除了開發之外,Curtis 對物聯網 (IoT) 有著濃厚的興趣,探索將硬體和軟體結合的創新方式。在閒暇時間,他喜愛遊戲並構建 Discord 機器人,結合科技與創意的樂趣。

準備好開始了嗎?
Nuget 下載 5,246,844 | 版本: 2025.12 剛發表