如何從PDF文件中讀取條碼

Hairil related to 如何從PDF文件中讀取條碼
海里海西米·賓·奧馬
2023年3月19日
已更新 2024年10月20日
分享:
This article was translated from English: Does it need improvement?
Translated
View the article in English

How to Read Barcode From PDF in C#

  1. 安裝條碼庫來處理條碼文件。

  2. 如有需要,建立PdfBarcodeReaderOptions

  3. 使用 BarcodeReaderReadPdf 方法從 PDF 中讀取條碼。

  4. 使用BarcodeReaderOption指定額外的條碼讀取選項。

  5. 提取條碼值。



    <

直接從 PDF 文件讀取條碼

除了 IronBarcode 能夠從圖像讀取條碼的能力之外,IronBarcode 還自豪於其能夠從 PDF 文件讀取條碼的能力。 這省去了用戶在將PDF文件轉換為圖像之前餵入IronBarcode進行讀取的麻煩。 由於 PDF 文件比圖像更複雜且不同,因此應使用不同的讀取方法,而這就是 BarcodeReader.ReadPdf() 方法。 此方法接受各種類型的PDF文件輸入,包括:

  • byte [] array:PDF 文件作為字節陣列。
  • IEnumerable : PDF documents as byte arrays stored in a collection.
  • MemoryStream:PDF 文件作為 MemoryStream 類型。
  • IEnumerable : PDF documents as collection of MemoryStream
  • String:PDF 文件路徑的字串。如果 PDF 文件已經複製到專案中,這將是 PDF 文件名稱的字串。
  • IEnumerable : PDF document path/name strings stored in a collection.

除了上述提到的輸入類型外,BarcodeReader.ReadPdf() 還接受 PdfBarcodeReaderOptions,以進行更先進/改進的閱讀,我們將在下一個子話題中進行討論。 現在,讓我們看看下面的代碼片段,它演示了使用 BarcodeReader.ReadPdf() 方法來讀取 PDF 文件中的條形碼。

:path=/static-assets/barcode/content-code-examples/how-to/read-barcodes-from-pdf-1.cs
using IronBarCode;
using System;
using System.Collections.Generic;

List<String> docs = new List<String>();
docs.Add(@"pdf_a.pdf");
docs.Add(@"pdf_b.pdf");

var myBarcode = BarcodeReader.ReadPdf(docs);   //can also accept individual PDF document file path as argument

foreach (var value in myBarcode)
{
    Console.WriteLine(value.ToString());
}
Imports IronBarCode
Imports System
Imports System.Collections.Generic

Private docs As New List(Of String)()
docs.Add("pdf_a.pdf")
docs.Add("pdf_b.pdf")

Dim myBarcode = BarcodeReader.ReadPdf(docs) 'can also accept individual PDF document file path as argument

For Each value In myBarcode
	Console.WriteLine(value.ToString())
Next value
$vbLabelText   $csharpLabel

從上面的程式碼片段中,我們可以看到,要使用 IronBarcode 讀取條碼,只需將 PDF 文檔的檔案路徑字串添加到 BarcodeReader.ReadPdf() 方法中即可讀取條碼值,並將結果存儲在變數中。 如果您希望將 PDF 文件中找到的所有條碼的值列印到控制台上,只需使用 foreach 迴圈來迭代並透過調用 ToString() 方法列印變數中找到的每個元素。 此外,上面的代碼片段還展示了使用一組 PDF 文件名稱作為 BarcodeReader.ReadPdf() 的參數。

但如果PDF文件中的條碼無法讀取怎麼辦? 如果性能太慢怎麼辦? 這是高級 PDF 條碼讀取發生的地方,我們將調整PdfBarcodeReaderOptions以提高讀取質量、準確性和性能。

設定 PDF 條碼讀取器選項

與從圖像中讀取條碼相同,從 PDF 文件中讀取條碼也允許用戶調整或修改條碼讀取器中的屬性,稱為 PdfBarcodeReaderOptions。 調整PdfBarcodeReaderOptions的屬性將大大有助於提高質量、準確性以及性能BarcodeReaderOptions 中的所有可調整屬性都在 PdfBarcodeReaderOptions 中繼承,並增加了一些 PDF 文件的附加屬性。 首先,用戶可以在從 PDF 文件中指定他們希望 PdfBarcodeReaderOptions 應用的頁碼頁碼集合,當實例化新的 PdfBarcodeReaderOptions 實例時。 下面的代碼片段示例

:path=/static-assets/barcode/content-code-examples/how-to/read-barcodes-from-pdf-2.cs
using IronBarCode;
using System.Collections.Generic;

List<int> pageNumber = new List<int>() { 1, 2, 3 };

PdfBarcodeReaderOptions PdfOptions = new PdfBarcodeReaderOptions(pageNumber)  // can also use individual page number as argument
{
    // Properties of PDF Barcode reader options
};
Imports IronBarCode
Imports System.Collections.Generic

Private pageNumber As New List(Of Integer)() From {1, 2, 3}

Private PdfOptions As New PdfBarcodeReaderOptions(pageNumber)
$vbLabelText   $csharpLabel

現在,讓我們發現可操作的其他屬性,這些屬性存在於PdfBarcodeReaderOptions中,除了那些在BarcodeReaderOptions中可用的屬性之外。

DPI

用戶可在PDF文件中指定條碼圖像的DPI(每英寸點數)。 這將有助於讀取 PDF 文件中的低質量條形碼圖像。 此屬性可以使用整數值設定。

頁碼

如果使用者事先知道需要讀取條碼的PDF文件中的頁碼,使用者可以在此屬性中指定它們。 這樣做將大大提高IronBarcode的閱讀性能,特別是對於那些有很多頁面的PDF文件,因為IronBarcode不需要讀取所有頁面或者那些不需要讀取條碼的頁面。 此屬性為基於1的,意味著PDF文件的第一頁是1而不是0。

密碼

如名稱所示,此屬性允許用戶處理需要密碼輸入才能訪問PDF文件內容的加密PDF文件。 請注意,IronBarcode 將無法為 PDF 文件設定密碼。 此屬性將接受字串輸入。

規模

此屬性使用戶可以控制將寬度和高度轉換為圖像時的縮放系數。 此屬性接受整數作為值,且該屬性的預設值為 3.5。設定此屬性將有助於讀取 PDF 文件中存在的小型條碼,因為放大會使 PDF 文件變大。

從PDF文件進階條碼讀取

既然我們知道 PdfBarcodeReaderOptions 中可以調整和調整的屬性,讓我們看看如何在項目中應用它們來讀取 PDF 文件中的條碼。

:path=/static-assets/barcode/content-code-examples/how-to/read-barcodes-from-pdf-3.cs
using IronBarCode;
using System;
using System.Collections.Generic;

List<int> pageNumber = new List<int>() { 1, 2, 3 };

PdfBarcodeReaderOptions PdfOptions = new PdfBarcodeReaderOptions(pageNumber)
{
    DPI = 150,
    //PageNumbers = pageNumber,      //this property is not needed if page numbers has been specified as the argument in PdfBarcodeReaderOptions
    Password = "barcode",
    Scale = 3.5,
    //properties below are some of the properties inherited from BarcodeReaderOptions
    Speed = ReadingSpeed.Detailed,
    ExpectBarcodeTypes = BarcodeEncoding.Code93,
    ExpectMultipleBarcodes = true
};

var myBarcode = BarcodeReader.ReadPdf(@"pdf_a_filepath.pdf", PdfOptions);
foreach (var value in myBarcode)
{
    Console.WriteLine(value.ToString());
}
Imports IronBarCode
Imports System
Imports System.Collections.Generic

Private pageNumber As New List(Of Integer)() From {1, 2, 3}

Private PdfOptions As New PdfBarcodeReaderOptions(pageNumber) With {
	.DPI = 150,
	.Password = "barcode",
	.Scale = 3.5,
	.Speed = ReadingSpeed.Detailed,
	.ExpectBarcodeTypes = BarcodeEncoding.Code93,
	.ExpectMultipleBarcodes = True
}

Private myBarcode = BarcodeReader.ReadPdf("pdf_a_filepath.pdf", PdfOptions)
For Each value In myBarcode
	Console.WriteLine(value.ToString())
Next value
$vbLabelText   $csharpLabel

上面的代碼片段演示了如何在 IronBarcode 中實現 PdfBarcodeReaderOptions 屬性。 首先需要使用變數名稱初始化PdfBarcodeReaderOptions,然後才能訪問和調整屬性。 在程式碼片段中,我們也可以看到,PDF 文件的頁碼列表在初始化 PdfBarcodeReaderOptions 時被用作參數。 這指定了我們希望 PdfBarcodeReader 的設置應用的頁碼。 用戶也可以在 PdfBarcodeReaderOptions 屬性中將 PDF 頁碼指定為 PageNumbers

另一方面,我們也可以看到,我們可以在PdfBarcodeReaderOptions中使用繼承自原始類的BarcodeReaderOptions的屬性,如ExpectMultipleBarcodesExpectBarcodeTypes。 這將大大幫助提升整體閱讀效能和準確性。 要將 PdfBarcodeReaderOptions 的設定屬性應用於條碼讀取中,請在 BarcodeReader.ReadPdf() 方法中將我們創建的 PdfBarcodeReaderOptions 類的變量名稱作為第二個參數,並將需要讀取的 PDF 文件路徑作為第一個參數。

Hairil related to 從PDF文件進階條碼讀取
海里海西米·賓·奧馬
軟體工程師
和所有優秀的工程師一樣,Hairil 是一位熱衷學習的人。他正在精進自己對 C#、Python 和 Java 的知識,利用這些知識為 Iron Software 團隊的成員創造價值。Hairil 從馬來西亞的馬來西亞工藝大學加入了 Iron Software 團隊,他在那裡獲得了化學和過程工程學士學位。