在實際環境中測試
在生產環境中測試無浮水印。
在任何需要的地方都能運作。
光學字符識別 (光學字符識別) 是一種技術,可以將各種文件格式,包括掃描的紙質文件、PDF、數字文件或用數碼相機拍攝的印刷文字圖像,轉換為可編輯和可檢索的機器編碼文本數據。
IronOCR 是一個出色的OCR引擎庫,為開發人員提供強大的OCR功能。在本文中,我們將探討如何使用IronOCR進行OCR,並提供OCR軟體演示的代碼示例。
IronOCR 是一個強大的 .NET 庫,旨在促進光學字符識別 (光學字符識別) 在 C# 和 VB.NET 應用程式中。憑藉先進的算法和機器學習技術,IronOCR 能夠準確地從掃描的 PDF 文件、圖像和 PDF 中提取文字和內容,從而更容易以編程方式處理、搜索和分析這些文件。
藉由其簡單直觀的 API 和廣泛的功能,開發人員能夠無縫地將 OCR 功能整合到其應用程式中,以自動化數據抽取、文件處理、數據輸入和內容管理任務。無論您正在處理商業發票、報告、自動化數據抽取、可搜索的 PDF 或任何其他文本豐富的文件,IronOCR 都提供了可靠的解決方案,能有效地應對 OCR 需求。
在深入了解代碼範例之前,您需要安裝 通過NuGet套件管理器安裝IronOCR. 您可以在套件管理器控制台中運行以下命令來安裝 IronOCR:
Install-Package IronOcr
Install-Package IronOcr
'INSTANT VB TODO TASK: The following line uses invalid syntax:
'Install-Package IronOcr
要使用 IronOCR 執行基本的文本識別,可以使用以下代碼片段:
using IronOcr;
using System;
IronTesseract ocrTesseract = new IronTesseract();
using (OcrInput ocrInput = new OcrInput("ocr.png"))
{
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
string RecognizedText = ocrResult.Text;
Console.WriteLine(RecognizedText);
}
using IronOcr;
using System;
IronTesseract ocrTesseract = new IronTesseract();
using (OcrInput ocrInput = new OcrInput("ocr.png"))
{
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
string RecognizedText = ocrResult.Text;
Console.WriteLine(RecognizedText);
}
Imports IronOcr
Imports System
Private ocrTesseract As New IronTesseract()
Using ocrInput As New OcrInput("ocr.png")
Dim ocrResult As OcrResult = ocrTesseract.Read(ocrInput)
Dim RecognizedText As String = ocrResult.Text
Console.WriteLine(RecognizedText)
End Using
此代碼使用 IronOCR 執行光學字符識別 (光學字符識別) 在名為「ocr.png」的圖像檔上。它會初始化一個 IronTesseract 物件,並將圖像檔的文本層讀取到 OcrInput 物件中。
OCR 結果然後被作為 RecognizedText 檢索並打印到控制台。
- LOGO 商店 - 測試文本 - 測試文本連續 - 專注於技術 - 1 測試文本 $3.20 - 2 手續費 $9.50 - 3 加工費 $5.90 - 4 優惠 $6.00 - 5 申請費 $9.00 - 6 管理費 $0.50 - 7 服務費 $7.60 - 8 總費用 $810 - 總金額 $49.80 - 現金 $50.00
- LOGO 商店 - 測試文本 - 測試文本連續 - 專注於技術 - 1 測試文本 $3.20 - 2 手續費 $9.50 - 3 加工費 $5.90 - 4 優惠 $6.00 - 5 申請費 $9.00 - 6 管理費 $0.50 - 7 服務費 $7.60 - 8 總費用 $810 - 總金額 $49.80 - 現金 $50.00
'INSTANT VB TODO TASK: The following line uses invalid syntax: '- LOGO 商店 - 測試文本 - 測試文本連續 - 專注於技術 - 1 測試文本 $3.20 - 2 手續費 $9.50 - 3 加工費 $5.90 - 4 優惠 $6.00 - 5 申請費 $9.00 - 6 管理費 $0.50 - 7 服務費 $7.60 - 8 總費用 $810 - 總金額 $49.80 - 現金 $50.00
VB C#
請提供內容以進行翻譯。
IronOCR 提供了各種選項,使您能夠根據您的圖像文件和需求自訂 OCR 過程。例如,您可以指定 OCR 語言、調整圖像預處理設置或啟用文本清理。以下是一個展示這些進階選項的範例:
using IronOcr;
class Program
{
static void Main()
{
var ocr = new IronTesseract();
using var ocrInput = new OcrInput();
ocrInput.LoadImage(@"images\image.png");
// Set OCR language to English
ocr.Language = OcrLanguage.English;
// Enable text cleaning
ocrInput.DeNoise();
ocrInput.EnhanceResolution(225);
var result = ocr.Read(ocrInput);
if (result != null && result.Text != null)
{
Console.WriteLine($"Recognized Text: {result.Text}");
}
}
}
using IronOcr;
class Program
{
static void Main()
{
var ocr = new IronTesseract();
using var ocrInput = new OcrInput();
ocrInput.LoadImage(@"images\image.png");
// Set OCR language to English
ocr.Language = OcrLanguage.English;
// Enable text cleaning
ocrInput.DeNoise();
ocrInput.EnhanceResolution(225);
var result = ocr.Read(ocrInput);
if (result != null && result.Text != null)
{
Console.WriteLine($"Recognized Text: {result.Text}");
}
}
}
Imports IronOcr
Friend Class Program
Shared Sub Main()
Dim ocr = New IronTesseract()
Dim ocrInput As New OcrInput()
ocrInput.LoadImage("images\image.png")
' Set OCR language to English
ocr.Language = OcrLanguage.English
' Enable text cleaning
ocrInput.DeNoise()
ocrInput.EnhanceResolution(225)
Dim result = ocr.Read(ocrInput)
If result IsNot Nothing AndAlso result.Text IsNot Nothing Then
Console.WriteLine($"Recognized Text: {result.Text}")
End If
End Sub
End Class
該代碼使用IronOCR在「images」資料夾中的圖像檔「image.png」上執行OCR。它將OCR的語言設置為英文,清除圖像噪音並提高其解析度。從圖像中識別的文本被提取出來,然後打印到控制台。
IronOCR 也支持條碼讀取,允許您製作軟體以從圖片中提取條碼信息。以下是一個展示如何使用 IronOCR 讀取條碼的代碼示例:
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
ocrTesseract.Configuration.ReadBarCodes = true;
using var ocrInput = new OcrInput();
ocrInput.LoadImage(@"images\imageWithBarcode.png");
var ocrResult = ocrTesseract.Read(ocrInput);
foreach (var barcode in ocrResult.Barcodes)
{
Console.WriteLine(barcode.Value);
}
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
ocrTesseract.Configuration.ReadBarCodes = true;
using var ocrInput = new OcrInput();
ocrInput.LoadImage(@"images\imageWithBarcode.png");
var ocrResult = ocrTesseract.Read(ocrInput);
foreach (var barcode in ocrResult.Barcodes)
{
Console.WriteLine(barcode.Value);
}
Imports IronOcr
Imports System
Private ocrTesseract = New IronTesseract()
ocrTesseract.Configuration.ReadBarCodes = True
Dim ocrInput As New OcrInput()
ocrInput.LoadImage("images\imageWithBarcode.png")
Dim ocrResult = ocrTesseract.Read(ocrInput)
For Each barcode In ocrResult.Barcodes
Console.WriteLine(barcode.Value)
Next barcode
代碼使用 IronOCR 檢測並從 "images" 資料夾中的圖像文件 "imageWithBarcode.png" 讀取條形碼。它通過將 ReadBarCodes 設置為 true 來配置 IronOCR 以啟用條形碼讀取。檢測到的條形碼值隨後打印到控制台。
IronOCR 也可以從 PDF 和掃描文件中提取文字。以下是一個用 IronOCR 從 PDF 文件提取文字的代碼示例:
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
// OCR entire document
ocrInput.LoadPdf("Email_Report.pdf");
int[] pages = { 1, 2, 3, 4, 5 };
// Alternatively OCR selected page numbers
ocrInput.LoadPdfPages("example.pdf", pages, Password: "password");
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
using IronOcr;
using System;
var ocrTesseract = new IronTesseract();
using var ocrInput = new OcrInput();
// OCR entire document
ocrInput.LoadPdf("Email_Report.pdf");
int[] pages = { 1, 2, 3, 4, 5 };
// Alternatively OCR selected page numbers
ocrInput.LoadPdfPages("example.pdf", pages, Password: "password");
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
Imports IronOcr
Imports System
Private ocrTesseract = New IronTesseract()
Private ocrInput = New OcrInput()
' OCR entire document
ocrInput.LoadPdf("Email_Report.pdf")
Dim pages() As Integer = { 1, 2, 3, 4, 5 }
' Alternatively OCR selected page numbers
ocrInput.LoadPdfPages("example.pdf", pages, Password:= "password")
Dim ocrResult = ocrTesseract.Read(ocrInput)
Console.WriteLine(ocrResult.Text)
該代碼使用 IronOCR 對名為 "Email_Report.pdf" 的 PDF 文件進行 OCR 處理。它可以使用 LoadPdf 對整個文件進行 OCR,或使用 LoadPdfPages 和密碼從 "example.pdf" 中獲取的特定頁面。從 OCR 操作中識別的文字將打印到控制台。
IronOCR 是功能強大的 .NET 庫,提供先進的OCR軟件功能,讓開發人員在應用程式中輕鬆執行OCR任務。在本文中,我們探討了如何使用IronOCR進行基本和高級的OCR軟件演示,並提供了一些代碼示例。
無論您需要識別手寫文本、各種數字格式、掃描和讀取條形碼,還是從PDF文檔中提取文本,IronOCR都能以其全面的功能滿足您的需求。
如果您正在開發 .NET 項目並需要集成OCR功能,那麼在考慮不同的OCR引擎時,IronOCR絕對值得考慮。其易用性、速度、靈活性和詳盡的文檔使其成為開發人員進行OCR自動化任務的熱門選擇。
那為什麼不試試IronOCR,看它如何簡化您的OCR項目開發過程呢?它可能是您項目中最好的OCR引擎。
IronOCR提供免費 試用授權 然後起價是 $749 美元,讓您可以在項目中繼續充分利用 IronOCR。
了解更多關於 IronOCR 的資訊,請訪問 這裡.