IronOCR ile C#'ta Okuma Sonuçlarını Çıkarma
IronOCR'un Read yöntemi, her algılanan öğe için çıkarılan metin artı kesin koordinatlar, boyutlar, metin yönü ve hiyerarşik yapı (paragraflar, satırlar, kelimeler, karakterler) dahil olmak üzere ayrıntılı meta veriler içeren bir OcrResult nesnesi döndürür.
OCR sonucu, algılanan paragraflar, satırlar, kelimeler ve bireysel karakterler hakkında kapsamlı bilgi içerir.
Her öğe için, metin içeriğini, kesin X ve Y koordinatlarını, boyutları (genişlik ve yükseklik), metin yönünü (Soldan Sağa veya Yukarıdan Aşağıya) ve CropRectangle nesnesindeki konumunu sağlar.
Hızlı Başlat: İlk Algılanan Kelimenin Metnini Al
IronTesseract'nin Read yöntemini kullanarak bir görüntüde OCR işlemi gerçekleştirin ve Kelimes koleksiyonunu kullanarak ilk kelimenin metnini çıkarın.
-
NuGet Paket Yöneticisi ile https://www.nuget.org/packages/IronOcr yükleyin
PM > Install-Package IronOcr -
Bu kod parçasını kopyalayıp çalıştırın.
string wordText = new IronTesseract().Read("file.jpg").Kelimes[0].Text; -
Canlı ortamınızda test etmek için dağıtın
Bugün projenizde IronOCR kullanmaya başlayın ücretsiz deneme ile
Minimal Is Akisi (5 adimda)
- Okuma sonuçlarına erişmek için bir C# kütüphanesi indirin
- Hedef görüntüyü ve PDF belgesini hazırlayın
Readyöntemini kullanarak içe aktarılan belgede OCR gerçekleştirin- Sonucun X, Y, genişlik, yükseklik ve metin yönüne erişin
- Algılanan paragrafları, satırları, kelimeleri ve karakter karşılaştırmalarını kontrol edin
OCR Sonuçlarından Hangi Verileri Çıkarabilirim?
Sonuç değeri sadece çıkarılan metni değil, aynı zamanda IronOCR tarafından PDF ve görüntü belgelerinde keşfedilen sayfalar, paragraflar, satırlar, kelimeler, karakterler ve barkodlar hakkında bilgi içerir. Bu bilgilere, döndürülen OcrResult nesnesinden Read yöntemiyle erişebilirsiniz.
IronOCR'un kapsamlı sonuç sistemi, geliştiricilere sadece basit metin tanımanın ötesinde yapılandırılmış veri çıkarma yetenekleri sunan güçlü Tesseract 5 motoru üzerine kuruludur. Taranmış belgeler, fotoğraflar veya ekran görüntüleri işlensin, OcrResult sınıfı size çıkarılan veriler üzerinde ayrıntılı kontrol sağlar.
:path=/static-assets/ocr/content-code-examples/how-to/read-results-output-information.cs
using IronOcr;
using System;
using static IronOcr.OcrResult;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Add image
using var imageInput = new OcrImageInput("sample.jpg");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
// Retrieve list of detected paragraphs
Paragraph[] paragraphs = ocrResult.Paragraphs;
// Output information to console
Console.WriteLine($"Text: {paragraphs[0].Text}");
Console.WriteLine($"X: {paragraphs[0].X}");
Console.WriteLine($"Y: {paragraphs[0].Y}");
Console.WriteLine($"Width: {paragraphs[0].Width}");
Console.WriteLine($"Height: {paragraphs[0].Height}");
Console.WriteLine($"Text direction: {paragraphs[0].TextDirection}");
Imports IronOcr
Imports System
Imports IronOcr.OcrResult
' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()
' Add image
Private imageInput = New OcrImageInput("sample.jpg")
' Perform OCR
Private ocrResult As OcrResult = ocrTesseract.Read(imageInput)
' Retrieve list of detected paragraphs
Private paragraphs() As Paragraph = ocrResult.Paragraphs
' Output information to console
Console.WriteLine($"Text: {paragraphs(0).Text}")
Console.WriteLine($"X: {paragraphs(0).X}")
Console.WriteLine($"Y: {paragraphs(0).Y}")
Console.WriteLine($"Width: {paragraphs(0).Width}")
Console.WriteLine($"Height: {paragraphs(0).Height}")
Console.WriteLine($"Text direction: {paragraphs(0).TextDirection}")
OCR sonuçlarından metin içeriğine nasıl erişirim?
OcrResult nesnesi, çıkarılan metni basit ve sezgisel bir şekilde sunarak geliştiricilerin bunu doğrudan kullanmasına veya diğer uygulama bileşenlerine entegre etmesine olanak tanır. Hiyerarşik yapı, doğal belge metni organizasyonunu yansıtır ve farklı ayrıntı seviyelerinde içerik ile çalışmayı kolaylaştırır.
Çoklu dil desteğine ihtiyaç duyan uygulamalar için IronOCR, çok dilli belgeleri sorunsuz bir şekilde işler ve desteklenen 125 dil arasında aynı yapılandırılmış sonuç formatını korur.
Aşağıdaki kod örneği, sonuçları doğrulamak için döngü içinde metin yazdırır.
:path=/static-assets/ocr/content-code-examples/how-to/read-results-output-text.cs
using IronOcr;
using System;
using static IronOcr.OcrResult;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Add image
using var imageInput = new OcrImageInput("sampleText.png");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
// Retrieve list of detected paragraphs
Paragraph[] paragraphs = ocrResult.Paragraphs;
// Loop through each paragraph in the array
Console.WriteLine("--- All Detected Paragraphs ---");
foreach (Paragraph paragraph in paragraphs)
{
// Print the text of the current paragraph
Console.WriteLine(paragraph.Text);
// Add a blank line for better separation (optional)
Console.WriteLine();
}
Imports IronOcr
Imports System
Imports IronOcr.OcrResult
' Instantiate IronTesseract
Dim ocrTesseract As New IronTesseract()
' Add image
Using imageInput As New OcrImageInput("sampleText.png")
' Perform OCR
Dim ocrResult As OcrResult = ocrTesseract.Read(imageInput)
' Retrieve list of detected paragraphs
Dim paragraphs As Paragraph() = ocrResult.Paragraphs
' Loop through each paragraph in the array
Console.WriteLine("--- All Detected Paragraphs ---")
For Each paragraph As Paragraph In paragraphs
' Print the text of the current paragraph
Console.WriteLine(paragraph.Text)
' Add a blank line for better separation (optional)
Console.WriteLine()
Next
End Using
Çıktı
Konsol çıktısı, IronOCR'nin paragraf metnini satır satır kesinlikle çıkardığını gösteriyor. Motor, paragraf sınırlarını otomatik olarak algılar, bu da onu çok sayıda metin bloğu içeren karmaşık belgeleri işlemek için ideal kılar.
Algılanan Metnin Konum Koordinatlarını Nasıl Elde Edebilirim?
Çıkarılan metne ek olarak, OcrResult ayrıntılı konum verileri sağlar. Bu mekansal bilgi, uygulamaların düzen doğruluğunu korumasını veya belirli belge bölgelerinden hedefli metin çıkarma işlemlerini gerçekleştirmesini sağlamak için çok önemlidir. Koordinat sistemi, sayfanın sol üst köşesinden standart piksel ölçümleri kullanır.
Koordinat tabanlı işlemlerde hassasiyeti artırmak için OCR bölge hedeflemesi kullanarak belirli alanlara odaklanmayı düşünün veya Bilgisayarlı Görüntü yeteneklerini kullanarak metin bölgelerini otomatik olarak belirleyin.
Aşağıdaki kod, her paragraf üzerinden yineleme yapmayı ve koordinatlarını (X ve Y) konsola yazdırmayı gösterir.
:path=/static-assets/ocr/content-code-examples/how-to/read-results-output-text.cs
using IronOcr;
using System;
using static IronOcr.OcrResult;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Add image
using var imageInput = new OcrImageInput("sampleText.png");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(imageInput);
// Retrieve list of detected paragraphs
Paragraph[] paragraphs = ocrResult.Paragraphs;
// Loop through each paragraph in the array
Console.WriteLine("--- All Detected Paragraphs ---");
foreach (Paragraph paragraph in paragraphs)
{
// Print the text of the current paragraph
Console.WriteLine(paragraph.Text);
// Add a blank line for better separation (optional)
Console.WriteLine();
}
Imports IronOcr
Imports System
Imports IronOcr.OcrResult
' Instantiate IronTesseract
Dim ocrTesseract As New IronTesseract()
' Add image
Using imageInput As New OcrImageInput("sampleText.png")
' Perform OCR
Dim ocrResult As OcrResult = ocrTesseract.Read(imageInput)
' Retrieve list of detected paragraphs
Dim paragraphs As Paragraph() = ocrResult.Paragraphs
' Loop through each paragraph in the array
Console.WriteLine("--- All Detected Paragraphs ---")
For Each paragraph As Paragraph In paragraphs
' Print the text of the current paragraph
Console.WriteLine(paragraph.Text)
' Add a blank line for better separation (optional)
Console.WriteLine()
Next
End Using
Çıktı
Çıktı, üç paragrafa karşılık gelen üç koordinat seti gösterir. Bu koordinatlar, sınırlayıcı kutular çizmek, belirli bölgeleri çıkarmak veya metin öğeleri arasındaki mekansal ilişkileri korumak için kullanılabilir.
OCR Sonuçlarında Başka Hangi Nitelikler Mevcuttur?
Metin ve metin koordinatlarının yanı sıra, IronOCR ek bilgi sağlar. Her bir metin öğesi (paragraflar, satırlar, kelimeler ve bireysel karakterler) için aşağıdaki bilgiler mevcuttur:
- Metin: Gerçek metin bir dizedir.
- X: Sayfanın sol kenarından piksel cinsinden konum.
- Y: Sayfanın üst kenarından piksel cinsinden konum.
- Genişlik: Piksel cinsinden genişlik.
- Yükseklik: Piksel cinsinden yükseklik.
- Metin Yönü: Metnin okunduğu yön (Soldan Sağa veya Yukarıdan Aşağıya).
- Konum: Bu metnin sayfada nerede olduğunu gösteren bir dikdörtgen.
Bu nitelikler özellikle aşağıda belirtilen özelliklerin uygulanmasında faydalıdır:
- Metin vurgulama ve açıklama sistemleri
- Otomatik form alanı algılama
- Belge dönüştürmede düzen koruma
- Veri çıkarma için mekansal metin analizi
Hata ayıklama ve görselleştirme için, algılanan bölge doğruluğunu görsel olarak doğrulamak için metinleri vurgulama özelliğini kullanın.
Paragraflar, Satırlar, Kelimeler ve Karakterler Nasıl Karşılaştırılır?
IronOCR'un hiyerarşik metin yapısı, geliştiricilerin belirli kullanım alanlarına uygun detay seviyesinde çalışmasına olanak tanır. Bu öğeler arasındaki farkları anlamak, uygulamanız için doğru ayrıntı seviyesini seçmenize yardımcı olur.
Aşağıda, algılanan paragraflar, satırlar, kelimeler ve karakterlerin karşılaştırılması bulunmaktadır.
Paragraf |
Satır |
Kelime |
Karakter |
Her ayrıntı seviyesi farklı amaçlara hizmet eder:
- Paragraflar: Belge yapı analizleri ve toplu metin çıkarma için en iyisi
- Satırlar: Okuma sırasını korumak ve tablolu verileri işlemek için faydalı
- Kelimeler: Arama işlevselliği ve metin analizi için ideal
- Karakterler: Yazım denetimi ve hassas metin düzenleme uygulamaları için mükemmel
IronOCR barkodları ve QR kodlarını okuyabilir mi?
Evet, IronOCR barkodları ve QR kodlarını okuyabilir. Özellik belki IronBarcode kadar güçlü olmayabilir, ancak IronOCR, yaygın barkod türleri için destek sağlar. Barkod algılamayı etkinleştirmek için Configuration.ReadBarCodes özelliğini true olarak ayarlayın. Bu entegre işlevsellik, IronOCR'yi metin ve barkod içeren belgeleri işlemek için mükemmel bir seçim yapar, örneğin faturalar, gönderi etiketleri veya ürün katalogları.
Ayrıca, algılanan barkodlardan format, değer, koordinatlar (x, y), yükseklik, genişlik ve bir IronSoftware.Drawing.Rectangle nesnesi olarak konum dahil değerli bilgiler çıkarılabilir. IronDrawing içindeki bu Rectangle sınıfı, belge üzerinde kesin konumlandırmayı sağlar.
Daha gelişmiş barkod okuma senaryoları için, belgelerimizdeki kapsamlı barkod okuma örneklerine göz atın.
:path=/static-assets/ocr/content-code-examples/how-to/read-results-barcodes.cs
using IronOcr;
using System;
using static IronOcr.OcrResult;
// Instantiate IronTesseract
IronTesseract ocrTesseract = new IronTesseract();
// Enable barcodes detection
ocrTesseract.Configuration.ReadBarCodes = true;
// Add image
using OcrInput ocrInput = new OcrInput();
ocrInput.LoadPdf("sample.pdf");
// Perform OCR
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
// Output information to console
foreach(var barcode in ocrResult.Barcodes)
{
Console.WriteLine("Format = " + barcode.Format);
Console.WriteLine("Value = " + barcode.Value);
Console.WriteLine("X = " + barcode.X);
Console.WriteLine("Y = " + barcode.Y);
}
Console.WriteLine(ocrResult.Text);
Imports IronOcr
Imports System
Imports IronOcr.OcrResult
' Instantiate IronTesseract
Private ocrTesseract As New IronTesseract()
' Enable barcodes detection
ocrTesseract.Configuration.ReadBarCodes = True
' Add image
Using ocrInput As New OcrInput()
ocrInput.LoadPdf("sample.pdf")
' Perform OCR
Dim ocrResult As OcrResult = ocrTesseract.Read(ocrInput)
' Output information to console
For Each barcode In ocrResult.Barcodes
Console.WriteLine("Format = " & barcode.Format)
Console.WriteLine("Value = " & barcode.Value)
Console.WriteLine("X = " & barcode.X)
Console.WriteLine("Y = " & barcode.Y)
Next barcode
Console.WriteLine(ocrResult.Text)
End Using
Barkod Algılama Çıkışı Nasıl Görünür?
IronOCR'deki barkod algılama özelliği, metin çıkarımı ile sorunsuz bir şekilde entegre olur, hem metin içeriğini hem de barkod verilerini birleştirilmiş sonuçlar sunar. Bu çift yetenek, hem bilgi türlerinin çıkarılması hem de ilişkilendirilmesi gerektiği otomatik belge işleme iş akışları için değerlidir.
Çıktı, IronOCR'nin aynı anda birden fazla barkod türünü algılama yeteneğini gösterir, her algılanan kod için format tanımlaması (örneğin QRCode veya EAN8), kodlanmış değerler ve kesin koordinat bilgileri sağlar. Bu kapsamlı veri, geliştiricilerin karmaşık içerik türlerini etkili bir şekilde işleyen sofistike belge işleme uygulamaları oluşturmalarına olanak tanır.
Sıkça Sorulan Sorular
OcrResult nesnesi hangi bilgileri içerir?
IronOCR'dan OcrResult nesnesi, çıkarılan metnin yanı sıra kesin X/Y koordinatları, boyutlar (genişlik ve yükseklik), metin yönü (Soldan Sağa veya Yukarıdan Aşağıya) ve hiyerarşik olarak paragraflar, satırlar, kelimeler ve her tespit edilen eleman için bireysel karakterler olarak düzenlenmiş ayrıntılı meta verileri içerir.
OCR sonucundan ilk kelimeyi nasıl hızlıca çıkarabilirim?
IronOCR'un Read yöntemini kullanarak ilk kelimenin metnini ve Kelimeler koleksiyonuna erişerek çıkarabilirsiniz: `string wordText = new IronTesseract().Read("file.jpg").Words[0].Text;`. Bu, OCR sonuçlarından bireysel kelime öğelerine anında erişim sağlar.
OCR sonuçlarında hangi tür koordinat verileri mevcuttur?
IronOCR, her tespit edilen eleman (paragraflar, satırlar, kelimeler ve karakterler) için kesin X ve Y koordinatları sağlarken, genişlik ve yükseklik boyutlarını da sunar. Bu koordinat verileri, metin öğelerinin kesin konum takibine olanak tanıyan CropRectangle nesnesi aracılığıyla erişilebilir.
Metin içeriğinin ötesinde meta verileri çıkarabilir miyim?
Evet, IronOCR, sayfalar, paragraflar, satırlar, kelimeler, karakterler hatta PDF ve görüntü belgelerinde keşfedilen barkodlar dahil kapsamlı meta verileri çıkarır. OcrResult nesnesi, her elemanın metin yönüne, hiyerarşik yapısına ve mekansal bilgilerine erişim sağlar.
OCR sonuçları için hangi belge tipleri işlenebilir?
IronOCR, taranmış belgeler, fotoğraflar, ekran görüntüleri, PDF'ler ve görüntü dosyaları dahil çeşitli belge türlerini işleyebilir. Read yöntemi, bu formatlar arasında tutarlı bir şekilde çalışır ve tam meta verilerle aynı yapısal OcrResult nesnesini döndürür.
Sonuçlarda çıkarılan metin nasıl düzenlenmiştir?
IronOCR, çıkarılan metni doğal belge organizasyonunu yansıtan hiyerarşik bir yapıda düzenler. OcrResult nesnesi, tüm sayfalardan bireysel karakterlere kadar farklı ayrıntı seviyelerinde içerik sunar, böylece uygulamanız için metni uygun seviyede çalışmak kolaylaşır.

