IRONOCR KULLANıMı

Bilgisayarlı Görü ile OCR Metin Tanıma Doğruluğunu Nasıl Artırır

Q: Bilgisayarlı görü OCR doğruluğunu nasıl artırır?

Bilgisayarlı görü, tanımadan önce görüntü ön işlemi uygulayarak OCR doğruluğunu artırır. Düzeltme, gürültü azaltma, ikileme ve çözünürlük artırma gibi teknikler, OCR motorlarının karakterleri yanlış okumasına veya atlamasına neden olan fiziksel yakalama kusurlarını düzeltir. Yapay sinir ağı modelleri, yazı tipleri, el yazısı tarzları ve bozulmuş görüntülerdeki metin kalıplarını tanımayı öğrenerek doğruluğu daha da artırır.

Q: IronOCR hangi ön işleme filtrelerini destekliyor?

IronOCR, OcrInput API üzerinden düzeltme, gürültü azaltma, ikileme, çözünürlük artırma ve birkaç ek filtre destekler. Tek bir geçişte birden fazla filtre zinciri oluşturabilir ve belirli bir belge türü için optimal filtre kombinasyonunu otomatik olarak keşfetmek için OcrInputFilterWizard'ı kullanabilirsiniz.

Q: IronOCR hangi derin öğrenme modeline dayanmaktadır?

IronOCR, LSTM (Uzun Kısa Süreli Bellek) yapay sinir ağı mimarisini kullanan Tesseract 5 tarafından desteklenmektedir. Bu CRNN modeli, yazı tipi değişiklikleri, kısmi örtülmeler ve görüntü bozulmalarını geleneksel şablon bazlı OCR sistemlerine göre daha etkili bir şekilde ele alır.

Q: IronOCR ile bölge tabanlı OCR nasıl gerçekleştirilir?

OcrInput üzerinde hedef alanın x, y, genişlik ve yüksekliğini piksel cinsinden tanımlayan bir CropRectangle ile AddRegion yöntemini kullanın. Ardından IronOCR, tanımayı o bölgeyle sınırlar, formlar ve faturalar gibi yapılandırılmış belgeler için hem hız hem de doğruluğu artırır.

Q: IronOCR taranmış belgelerden aranabilir PDF'ler üretebilir mi?

Evet. Bir OcrInput üzerinde Read'i çağırdıktan sonra, OcrResult nesnesi üzerinde SaveAsSearchablePdf'yi çağırın. Bu, tanınmış metni, belgenin görsel görünümünü korurken tam metin araması sağlayan, orijinal tarama görüntüsünün altına gizli bir katman olarak gömen bir PDF üretir.

Q: IronOCR kaç dili destekliyor?

IronOCR 125'ten fazla dili destekliyor. Her dil, bir NuGet paketi olarak dağıtılan özel bir Tesseract LSTM modeli ile desteklenmektedir. İki veya daha fazla dil karıştıran belgeler için birden fazla dili aynı anda belirtebilirsiniz.

Q: Ön işleme filtreleri hangi sırayla uygulanmalı?

Genel bir kural olarak, sonraki filtrelerin düzgün hizalanmış görüntüler üzerinde çalışabilmesi için ilk olarak düzeltme uygulayın. Daha sonra, gürültü azaltma uygulayın, ardından siyah-beyaz dönüşüme artefaktların kalıcı olarak kodlanmasını önlemek için ikileme yapın. Kaynak düşük çözünürlüklü ise çözünürlük artırmayı erken uygulayın, çünkü ölçekleme sonrası gürültü azaltma, sıkıştırma artefaktlarının güçlendirilmesini önler.

Q: IronOCR'deki güven skorları nasıl çalışır?

IronOCR, OcrResult'taki tanınan her kelime için 0 ile 1 arasında bir güven puanı döndürür. İş belgeleri için 0,85 veya daha yüksek bir puan genellikle güvenilir kabul edilir. Seçtiğiniz eşiğin altındaki kelimeler, manuel inceleme için işaretlenebilir veya ikinci bir tanıma geçişine yönlendirilebilir.

Curtis Chau

Güncellendi:Haziran 20, 2026

Görüntülerden metin çıkarma, belge yamuk geldiğinde, soluk olduğunda veya kötü ışıklandırma altında yakalandığında basit bir işlem gibi gelir. İşte bu noktada, bilgisayarla görme, optik karakter tanımayı kırılgan bir süreçten güvenilir bir sürece dönüştürür. Veri çıkarma öncesinde akıllı görüntü analizi uygulayarak, OCR sistemleri insan seviyesine yaklaşan bir tanıma doğruluğu elde edebilir, aksi halde karışık sonuçlar üretecek taranmış belgeler üzerinden.

Bilgisayarla görme ile OCR, manuel veri girişini ortadan kaldırarak çeşitli belge türlerinde sayısal dönüşüm girişimleri için temel bir teknolojiye dönüştü. Bu kılavuz, bu tekniklerin .NET uygulamalarında metin tanımayı çarpıcı derecede nasıl geliştirdiğini araştırıyor. Düşük kaliteli taramaları düzelten ön işleme filtrelerinden modern OCR motorlarını besleyen sinir ağı mimarilerine kadar, bu kavramları anlamayla gerçek dünya girdi görüntülerini başarıyla işleyebilen belge işleme sistemleri inşa edebileceksiniz.

Aşağıdaki kod örneklerini takip etmek için IronOCR'u NuGet üzerinden kurun:

dotnet add package IronOcr

Ya da NuGet Paket Yöneticisi Konsolu'nu kullanın:

Install-Package IronOcr

IronOCR'un en son sürümünü doğrulamak için IronOCR NuGet paket sayfasını ziyaret edin.

Bilgisayarla Görme ve OCR Arasındaki İlişki Nedir?

Bilgisayarla görme, makineleri görsel bilgiyi yorumlayacak şekilde eğitmek olan daha geniş bir alanı kapsarken, OCR özellikle bir görüntü dosyasındaki basılı veya el yazısı metni makine kodlu metne dönüştürmeye odaklanır. Optik karakter tanıma, bilgisayarla görme içinde uzmanlaşmış bir uygulama olarak çalışır ve görüntü analizi ve desen tanıma için kullanılan birçok aynı temel teknikten yararlanır.

Modern OCR hattı, birbiriyle bağlantılı üç aşamadan oluşur. Metin algılama, taranmış bir görüntüdeki bireysel karakterleri içeren metin bölgelerini belirler, bu alanları arka planlardan, grafiklerden ve diğer görsel elemanlardan izole eder. Görüntü ön işleme daha sonra bu algılanan bölgeleri geliştirerek bozulmaları düzeltir ve karakter görüntülerinin daha ayırt edici hale gelmesi için kontrastı artırır. Son olarak, karakter tanıma ile desen eşleştirme ve sinir ağı çıkarım uygulanarak, her depolanan karakterin görsel temsili ilgili dijital metne dönüştürülür.

Geleneksel OCR teknolojisi, bu aşamalardan herhangi biri mükemmel olmayan girdilerle karşılaştığında zorlanırdı. Biraz döndürülmüş bir tarama tamamıyla saçma şeyler üretebilirken, düşük çözünürlüklü girdi görüntüleri veya arka plan desenlerine sahip basılı belgeler genellikle tamamen başarısız olurdu. Bilgisayarla görme teknikleri, her hattan aşamasının daha uyumlu ve dayanıklı hale gelmesini sağlayarak iş belgeleri, banka ekstreleri ve el yazması notlar arasında başarılı tanıma sağlar.

.NET projenizde OCR çalıştırmanın en hızlı yolu, temel bir tanıma geçişi gerçekleştirmektir:

using IronOcr;

// Initialize the optical character reader
var ocr = new IronTesseract();

// Load scanned document or image file
using var input = new OcrInput();
input.LoadImage("document.png");

// Perform text recognition and data extraction
OcrResult result = ocr.Read(input);
Console.WriteLine(result.Text);

using IronOcr;

// Initialize the optical character reader
var ocr = new IronTesseract();

// Load scanned document or image file
using var input = new OcrInput();
input.LoadImage("document.png");

// Perform text recognition and data extraction
OcrResult result = ocr.Read(input);
Console.WriteLine(result.Text);

Imports IronOcr

' Initialize the optical character reader
Dim ocr As New IronTesseract()

' Load scanned document or image file
Using input As New OcrInput()
    input.LoadImage("document.png")

    ' Perform text recognition and data extraction
    Dim result As OcrResult = ocr.Read(input)
    Console.WriteLine(result.Text)
End Using

$vbLabelText $csharpLabel

Yukarıdaki kod, en basit OCR iş akışını, IronOCR kullanarak gösterir. IronTesseract sınıfı, Tesseract 5 motoru etrafında yönetilen bir sarmalayıcı sağlar, OcrInput ise görüntü dosyası yükleme ve format dönüştürme işlemini yönetir. Temiz, iyi biçimlendirilmiş metin belgeleri için bu basit optik karakter tanıma yöntemi genellikle yeterlidir. Ancak, gerçek dünya taranmış belgeleri nadiren mükemmel durumda gelir, bu nedenle metnin düzgün çıkarılması için ön işleme esansiyaldir.

Giriş

Bilgisayarla Görü Olgunlaşması ile OCR Kullanımı: Metin Tanımada Doğruluğu Nasıl Artırır - Resim 1 - Örnek Giriş Resmi

Çıktı

Bilgisayarla Görü Olgunlaşması ile OCR Kullanımı: Metin Tanımada Doğruluğu Nasıl Artırır - Resim 2 - Konsol Çıktısı

Görüntü Ön İşleme Metin Tanımayı Nasıl İyileştirir?

Görüntü ön işleme, bilgisayar vision işlemlerini kullanarak girdi kalitesini OCR motorunun analiz etmeden önce artırır. Bu dönüşümler, OCR başarısızlıklarının en yaygın nedenlerini ele alır: rotasyon, gürültü, düşük kontrast ve yetersiz çözünürlük. Her ön işleme tekniği belirli bir görüntü kusuruna odaklanır ve stratejik olarak birleştirilmesi, aksi takdirde okunamaz durumdaki basılı belgeleri ve taranmış görüntüleri kurtarabilir.

Döndürme, belgeler eğik bir açıyla tarandığında meydana gelen döndürme yanlış hizalamasını düzeltir. Hafif bir döndürme bile OCR doğruluğunu önemli ölçüde etkiler çünkü optik karakter tanıma yazılımı metin satırlarının yatay olarak ilerlemesini bekler. Döndürme işlemi, metin satırı açılarını analiz eder ve içeriği hizalamak için düzeltici bir dönüş uygulamaktadır.

Gürültü azaltma, dijital eserler, noktacıklar ve tarayıcı tarafından eklenen bozulmaları kaldırır, çünkü bunlar bireysel karakterler olarak yanlış yorumlanabilir. Arka plan desenleri, toz izleri ve sıkıştırma artefaktları, orijinal görüntüde doğru karakter segmentasyonunu engelleyen tüm gürültüyü oluşturur.

İkiveklemleme (binarization), rengi giderir ve gri tonlamaları ortadan kaldırarak görüntüleri saf siyah-beyaza dönüştürür. Bu basitleştirilme, tanıma motorunun baskılı metni arka plandan daha kesin bir şekilde ayrıt edebilmesine yardımcıdır, özellikle renkli kağıt veya solmuş baskıya sahip belgelerdemektup belirlemek zordur.

Çözünürlük artırma, düşük kalite taramalar veya fotoğraflar için piksel yoğunluğunu artırır. Yüksek çözünürlük, OCR yazılımının daha fazla detay analiz etmesini sağlar, benzer görünümlü karakterleri ayırt etme yeteneğini artırır ve eskimiş girişlerde başarılı tanımaya olanak tanır.

using IronOcr;

var ocr = new IronTesseract();

// Load poor quality scan for document processing
using var input = new OcrInput();
input.LoadImage("low-quality-scan.jpg");

// Apply preprocessing filters for improved accuracy
input.Deskew();                   // Correct rotational skew in scanned image
input.DeNoise();                  // Remove digital artifacts from input
input.Binarize();                 // Convert to black and white for text extraction
input.EnhanceResolution(300);     // Boost to 300 DPI for single character clarity

OcrResult result = ocr.Read(input);
Console.WriteLine($"Extracted: {result.Text}");

using IronOcr;

var ocr = new IronTesseract();

// Load poor quality scan for document processing
using var input = new OcrInput();
input.LoadImage("low-quality-scan.jpg");

// Apply preprocessing filters for improved accuracy
input.Deskew();                   // Correct rotational skew in scanned image
input.DeNoise();                  // Remove digital artifacts from input
input.Binarize();                 // Convert to black and white for text extraction
input.EnhanceResolution(300);     // Boost to 300 DPI for single character clarity

OcrResult result = ocr.Read(input);
Console.WriteLine($"Extracted: {result.Text}");

Imports IronOcr

Dim ocr As New IronTesseract()

' Load poor quality scan for document processing
Using input As New OcrInput()
    input.LoadImage("low-quality-scan.jpg")

    ' Apply preprocessing filters for improved accuracy
    input.Deskew()                   ' Correct rotational skew in scanned image
    input.DeNoise()                  ' Remove digital artifacts from input
    input.Binarize()                 ' Convert to black and white for text extraction
    input.EnhanceResolution(300)     ' Boost to 300 DPI for single character clarity

    Dim result As OcrResult = ocr.Read(input)
    Console.WriteLine($"Extracted: {result.Text}")
End Using

$vbLabelText $csharpLabel

Bu örnek, OCR gerçekleştirmeden önce çoklu ön işleme filtrelerini zincirler. Deskew() yöntemi belgeyi analiz eder ve döndürülen düzeltme uygular, DeNoise() ise metin görüntüsünden lekeleri ve eserleri kaldırır. Binarize() çağrısı, taranan görüntüyü daha temiz metin çıkarımı için saf siyah beyaza dönüştürür ve EnhanceResolution() görüntüyü 300 DPI'ye yükseltir -- doğru karakter tanıma için önerilen minimum değer.

Filtre uygulama sırası önemlidir. Genelde, sonraki filtreler tam olarak hizalanmış görüntülerde daha iyi çalıştığından, döndürme düzeltmesi zincirin başında yer almalıdır. Gürültüyü ikiveklemleme öncesi azaltmak, artefaktların siyah-beyaz dönüşümüne kalıcı olarak kodlanmalarını önler. Fatura, makbuz, hasta kayıtları veya taranmış sözleşmeler gibi belirli belge türlerine yönelik filtre kombinasyonlarıyla denemek, belirli bir kullanım durumu için optimal sıralamayı sıklıkla ortaya çıkarır.

Doğru Ön İşleme Filtre Kombinasyonu Nasıl Seçilir?

Doğru filtre kombinasyonunu seçmek, girdi belgesinin doğasına bağlıdır. Bakış açısı bozulmasına sahip kamera ile çekilmiş görüntüler, önce döndürme düzeltmesi, ardından gürültü giderme ile fayda sağlar. Faksla veya fotokopi çekilmiş belgeler, karakterlerin etrafında gri hale kesmek için agresif ikiveklemleme gerektirir. Düşük çözünürlüklü taramalar, herhangi bir başka filtreden önce çözünürlük artırma gerektirir çünkü gürültü giderme öncesi büyütme sıkıştırma artefaktlarını büyütme önlendiği için.

Pratik bir yaklaşım, belge kaynaklarınızı kategorize etmek – tarayıcı, kamera, faks, PDF rasterizasyonu – ve her biri için özel bir filtre zinciri uygulamaktır. IronOCR, bir seferde ihtiyaç duyulan kadar çok filtreyi OcrInput ile zincirleme desteği sunar, böylece kaynak başına profilleri yapılandırmada tanımlayıp, tanıma mantığını yeniden yazmadan çalışma zamanında uygulayabilirsiniz.

Modern OCR'yi Hangi Derin Öğrenme Modelleri Besler?

Günümüzün OCR motorları, metin tanıma doğruluğunu devrim yaratmış derin öğrenme mimarilerine dayanır. Karakterleri önceden tanımlanmış şablonlarla eşleştiren geleneksel yaklaşımların aksine, sinir agları tabanlı OCR modelleri, yazı tipindeki çeşitlilikleri, el yazı stillerini ve bozulmuş görüntüleri çok daha etkili bir şekilde ele alarak, devasa eğitim veri kümelerinden metin desenlerini tanımayı öğrenir. Bu makine öğrenimi yaklaşımı, günümüzün en yetenekli OCR çözümlerini besler.

Tanıma hattı tipik olarak iki tür sinir ağı kombinasyonunu kullanır. Konvolüsyonel Sinir Ağları (CNN'ler), görüntülerden özellik çıkarmada uzmanlaşmıştır. Bu ağlar, girdiyi, giderek daha karmaşık desenleri - temel kenarlar ve eğrilerden tüm karakter şekillerine kadar - tanımlayan katmanlardan geçirerek işler. CNN, metin bölgesinin görsel özelliklerini kodlayan bir özellik haritası üretir ve basılı metinle el yazısı metni, geliştirilmiş doğrulukla tareder.

Long Short-Term Memory (LSTM) ağları, bu özellikleri bir sıra olarak işler, dijital metnin belirli bir sırayı takip ettiğini kabul eder. LSTM'ler, önceki girişlerin belleğini korur, bu da onların bağlamı anlamalarına ve yazılı dilin sıralı doğasını ele almalarına olanak tanır. Bu kombinasyon – genellikle CRNN (Konvolüsyonel Rekurent Sinir Ağı) olarak adlandırılır – modern OCR doğruluğunun bel kemiğini oluşturur ve birden fazla dilde akıllı karakter tanıma sağlar.

IronOCR'u çalıştıran Tesseract 5 motoru, bu LSTM tabanlı mimariyi uygular ve geleneksel desen tanımaya tamamen bağlı lojari e daha önceki versiyonlar üzerine önemli bir gelişme sağlar. Sinir ağı yaklaşımı, önceki OCR sistemlerini yenebilecek belirli yazı tiplerini, kısmi örtüşmeleri ve görüntü bozulmalarını işler.

using IronOcr;

var ocr = new IronTesseract();

// Configure OCR engine for multilingual text recognition
ocr.Language = OcrLanguage.English;  // IronOCR supports 125+ languages

// Process PDF with mixed handwriting styles and printed text
using var input = new OcrInput("web-report.pdf");
input.Deskew();

OcrResult result = ocr.Read(input);

// Access detailed recognition data including text regions
foreach (var page in result.Pages)
{
    Console.WriteLine($"Page {page.PageNumber}: {page.Text}");
}

using IronOcr;

var ocr = new IronTesseract();

// Configure OCR engine for multilingual text recognition
ocr.Language = OcrLanguage.English;  // IronOCR supports 125+ languages

// Process PDF with mixed handwriting styles and printed text
using var input = new OcrInput("web-report.pdf");
input.Deskew();

OcrResult result = ocr.Read(input);

// Access detailed recognition data including text regions
foreach (var page in result.Pages)
{
    Console.WriteLine($"Page {page.PageNumber}: {page.Text}");
}

Imports IronOcr

Dim ocr As New IronTesseract()

' Configure OCR engine for multilingual text recognition
ocr.Language = OcrLanguage.English  ' IronOCR supports 125+ languages

' Process PDF with mixed handwriting styles and printed text
Using input As New OcrInput("web-report.pdf")
    input.Deskew()

    Dim result As OcrResult = ocr.Read(input)

    ' Access detailed recognition data including text regions
    For Each page In result.Pages
        Console.WriteLine($"Page {page.PageNumber}: {page.Text}")
    Next
End Using

$vbLabelText $csharpLabel

IronTesseract sınıfı, Tesseract 5'in yapay sinir ağı yeteneklerine temiz bir .NET arayüzü üzerinden erişim sağlar. Dönen OcrResult nesnesi, yalnızca çıkarılan metni değil, aynı zamanda sayfalar, paragraflar, satırlar ve her bir kelimenin güven puanları ve sınır koordinatları ile birlikte yapılandırılmış verileri de içerir.

Giriş

Bilgisayarla Görü Olgunlaşması ile OCR Kullanımı: Metin Tanımada Doğruluğu Nasıl Artırır - Resim 3 - Örnek PDF Girişi

Çıktı

Bilgisayarla Görü Olgunlaşması ile OCR Kullanımı: Metin Tanımada Doğruluğu Nasıl Artırır - Resim 4 - OCR Çıkışı

Bu yapılandırılmış çıktı, basit metin çıkarma ötesindeki uygulamalar için değerli olduğunu kanıtlar. Belge işleme sistemleri, karmaşık düzenleri anlamak için kelime konumlarını kullanabilirken, kalite güvence iş akışları, insan incelemesi için düşük güven düzeyine sahip bölgeleri işaretleyebilir. Sinir ağı mimarisi, tanınan metnin yanında zengin meta veriler sağlayarak, büyük hacimlerde yapılandırılmamış veriyi verimli bir şekilde işleyen AI tabanlı OCR çözümlerini mümkün kılar.

IronOCR Çok Dilli Belgeleri Nasıl Ele Alır?

IronOCR, her biri adanmış bir Tesseract LSTM dil modeli tarafından desteklenen 125'ten fazla dili destekle ve birlikte gelir. Bir dili seçmek için Read çağrılmadan önce IronTesseract üzerinde Language özelliğini ayarlarsınız. İki dili karıştıran belgeler için – örneğin İngilizce dipnotları olan bir Almanca sözleşme – birden fazla dili aynı anda belirtebilirsiniz ve motor, metin bölgesi başına en uygun modeli uygular.

Dil paketleri, NuGet paketleri olarak dağıtılır, böylece uygulamanızın ihtiyaç duyduğu modelleri indirirsiniz. Bu, tek bir dili hedefleyen uygulamalar için dağıtım boyutunu yönetilebilir tutarken, gerektiğinde tam çok dilli desteğe de izin verir.

Formlar ve Tablolar için Bölge Temelli OCR Nasıl Etkinleştirilir?

Bölge temelli OCR, belgeler belirli ilgi bölgeleri - form alanları, fatura satır kalemleri veya tablo hücreleri gibi - içerdiğinde tanımayı tanımlanmış alanlarla sınırlandırır. Bu hedefe yönelik yaklaşım, ilgili içeriğe odaklanarak hem hız hem de doğruluğu artırır.

using IronOcr;
using IronSoftware.Drawing;

var ocr = new IronTesseract();

using var input = new OcrInput();
input.LoadImage("invoice.jpg");

// Define a crop region for the total amount field (x, y, width, height in pixels)
var totalRegion = new CropRectangle(x: 600, y: 800, width: 300, height: 50);
input.AddRegion(totalRegion);

OcrResult result = ocr.Read(input);
Console.WriteLine($"Invoice total: {result.Text}");

using IronOcr;
using IronSoftware.Drawing;

var ocr = new IronTesseract();

using var input = new OcrInput();
input.LoadImage("invoice.jpg");

// Define a crop region for the total amount field (x, y, width, height in pixels)
var totalRegion = new CropRectangle(x: 600, y: 800, width: 300, height: 50);
input.AddRegion(totalRegion);

OcrResult result = ocr.Read(input);
Console.WriteLine($"Invoice total: {result.Text}");

Imports IronOcr
Imports IronSoftware.Drawing

Dim ocr As New IronTesseract()

Using input As New OcrInput()
    input.LoadImage("invoice.jpg")

    ' Define a crop region for the total amount field (x, y, width, height in pixels)
    Dim totalRegion As New CropRectangle(x:=600, y:=800, width:=300, height:=50)
    input.AddRegion(totalRegion)

    Dim result As OcrResult = ocr.Read(input)
    Console.WriteLine($"Invoice total: {result.Text}")
End Using

$vbLabelText $csharpLabel

Bölge temelli OCR'yi güven eşiğiyle birleştirmek, veri kalitesi üzerinde ince ayarlı kontrol sağlar. Finansal belgeler ve hukuki materyaller için πρατικ bir eşik, kaynaklardan gelen her bir taramanın kalitesine göre belgenin türüne göre güven eşiği ayarlarını esnetmektir.

IronOCR dokümantasyonunda bölge tabanlı OCR ve kırpma dikdörtgenleri hakkında daha fazla bilgi edinin.

Geliştiriciler OCR Doğruluğunu Nasıl Optimize Edebilirleri Programatik Olarak?

Standart ön işleme filtrelerini uygulamanın ötesinde, spesifik belge türleri ve kalite gereksinimleri için OCR'nin nasıl performans göstereceği üzerinde ince ayar yapabilirsiniz. Güven puanlaması, otomatik filtre optimizasyonu ve arama yapılabilir PDF oluşturulması, üretim uygulamalarında tanıma doğruluğunu en üst düzeye çıkarmaya katkıda bulunur ve bu uygulamalar, çeşitli belge türlerinde metni güvenilir bir şekilde tanımalıdır.

Güven puanları, motorun her tanınan öğe hakkında ne kadar emin olduğunu gösterir. Bu puanların analiz edilmesi, manuel doğrulama veya alternatif işleme yaklaşımları gerektirebilecek sorunlu alanların belirlenmesine yardımcı olur. Uygulamalar, yüksek doğruluk gerektiren hassas belgeler için sonuçların inceleme için işaretlendiği eşik seviyelerini ayarlayabilir.

using IronOcr;

var ocr = new IronTesseract();

// Load business document for OCR processing
using var input = new OcrInput("receipt.jpg");

// Let the system determine optimal preprocessing for OCR accuracy
string suggestedCode = OcrInputFilterWizard.Run(
    "receipt.jpg",
    out double confidence,
    ocr);

Console.WriteLine($"Achieved confidence: {confidence:P1}");
Console.WriteLine($"Optimal filter chain: {suggestedCode}");

// Apply recommended filters for successful recognition
input.DeNoise();
input.Deskew();

OcrResult result = ocr.Read(input);

// Analyze word-level confidence for extracted text
foreach (var word in result.Words)
{
    if (word.Confidence < 0.85)
    {
        Console.WriteLine($"Low confidence: '{word.Text}' ({word.Confidence:P0})");
    }
}

using IronOcr;

var ocr = new IronTesseract();

// Load business document for OCR processing
using var input = new OcrInput("receipt.jpg");

// Let the system determine optimal preprocessing for OCR accuracy
string suggestedCode = OcrInputFilterWizard.Run(
    "receipt.jpg",
    out double confidence,
    ocr);

Console.WriteLine($"Achieved confidence: {confidence:P1}");
Console.WriteLine($"Optimal filter chain: {suggestedCode}");

// Apply recommended filters for successful recognition
input.DeNoise();
input.Deskew();

OcrResult result = ocr.Read(input);

// Analyze word-level confidence for extracted text
foreach (var word in result.Words)
{
    if (word.Confidence < 0.85)
    {
        Console.WriteLine($"Low confidence: '{word.Text}' ({word.Confidence:P0})");
    }
}

Imports IronOcr

Dim ocr As New IronTesseract()

' Load business document for OCR processing
Using input As New OcrInput("receipt.jpg")

    ' Let the system determine optimal preprocessing for OCR accuracy
    Dim confidence As Double
    Dim suggestedCode As String = OcrInputFilterWizard.Run("receipt.jpg", confidence, ocr)

    Console.WriteLine($"Achieved confidence: {confidence:P1}")
    Console.WriteLine($"Optimal filter chain: {suggestedCode}")

    ' Apply recommended filters for successful recognition
    input.DeNoise()
    input.Deskew()

    Dim result As OcrResult = ocr.Read(input)

    ' Analyze word-level confidence for extracted text
    For Each word In result.Words
        If word.Confidence < 0.85 Then
            Console.WriteLine($"Low confidence: '{word.Text}' ({word.Confidence:P0})")
        End If
    Next
End Using

$vbLabelText $csharpLabel

OcrInputFilterWizard, bir görüntüyü analiz eder ve en yüksek güven düzeyine sahip sonuçları üreten ön işleme zincirini belirlemek için çeşitli filtre kombinasyonlarını test eder. Bu otomatik yaklaşım, tanıdık olmayan belge türleriyle uğraşırken tahmin yürütmeyi ortadan kaldırır. Sihirbaz, elde edilen güven seviyesi ve en iyi yapılandırmayı çoğaltmak için gereken kodu geri döndürerek iş süreçleri için OCR uygulama gelişimini kolaylaştırır.

Döngüde gösterilen kelime seviyesindeki güven analizi, ayrıntılı bir kalite değerlendirmesi sağlar. Finansal belgeleri, hasta kayıtlarını veya yasal materyalleri işleyen uygulamalar, çıkarılan verilerin doğruluk standartlarına uygun olduğunu sağlamak için genellikle bu seviyede bir inceleme gerektirir. Güven eşiğinin altına düşen kelimeler, güvenilirlik gerektiren veri yönetim iş akışlarını desteklemek için ikincil doğrulama süreçlerini veya alternatif tanıma denemelerini başlatabilir.

Taranmış Belgelerden Aranabilir PDF'ler Nasıl Oluşturulur?

Arşivlenebilir dosyalar için dönüşüm gerektiren belgeler için, IronOCR tam metin arama imkanı sunarken görsel sadakati koruyan, tanınan metni orijinal görüntünün altına gömerek arama yapılabilir PDF'ler oluşturabilir. Bu yetenek, taranmış belgeleri uzun süreli arşivleme, yasal keşif iş akışları veya kurumsal içerik yönetim sistemleri için uygun bir dijital formata dönüştürür.

using IronOcr;

var ocr = new IronTesseract();

using var input = new OcrInput("scanned-contract.pdf");
input.Deskew();
input.DeNoise();

OcrResult result = ocr.Read(input);

// Export as searchable PDF with embedded text layer
result.SaveAsSearchablePdf("searchable-contract.pdf");
Console.WriteLine("Searchable PDF saved successfully.");

using IronOcr;

var ocr = new IronTesseract();

using var input = new OcrInput("scanned-contract.pdf");
input.Deskew();
input.DeNoise();

OcrResult result = ocr.Read(input);

// Export as searchable PDF with embedded text layer
result.SaveAsSearchablePdf("searchable-contract.pdf");
Console.WriteLine("Searchable PDF saved successfully.");

Imports IronOcr

Dim ocr As New IronTesseract()

Using input As New OcrInput("scanned-contract.pdf")
    input.Deskew()
    input.DeNoise()

    Dim result As OcrResult = ocr.Read(input)

    ' Export as searchable PDF with embedded text layer
    result.SaveAsSearchablePdf("searchable-contract.pdf")
    Console.WriteLine("Searchable PDF saved successfully.")
End Using

$vbLabelText $csharpLabel

Ortaya çıkan dosya, orijinal taramanın görsel görünümünü korurken, arama araçları ve ekran okuyucularının erişebileceği gizli bir metin katmanı ekler. Bu, uyum veya erişilebilirlik gereksinimlerini hedefleyen belge dijitalleştirme projeleri için standart çıktı formatıdır.

Bazı Belge Türleri Arasında OCR Performansını Nasıl Karşılaştırırsınız?

Farklı belge kategorileri -- basılı formlar, el yazısı notlar, düşük kaliteli faks iletimleri ve yüksek çözünürlüklü kamera çekimleri -- ön işleme ve tanıma ayarlarına farklı tepkiler verir. Boru hattınızı her kategoriden temsilci örneklerle karşılaştırarak doğruluk boşluklarının nerede olduğunu ve hangi filtrelerin ayarlanacağını ortaya çıkarır.

Belge türüne göre OCR ön işleme önerileri
Belge Türü	Önerilen Filtreler	Tipik Doğruluk Artışı	Birincil Zorluk
Tarayıcıdan Taratılmış Metin	Eğik Düzelt, İkili Yap	5-15%	Hafif döndürme, gölge kenarları
Kamera ile Çekilmiş Belge	Eğik Düzelt, Gürültü Gider, Çözünürlüğü Artır	20-40%	Perspektif bozulması, gürültü
Faks / fotokopi	İkili Yap, Gürültü Gider	15-30%	Yarım ton desenler, bozulmuş kontrast
Low-resolution scan (<150 DPI)	Çözünürlüğü Artır(300), Eğik Düzelt	30-50%	Yetersiz piksel yoğunluğu
El yazısı notlar	İkili Yap, Gürültü Gider	10-25%	Değişken darbe genişliği, stil varyasyonu

Bu doğruluk iyileştirmeleri, akademik OCR karşılaştırma çalışmalarından elde edilen ön işleme etkisi araştırmalarına dayanan yönsel tahminlerdir. Gerçek sonuçlar, tarama ekipmanı, belge yaşı ve içerik karmaşıklığına bağlı olarak değişir. Kendi örnek kümeniz üzerinde OcrInputFilterWizard çalıştırmak, boru hattınıza özel ampirik veri sağlar.

Boru hattını ayarlarken elinizde bulunan tüm seçenekleri anlamak için mevcut IronOCR ön işleme filtreleri listesini inceleyin.

Üretim Belgeleri İşleme İçin Önemli IronOCR Özellikleri Nelerdir?

Üretimde OCR uygularken, temel tanımanın ötesinde birkaç IronOCR işlevi güvenilirlik ve verimlilik için önemli hale gelir. Bu özellikleri anlamak, doğruluğu feda etmeden ölçeklenen bir boru hattı tasarlamanıza yardımcı olur.

Çok formatlı giriş desteği -- IronOCR, birleştirilmiş bir API aracılığıyla görüntüleri (PNG, JPEG, TIFF, BMP, GIF, WEBP), PDF dosyalarını ve çok sayfalı TIFF'leri kabul eder. Bu, tarama istasyonlarından, e-posta eklerinden veya belge yönetim sistemlerinden gelen her türlü formatı format özel kod yolları yazmadan işleyebileceğiniz anlamına gelir.

İş parçacığı güvenliği -- IronTesseract sınıfı, tek bir örnek oluşturduğunuzda ve iş parçacıkları arasında paylaştığınızda iş parçacığı açısından güvenlidir. Yüksek verimli uygulamalar için, her iş parçacığına bir örnek oluşturun veya temel Tesseract motorunda kilit yarışmasını önlemek için bir havuz kullanın.

Barkod ve QR kod ortak işleme -- IronOCR, bir gönderi etiketi veya ürün envanteri sayfaları gibi karışık içerikli belgeleri işlerken, ayrı bir barkod kütüphanesine ihtiyaç duymadan aynı resimden bir geçişte barkodlar ve QR kodlar okuyabilmektedir.

Çıkış format seçenekleri -- Düz metnin ötesinde, IronOCR HOCR formatında yapılandırılmış veriler döndürebilir, doğrudan arama yapılabilir PDF'lere dışa aktarabilir ve aşağı akış veri çıkarma iş akışları için uygun kelime sınırlayıcı kutular sağlayabilir.

Mimarinizi sonlandırmadan önce tüm yetenekleri görmek için IronOCR özellikleri genel bakışını inceleyin.

Sonraki Adımlarınız Neler?

Bilgisayar görüşü teknikleri, optik karakter tanımayı yalnızca kusursuz girdi ile çalışan bir teknolojiden, taranmış belgelerin, fotoğrafların ve bozulmuş görüntülerin karmaşık gerçekliğini işleyebilen bir yapıya dönüştürür. Ön işleme aşaması -- eğikliği giderme, gürültüyi giderme, binarizasyon ve çözünürlük artırma -- fiziksel yakalama kusurlarını ele alırken, CNN-LSTM gibi sinir ağı mimarileri, çeşitli yazı tipleri ve el yazısı stillerini doğru bir şekilde yorumlamak için yazı tanıma zekası sağlar.

.NET geliştiricileri için, IronOCR bu yetenekleri yönetilebilir bir kütüphaneye paketler ve yerel Tesseract entegrasyonunu basitleştirirken, üretim kullanımı için pratik geliştirmeler ekler. Otomatik ön işleme optimizasyonu, ayrıntılı güven raporlama ve yapılandırılmış sonuç verilerinin birleşimi, basılı belgelerden el yazısı notlara kadar çeşitli gerçek dünya girdilerinde güvenilir performans gösteren belge işleme sistemleri sağlar ve birden çok dilde çok dilli OCR'yi destekler.

İlerlemek için:

IronOCR ücretsiz deneme sürümünü indirin ve bu kılavuzdan kod örneklerini kendi belgelerinize karşı çalıştırın
PDF metin çıkarma, form alanı okuma ve yığın işleme gibi yaygın kullanım durumlarını kapsamlı olarak inceleyen IronOCR eğitimlerini inceleyin
IronTesseract, OcrInput ve OcrResult'ın tam yüzeyini anlamak için IronOCR API referansını keşfedin.
Dağıtım senaryonuz için doğru planı seçmek adına IronOCR lisanslama seçeneklerini kontrol edin

Sıkça Sorulan Sorular

Bilgisayarlı görü OCR doğruluğunu nasıl artırır?

Bilgisayarlı görü, tanımadan önce görüntü ön işlemi uygulayarak OCR doğruluğunu artırır. Düzeltme, gürültü azaltma, ikileme ve çözünürlük artırma gibi teknikler, OCR motorlarının karakterleri yanlış okumasına veya atlamasına neden olan fiziksel yakalama kusurlarını düzeltir. Yapay sinir ağı modelleri, yazı tipleri, el yazısı tarzları ve bozulmuş görüntülerdeki metin kalıplarını tanımayı öğrenerek doğruluğu daha da artırır.

IronOCR hangi ön işleme filtrelerini destekliyor?

IronOCR, OcrInput API üzerinden düzeltme, gürültü azaltma, ikileme, çözünürlük artırma ve birkaç ek filtre destekler. Tek bir geçişte birden fazla filtre zinciri oluşturabilir ve belirli bir belge türü için optimal filtre kombinasyonunu otomatik olarak keşfetmek için OcrInputFilterWizard'ı kullanabilirsiniz.

IronOCR hangi derin öğrenme modeline dayanmaktadır?

IronOCR, LSTM (Uzun Kısa Süreli Bellek) yapay sinir ağı mimarisini kullanan Tesseract 5 tarafından desteklenmektedir. Bu CRNN modeli, yazı tipi değişiklikleri, kısmi örtülmeler ve görüntü bozulmalarını geleneksel şablon bazlı OCR sistemlerine göre daha etkili bir şekilde ele alır.

IronOCR ile bölge tabanlı OCR nasıl gerçekleştirilir?

OcrInput üzerinde hedef alanın x, y, genişlik ve yüksekliğini piksel cinsinden tanımlayan bir CropRectangle ile AddRegion yöntemini kullanın. Ardından IronOCR, tanımayı o bölgeyle sınırlar, formlar ve faturalar gibi yapılandırılmış belgeler için hem hız hem de doğruluğu artırır.

IronOCR taranmış belgelerden aranabilir PDF'ler üretebilir mi?

Evet. Bir OcrInput üzerinde Read'i çağırdıktan sonra, OcrResult nesnesi üzerinde SaveAsSearchablePdf'yi çağırın. Bu, tanınmış metni, belgenin görsel görünümünü korurken tam metin araması sağlayan, orijinal tarama görüntüsünün altına gizli bir katman olarak gömen bir PDF üretir.

IronOCR kaç dili destekliyor?

IronOCR 125'ten fazla dili destekliyor. Her dil, bir NuGet paketi olarak dağıtılan özel bir Tesseract LSTM modeli ile desteklenmektedir. İki veya daha fazla dil karıştıran belgeler için birden fazla dili aynı anda belirtebilirsiniz.

Ön işleme filtreleri hangi sırayla uygulanmalı?

Genel bir kural olarak, sonraki filtrelerin düzgün hizalanmış görüntüler üzerinde çalışabilmesi için ilk olarak düzeltme uygulayın. Daha sonra, gürültü azaltma uygulayın, ardından siyah-beyaz dönüşüme artefaktların kalıcı olarak kodlanmasını önlemek için ikileme yapın. Kaynak düşük çözünürlüklü ise çözünürlük artırmayı erken uygulayın, çünkü ölçekleme sonrası gürültü azaltma, sıkıştırma artefaktlarının güçlendirilmesini önler.

IronOCR'deki güven skorları nasıl çalışır?

IronOCR, OcrResult'taki tanınan her kelime için 0 ile 1 arasında bir güven puanı döndürür. İş belgeleri için 0,85 veya daha yüksek bir puan genellikle güvenilir kabul edilir. Seçtiğiniz eşiğin altındaki kelimeler, manuel inceleme için işaretlenebilir veya ikinci bir tanıma geçişine yönlendirilebilir.

Curtis Chau

Mühendislik ekibiyle şimdi sohbet edin

Teknik Yazar

Curtis Chau, Bilgisayar Bilimleri alanında Lisans Derecesine (Carleton Üniversitesi) sahip ve Node.js, TypeScript, JavaScript ve React konularında uzmanlaşmış ön uç geliştirmeyle ilgileniyor. Sezgisel ve estetik açıdan hoş kullanıcı arayüzleri oluşturma tutkunu, Curtis modern çerçevelerle çalışmayı ve iyi yapı...

Daha Fazla Oku

İlgili Makaleler

Güncellendi Nisan 21, 2026

C#'da Gerçekten Yararlı Veri Çıkaran Bir Fiş OCR API'si Oluşturun

IronOCR kullanarak C#'da fiş OCR API'si oluşturun. Fiş görsellerinden yapılandırılmış veri çıkarmak için adım adım eğitim sunulmaktadır — lokal ve doğru bir şekilde.

Daha Fazla Oku

Güncellendi Haziran 28, 2026

OCR C# GitHub: IronOCR ile Metin Tanıma

OCR C# GitHub eğitimi: GitHub projelerinde IronOCR kullanarak metin tanıma uygulayın. Kod örnekleri ve sürüm kontrolü ipuçları içermektedir.

Daha Fazla Oku

Güncellendi Nisan 21, 2026

.NET OCR SDK: C# için Bir Metin Tanıma Kütüphanesi

IronOCR'un .NET SDK'sı ile güçlü OCR çözümleri oluşturun. Basit API, kurumsal özellikler ve doküman işleme uygulamaları için çapraz platform desteği sunmaktadır.

Daha Fazla Oku

PDF Veri Çıkarma .NET: Geliştirici Rehberi

C# GitHub projelerinde IronOCR ile ...

Müşteri Vurgusu:

Geliştirici Odağı:

Webinarlar:

Ücretsiz 30 Günlük Denemeyi Başlat

Bilgisayarlı Görü ile OCR Metin Tanıma Doğruluğunu Nasıl Artırır

Bilgisayarla Görme ve OCR Arasındaki İlişki Nedir?

Giriş

Çıktı

Görüntü Ön İşleme Metin Tanımayı Nasıl İyileştirir?

Doğru Ön İşleme Filtre Kombinasyonu Nasıl Seçilir?

Modern OCR'yi Hangi Derin Öğrenme Modelleri Besler?

Giriş

Çıktı

IronOCR Çok Dilli Belgeleri Nasıl Ele Alır?

Formlar ve Tablolar için Bölge Temelli OCR Nasıl Etkinleştirilir?

Geliştiriciler OCR Doğruluğunu Nasıl Optimize Edebilirleri Programatik Olarak?

Taranmış Belgelerden Aranabilir PDF'ler Nasıl Oluşturulur?

Bazı Belge Türleri Arasında OCR Performansını Nasıl Karşılaştırırsınız?

Üretim Belgeleri İşleme İçin Önemli IronOCR Özellikleri Nelerdir?

Sonraki Adımlarınız Neler?

Sıkça Sorulan Sorular

Bilgisayarlı görü OCR doğruluğunu nasıl artırır?

IronOCR hangi ön işleme filtrelerini destekliyor?

IronOCR hangi derin öğrenme modeline dayanmaktadır?

IronOCR ile bölge tabanlı OCR nasıl gerçekleştirilir?

IronOCR taranmış belgelerden aranabilir PDF'ler üretebilir mi?

IronOCR kaç dili destekliyor?

Ön işleme filtreleri hangi sırayla uygulanmalı?

IronOCR'deki güven skorları nasıl çalışır?

Lisans anahtarınız gelen kutunuza gönderildi

Demo talebiniz alındı.

Iron Destek Ekibi

Ücretsiz 30 Günlük Denemeyi Başlat

Bilgisayarlı Görü ile OCR Metin Tanıma Doğruluğunu Nasıl Artırır

Bilgisayarla Görme ve OCR Arasındaki İlişki Nedir?

Giriş

Çıktı

Görüntü Ön İşleme Metin Tanımayı Nasıl İyileştirir?

Doğru Ön İşleme Filtre Kombinasyonu Nasıl Seçilir?

Modern OCR'yi Hangi Derin Öğrenme Modelleri Besler?

Giriş

Çıktı

IronOCR Çok Dilli Belgeleri Nasıl Ele Alır?

Formlar ve Tablolar için Bölge Temelli OCR Nasıl Etkinleştirilir?

Geliştiriciler OCR Doğruluğunu Nasıl Optimize Edebilirleri Programatik Olarak?

Taranmış Belgelerden Aranabilir PDF'ler Nasıl Oluşturulur?

Bazı Belge Türleri Arasında OCR Performansını Nasıl Karşılaştırırsınız?

Üretim Belgeleri İşleme İçin Önemli IronOCR Özellikleri Nelerdir?

Sonraki Adımlarınız Neler?

Sıkça Sorulan Sorular

Bilgisayarlı görü OCR doğruluğunu nasıl artırır?

IronOCR hangi ön işleme filtrelerini destekliyor?

IronOCR hangi derin öğrenme modeline dayanmaktadır?

IronOCR ile bölge tabanlı OCR nasıl gerçekleştirilir?

IronOCR taranmış belgelerden aranabilir PDF'ler üretebilir mi?

IronOCR kaç dili destekliyor?

Ön işleme filtreleri hangi sırayla uygulanmalı?

IronOCR'deki güven skorları nasıl çalışır?

İlgili Makaleler

C#'da Gerçekten Yararlı Veri Çıkaran Bir Fiş OCR API'si Oluşturun

OCR C# GitHub: IronOCR ile Metin Tanıma

.NET OCR SDK: C# için Bir Metin Tanıma Kütüphanesi

Sonraki adım: Ücretsiz 30 günlük denemeyi başlat

Thank You

Sonraki adım: Ücretsiz 30 günlük denemeyi başlat

IronSuite'i canlı bir projede ÜCRETSİZ olarak kullanmak ister misiniz?

Neler dahil?

Lisans anahtarınız gelen kutunuza gönderildi

Demo talebiniz alındı.

Dünya Çapında Milyonlarca Mühendisin Güvendiği

Iron Destek Ekibi