Altbilgi içeriğine atla
IRONOCR KULLANıMı

Bilgisayarla Görme İle OCR (Örnek Eğitim)

IronOCR ile Optik Karakter Tanıma (OCR)

Optik Karakter Tanıma (OCR), makinalarin görüntüleri okuyup metni yorumlayabilmesini saglayan bir teknolojidir ve veri işleme ile otomasyonu daha hizli ve etkin hale getirir. Bu makale, IronOCR kutuphanesiyle OCR kullanimi rehberi ve bu sureci otomatik hale getirerek metin tanımayı nasıl geliştirebileceği hakkında bilgiler sunar.

OCR Neden Onemli?

OCR, bilgisayar gorusu ile beraber, yapay zeka ve makine ogrenimi algoritmalarinin gucunu kullanarak görüntülerden metin karakterlerini daha dogru ve etkin bir sekilde taniyan gelişmiş bir Optik Karakter Tanıma (OCR) seklidir.

Bilgisayar gorusu görüntü işleme algoritmalari, OCR sistemlerinin bir görüntü icindeki metin baglamının ve düzeni anlamasini ve karakterleri sekillerine ve yapilarina dayali olarak tanimasini saglar. Bilgisayar gorusu ile OCR, birden fazla yazı tipi, stil ve boyutlar iceren karmasik görüntülerden metin cikartabilir, bu da onu belge sayisallastirma, veri cikarma ve otomasyon alaninda degerli bir araç yapar.

IronOCR: C# OCR Kütüphanesi

IronOCR, görüntülardan ve belgelerden metin cikarmak icin bilgisayar gorusu teknikleri kullanan popüler bir OCR kutuphanesidir. Kullanimi kolaydir ve C# ile VB.NET de dahil olmak üzere birden fazla programlama dili ile entegre edilir. IronOCR hem yerel sistem hem de bulut versiyonlarinda mevcuttur ve görüntülerden metin işleme ve cikarma icin bir dizi fonksiyonellik sunar.

IronOCR Kurulumu

IronOCR'u kurmak icin aşağıdaki komutu NuGet Paket Yonetimi Konsolunda kullanın:

Install-Package IronOcr

IronOCR ile OCR Sistemi

IronOCR kullanarak Bilgisayar Gorusu ile OCR Sistemi'ni test etmek icin asagidaki görüntü kullanilir.

Bilgisayarlı Görü ile OCR (Örnek Öğretici), Şekil 1: OCR tespiti için kullanılan görüntü örneği OCR algilaması icin kullanılan görüntü ornegi

FindTextRegion Metodu

FindTextRegion yöntemi, bir görüntüdeki tek bir metin bölgesini tanımlamak için kullanılır. Yöntem, Scale, DilationAmount, Binarize ve Invert dahil olmak üzere birkaç isteğe bağlı parametre alır:

  • Scale, daha iyi metin tanıma için görüntünün boyutunu ayarlar.
  • DilationAmount, metnin görünürlüğünü artırmak için kalınlığını artırır.
  • Binarize, görüntüyü siyah-beyaza dönüştürerek kontrastı iyileştirir.
  • Invert, belirli türdeki görüntüler için kullanışlı olabilecek şekilde görüntünün renklerini ters çevirir.
using IronOcr;
using System;

// Initialize the IronTesseract OCR engine
var ocr = new IronTesseract();

// Create an OcrInput object for the image
using (var inputOCR = new OcrInput("test.jpg")) 
{
    // Identify a text region within the image
    inputOCR.FindTextRegion();

    // Perform OCR on the identified text region
    OcrResult result = ocr.Read(inputOCR);

    // Extract and print the recognized text
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
using IronOcr;
using System;

// Initialize the IronTesseract OCR engine
var ocr = new IronTesseract();

// Create an OcrInput object for the image
using (var inputOCR = new OcrInput("test.jpg")) 
{
    // Identify a text region within the image
    inputOCR.FindTextRegion();

    // Perform OCR on the identified text region
    OcrResult result = ocr.Read(inputOCR);

    // Extract and print the recognized text
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
Imports IronOcr
Imports System

' Initialize the IronTesseract OCR engine
Private ocr = New IronTesseract()

' Create an OcrInput object for the image
Using inputOCR = New OcrInput("test.jpg")
	' Identify a text region within the image
	inputOCR.FindTextRegion()

	' Perform OCR on the identified text region
	Dim result As OcrResult = ocr.Read(inputOCR)

	' Extract and print the recognized text
	Dim resultText As String = result.Text
	Console.WriteLine(resultText)
End Using
$vbLabelText   $csharpLabel

Not: Kodu calistirdiktan sonra, makine öğrenimi sureciyle metin bolgesinden metni cikardığını göreceksiniz. Çıktı sonucu, yüksek metin tanıma doğruluğu ile konsolda görünür.

Bilgisayarlı Görü ile OCR (Örnek Öğretici), Şekil 2: Metin çıkarma işleminin Konsol sonuçları Metin çıkarma sürecinin konsol sonuçları

FindMultipleTextRegions Yöntemi

FindMultipleTextRegions yöntemi, FindTextRegion ile benzerdir, ancak görüntüde birden fazla metin bölgesi olduğunda kullanılır. Her metin bölgesinin konumunu tanımlayan CropRectangle nesnelerinin bir listesini döndürür. Bu yöntem, birden fazla metin bölümü içeren bir resimden metin çıkarmak istediğinizde faydalıdır.

using IronOcr;

// Initialize the IronTesseract OCR engine
var ocr = new IronTesseract();

// Create an OcrInput object for the image
using (var input = new OcrInput("test.jpg"))
{
    // Identify multiple text regions within the image
    input.FindMultipleTextRegions(Scale: 2.0, DilationAmount: -1, Binarize: true, Invert: false);

    // Perform OCR on the pre-processed image
    OcrResult result = ocr.Read(input);

    // Extract and print the recognized text
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
using IronOcr;

// Initialize the IronTesseract OCR engine
var ocr = new IronTesseract();

// Create an OcrInput object for the image
using (var input = new OcrInput("test.jpg"))
{
    // Identify multiple text regions within the image
    input.FindMultipleTextRegions(Scale: 2.0, DilationAmount: -1, Binarize: true, Invert: false);

    // Perform OCR on the pre-processed image
    OcrResult result = ocr.Read(input);

    // Extract and print the recognized text
    string resultText = result.Text;
    Console.WriteLine(resultText);
}
Imports IronOcr

' Initialize the IronTesseract OCR engine
Private ocr = New IronTesseract()

' Create an OcrInput object for the image
Using input = New OcrInput("test.jpg")
	' Identify multiple text regions within the image
	input.FindMultipleTextRegions(Scale:= 2.0, DilationAmount:= -1, Binarize:= True, Invert:= False)

	' Perform OCR on the pre-processed image
	Dim result As OcrResult = ocr.Read(input)

	' Extract and print the recognized text
	Dim resultText As String = result.Text
	Console.WriteLine(resultText)
End Using
$vbLabelText   $csharpLabel

Açıklama: Yukarıda verilen kod parçası, bir görüntü dosyasında OCR gerçekleştirmek için IronOCR kutuphanesi nasıl kullanılacağını gösteren bir örnektir. İlk olarak IronOCR kutuphanesini ithal eder ve IronTesseract sınıfının yeni bir örneğini oluşturur. Daha sonra, giriş görüntü dosyasının yolu ile bir OcrInput nesnesi başlatır ve FindMultipleTextRegions yöntemi kullanarak görüntü düzeltmesi için bazı ön işleme teknikleri uygular.

IronOCR'un Çıktısı

IronOCR'un çıktısı çok doğru, hatta çoklu yazı tipleri, boyutlar ve metin stilleri içeren karmaşık belgelerle uğraşırken bile.

OCR doğruluğu, genellikle veri analizi, manuel veri girişi, makine öğrenmesi veya doğal dil işleme gibi işlemler için kullanılan metnin çıkarılması sırasında kritik öneme sahiptir. Çıkartılan metin hatalı olursa, bu, aşağıdaki süreçlerde sorunlara neden olabilir. Ek olarak, IronOCR, sonuç nesnelerini güven seviyesi kontrolü için incelemeye izin verir.

OCR Bilgisayar Görüsü Kullanım Durumları

Optik Karakter Tanıma (OCR) teknolojisi, basılı metinlerin ele alınma şeklini kökten değiştirir. OCR araçları, belge işleme ve veri çıkarma süreçlerinin vazgeçilmez bir parçası haline gelmiştir. Optik Karakter Tanıma yazılımının bazı kullanım durumları şunlardır:

OCR Plaka Tanıma

Plaka tanıma, trafik yönetimini, park sistemlerini ve kolluk kuvveti faaliyetlerini otomatikleştirmede önemli bir rol oynar. C#'ta OCR bilgisayar görüşü kullanan geliştiriciler, görüntüler veya canlı video akışlarından hızla ve doğru bir şekilde plaka tanımlayabilecek uygulamalar oluşturabilirler. Bu teknoloji şunlar için kullanılabilir:

  • Trafik ihlallerini izlemek ve suç faaliyetlerine karışmış araçları tanımlamak.
  • Giriş ve çıkış yönetimini kolaylaştıran ve fatura sürecini düzenleyen park sistemlerini otomatikleştirmek.
  • Araç hareketini izleyerek ve kontrol ederek güvenlik önlemlerini artırmak.

Faturalardan Metin Çıkarma

C#'ta OCR bilgisayar görüşü, faturalardan ve diğer finansal belgelere metin çıkarma süreçlerini otomatikleştiren OCR uygulamaları geliştirmek için kullanılabilir. Bu süreç, manuel veri girişi hatalarını önemli ölçüde azaltabilir ve muhasebe görevlerini düzenleyebilir. Anahtar faydalar şunlardır:

  • Veri giriş sürecini otomatikleştirerek üretkenliği artırmak.
  • OCR, insan hatası olasılığını azalttığı için doğruluğu artırmak.
  • Verileri verimli bir şekilde yönetmek için muhasebe yazılımı ve sistemleri ile sorunsuz entegrasyon.

OCR Altyazı Oluşturma

Videolar için altyazı oluşturmak zaman alıcı ve emek yoğun olabilir. C#'taki OCR bilgisayar görüsü süreci, ekrandaki metni otomatik olarak algılayarak ve yazarak geliştiricilerin:

  • Filmler, TV şovları ve çevrimiçi videolar için doğru altyazılar oluşturmasına.
  • İşitme bozukluğu olan veya farklı diller konuşan bireyler için erişilebilirliği artırmasına.
  • Video platformu için aranabilir, dizine eklenebilir içerik sağlayarak SEO çabalarını artırmasına olanak tanıyan süreci basitleştirir.

OCR PDF İşleme

PDF'ler, belgelerin paylaşılması ve saklanması için yaygın olarak kullanılır, ancak metin çıkarmak zor olabilir. C#'ta OCR bilgisayar görüsü, geliştiricilerin PDF dosyalarını zahmetsizce işleyip içeriğini çıkarmasına yardımcı olabilir, bu da şu kolaylıkları sağlar:

  • PDF'lerin Word, Excel veya düz metin gibi düzenlenebilir dosya formatlarına kolayca dönüştürülmesi.
  • Veri analizi, dizinleme veya daha fazla işleme için etkili veri çıkarımı.
  • Taralı PDF'lerin aranabilir, okunabilir metinlere dönüştürülerek erişilebilirliğin artırılması.

Basılı Metni Dijitize Etme

OCR yazılımı, belge görüntülerinden basılı metinleri dijitize etmek için yaygın olarak kullanılır. OCR araçları taranmış dijital belgelerden, PDF'ler ve çeşitli biçimlerdeki görüntülerden metin çıkarabilir. Bu, metin tabanlı belgelerin kolayca aranabilmesi, saklanabilmesi ve paylaşılabilmesi gereken belge yönetiminde özellikle faydalıdır.

Veri Çıkarma

OCR teknolojisi, faturalar, makbuzlar ve formlar gibi girdi verilerinden veri çıkarmak için yaygın olarak kullanılır. OCR modelleri, adlar, adresler, tarihler ve tutarlar gibi anahtar veri alanlarını tanıyabilir ve çıkarabilir. Bu, manuel veri girişini gereksiz hale getirir ve veri işleme sırasında hataları azaltır.

Görüntü Arama

OCR teknolojisi, içinde bulunan metinlere dayalı görüntü aramaları için de kullanılır. Bu, manuel aramanın zaman alıcı olacağı geniş görüntü kütüphaneleri için özellikle faydalıdır.

Çeviri

OCR yazılımı, bir dildeki belgelerden metin çıkarılması ve başka bir dile çevrilmesi için kullanılabilir. Bu, belgelerin hızla ve doğru bir şekilde çevrilmesi gereken uluslararası işletmeler için özellikle faydalıdır.

Özet

Optik karakter tanıma (OCR), bilgisayarların görüntülerden metin okumasını sağlayan bir teknolojidir. OCR, bilgisayarla görme ile birlikte, sürücüsüz arabalar, robotik ve otomatik belge işleme gibi uygulamalar için makinelerin görsel dünyayı anlamalarını ve yorumlamalarını sağladığı için önemlidir.

IronOCR, bilgisayarla görme ile OCR uygulayarak metni doğru bir şekilde tanımak ve görüntülerden metin çıkarmak için kullanılabilen güçlü bir OCR motorudur. Metin bölgelerini bulmak ve çıkarmak için FindTextRegion, FindMultipleTextRegions ve GetTextRegions dahil olmak üzere bir dizi yöntem sunar. Her bir yöntemin, OCR sürecini kesinleştirmek ve yüksek OCR doğruluğu sağlamak için kullanılabilen bir dizi parametresi vardır.

IronOCR kullanarak, giriş görüntülerinden taranmış metni hızla ve doğru bir şekilde eşzamanlılık ve özelleştirilmiş yapılandırma ile çıkartabilir, böylece büyük miktarda giriş görüntü verisi ile uğraşırken zaman ve çaba tasarrufu yapabilirsiniz. Tarama belgeleri, fotoğraflar veya ekran görüntüleri ile çalışırken, IronOCR metinle gizlenmiş metni çözmeniz için size yardımcı olabilir.

IronOCR, kullanıcıların satın alma kararı vermeden önce yazılımı test edebilmeleri için ücretsiz bir deneme sunar. IronOCR için lisans $799 başlar ve bir yıl boyunca destek ve güncellemeleri içerir. Sağlam özellikleri ve makul fiyatları ile IronOCR, yüksek OCR doğruluğuna sahip güvenilir bir OCR çözümü arayan herkes için harika bir seçenektir.

Sıkça Sorulan Sorular

C#'da bir görüntü̈ metne nasıl dönüştürülmüş?

IronOCR'un OCR özelliklerini kullanarak C# ile görüntüleri metne dönüştürebilirsiniz. Read ve ReadAsync gibi yöntemleri kullanarak görüntüleri işleyebilir ve etin çıkartabilirsiniz.

Bilgisayar görüşü ile OCR kullanmanın avantajları nelerdir?

Bilgisayar görüşüyle OCR kullanmak, karmaşık görüntü düzenleri, şekil ve stillerden metin tanimasını daha doğru hale getirir. IronOCR, metin çıkarmayi güclendirmek ve veri işleme sürecini otomatikleştirmek için AI ve makine öğrenimini kullanır.

C#'de OCR doğruluğunu nasıl artırırsınız?

IronOCR, OCR doğruluğunu artırmak için konfigürasyon ayarlarını ayarlama, es zamanlilik kullanma ve sonuç nesnelerini güven seviyeleri için inceleme gibi çeşitli yöntemler sunar. Bu sürecï ince ayar yaparak daha iyi bir OCR çıkışı elde edilir.

Bir görüntüdeki birden fazla bölgeden metin nasıl çıkartılır?

IronOCR kullanarak bir görüntüdeki birden fazla bolgeden metin çıkarmak için, FindMultipleTextRegions metodunu kullanabilirsiniz. Bu̇ yöntem, her bir metin bölgesinin yerini belirtien CropRectangle nesneleri içeren bir liste döndürür.

OCR teknolojisi plaka tanıma için kullanılabilir mi?

Evet, IronOCR tarafından sağlanan OCR teknolojisi, plaka tanıma için uygulanabilir. Plaka görüntülerini işleyerek IronOCR, çeşitli uygulamalar için metni çıkarabilir.

Bir C# projesine IronOCR nasıl kurarsınız?

IronOCR'u C# projenize NuGet Package Manager Console kullanarak yükleyebilirsiniz. Kütüphaneyi projenize eklemek için Install-Package IronOcr komutunu çalıştırın.

C# OCR kütüphanesini denemek için bir deneme sürümü var mı?

Evet, IronOCR, kullanıcıların bir lisans satın almadan önce kütüphanenin yeteneklerini test etmelerine olanak tanıyan ücretsiz bir deneme sürümü sunar.

C#'ta bir OCR kütüphanesi için hangi lisanslama seçenekleri mevcut?

IronOCR, çeşitli lisanslama seçenekleri sunar ve $liteLicense'dan başlayarak farklı proje ihtiyaçları ve bütçelere hitap eden bir yıllık destek ve güncellemeleri içerir.

Kannaopat Udonpant
Yazılım Mühendisi
Yazılım Mühendisi olmadan önce, Kannapat Japonya'daki Hokkaido Üniversitesi'nden Çevresel Kaynaklar alanında doktora yaptı. Derecesini tamamlarken, Biyoprodüksiyon Mühendisliği Bölümü'nün bir parçası olan Taşıt Robotik Laboratuvarı'na da üye oldu. 2022'de, Iron Software mühendislik ekibine katılmak iç...
Daha Fazlasını Oku

Iron Destek Ekibi

Haftanın 5 günü, 24 saat çevrimiçiyiz.
Sohbet
E-posta
Beni Ara