Makine Öğrenimi Yazılımı Kullanarak Görüntüden Metin Çıkarma
Makine öğrenim kullanarak taranmış belgelerden veya metin içeren görüntülerden metin çıkarma, bilgisayarla görme ve doğal dil işleme kesişiminde gelişen bir alan. Bu teknoloji, gelişmiş makine öğrenimi, nesne tanıma algoritmaları, ileri grafik yazılımlar, derin ve karanlık web ve nöral ağ mimarilerini kullanarak, metin içeren resim ve taranmış kağıt belgelerinden metinsel bilgileri doğru bir şekilde tanımlayıp çıkarabilir. Optik karakter tanıma (OCR) ve derin öğrenim gibi çeşitli makine öğrenimi teknolojilerini kullanarak, görsel sahne metin algılama işlemini düzenlenebilir ve aranabilir yapılandırılmış verilere otomatik ve verimli bir şekilde dönüştürür.
Bu gelişen alanda, araştırmacılar ve uygulayıcılar, baskılı belge dijitalleştirme, içerik indeksleme, çeviri ve erişilebilirlik geliştirme gibi uygulamalarda görüntüden metin algılama ve çıkarma, makineyle okunabilir veri ve taranmış belgeler üzerinde önemli bir bileşeni olan doğruluk, hız ve çok yönlülüğü sürekli iyileştirmeye çalışmaktadır.
Bu makalede, güçlü Makine Öğrenimi algoritmaları ve metinle ilgili özellikler ile güçlendirilmiş bir OCR Kütüphanesi olan IronOCR kullanarak görüntülerden nasıl metin çıkarabileceğinizi tartışacağız. Metin çıkarma, anahtar kelime çıkarma olarak da bilinir, Makine Öğrenimi tabanlıdır ve yapılandırılmamış veriler veya şirketin merkezi veritabanından otomatik olarak ilgili veya temel kelimeleri ve ifadeleri tarayıp çıkarır.
Makine öğrenimi kullanarak bir görüntüden metin nasıl çıkarılır?
- Görüntülerden metin çıkarma için C# kütüphanesini indirin.
- Sahne metin tanıma için OcrInput nesnesini oluşturarak belirli bir görüntü yükleyin.
- ocrTesseract.Read yöntemi kullanarak görüntüden veri çıkarın.
- Çıkarılan metni Console.WriteLine yöntemi kullanarak konsolda yazdırın.
- CropRectangle nesnesini kullanarak bir görüntünün bölgesinde OCR yapın.
IronOCR - Bir OCR (Optik Karakter Tanıma) Kütüphanesi
IronOCR, görüntüler ve belgelerden metin çıkarma teknolojisi alanında öncü ve sofistike bir optik karakter tanıma (OCR) yazılımıdır. Iron Software tarafından geliştirilen bu güçlü OCR motoru, taranmış görüntüleri, PDF'leri veya hatta metin fotoğraflarını doğru ve verimli bir şekilde düzenlenebilir ve aranabilir dijital içeriklere dönüştürmek üzere tasarlanmıştır. Makine öğrenim algoritmalarını ve nöral ağları ustalıkla kullanarak, IronOCR, çeşitli uygulamalar için sağlam bir çözüm sunar ve veri çıkarma, içerik indeksleme ve doğru metin tanıma gerektiren otomasyon süreçleri gibi alanlarda kullanılır.
Çoklu dilleri ve çeşitli yazı tiplerini ele alma yeteneğiyle, IronOCR, geliştiricilerin ve yazılım ve uygulamalarında metin tanıma algoritmasından yararlanabilen işletmelerin, üzerindeki metin tanıma algoritması çıkarma yeteneklerinden faydalanabileceği çok yönlü bir araçtır. IronOCR'u, metin tanıma algoritmaları kullanarak yapılandırılmamış verileri mükemmel bir şekilde taranmış bir sayfaya dönüştüren bir metin tarama tekniği ile otomatik olarak metni taramak için kullanabilirsiniz.
IronOCR'nin Kurulumu
IronOCR, NuGet Paket Yöneticisi kullanarak kurulabilir. IronOCR'u kurmak için adımlar şunlardır:
- Öncelikle yeni bir C# Visual Studio projesi oluşturun veya mevcut bir projeyi açın.

- Proje oluşturulduktan sonra üst menüdeki Araçlar'a gidin ve NuGet Paket Yöneticisi'ni seçin, ardından NuGet Paket Yöneticisi'ni Çözüm için seçin.

- Ekranda yeni bir pencere belirecektir. Browse sekmesine gidin ve arama çubuğuna IronOCR yazın.
- Bir IronOCR paketleri listesi belirecektir. En sonuncuyu seçin ve yükle'ye tıklayın.

- İnternetinize bağlı olarak birkaç saniye sürecektir; bundan sonra, IronOCR, C# projenizde kullanıma hazır.
Görüntülerden Düzenlenebilir ve Aranabilir Veri Olarak Metin Algılama
IronOCR kullanarak, görüntü işleme teknikleri ve makine öğrenmesi ile metni kolayca çıkarabilirsiniz. Bu bölümde, IronOCR kullanarak görüntülerden metni nasıl çıkarabileceğimizi tartışacağız.
using IronOcr;
using System;
// Create a new instance of the IronTesseract class
var ocrTesseract = new IronTesseract();
// Specify the image path and perform OCR on the image
using (var ocrInput = new OcrInput(@"images\image.png"))
{
var ocrResult = ocrTesseract.Read(ocrInput);
// Print the extracted text to the console
Console.WriteLine(ocrResult.Text);
}using IronOcr;
using System;
// Create a new instance of the IronTesseract class
var ocrTesseract = new IronTesseract();
// Specify the image path and perform OCR on the image
using (var ocrInput = new OcrInput(@"images\image.png"))
{
var ocrResult = ocrTesseract.Read(ocrInput);
// Print the extracted text to the console
Console.WriteLine(ocrResult.Text);
}Imports IronOcr
Imports System
' Create a new instance of the IronTesseract class
Private ocrTesseract = New IronTesseract()
' Specify the image path and perform OCR on the image
Using ocrInput As New OcrInput("images\image.png")
Dim ocrResult = ocrTesseract.Read(ocrInput)
' Print the extracted text to the console
Console.WriteLine(ocrResult.Text)
End UsingBu C# kodu, optik karakter tanıma (OCR) için bir kütüphane olan IronOCR'un kullanımını göstermektedir. İşte adım adım açıklaması:
Kütüphanelerin İthal Edilmesi:
using IronOcr; using System;using IronOcr; using System;Imports IronOcr Imports System$vbLabelText $csharpLabelKod, OCR işlevselliği sağlayan IronOcr ve genel işlevsellikler için System isim alanı dahil olmak üzere gerekli kütüphanelerin ithal edilmesiyle başlar.
IronTesseract Başlatma ve Görüntü Yükleme:
var ocrTesseract = new IronTesseract();var ocrTesseract = new IronTesseract();Dim ocrTesseract As New IronTesseract()$vbLabelText $csharpLabelBu satır, IronOCR tarafından sağlanan OCR motoru olan IronTesseract bir nesne oluşturur.
using (var ocrInput = new OcrInput(@"images\image.png"))using (var ocrInput = new OcrInput(@"images\image.png"))Using ocrInput As New OcrInput("images\image.png")$vbLabelText $csharpLabelİşlenecek görüntünün yoluyla bir OcrInput nesnesi örneklenir. Bu durumda, görüntü dosyası 'images' dizininde 'image.png' dir.
OCR Yapma ve Metin Çıkarma:
var ocrResult = ocrTesseract.Read(ocrInput);var ocrResult = ocrTesseract.Read(ocrInput);Dim ocrResult = ocrTesseract.Read(ocrInput)$vbLabelText $csharpLabelBu satır, IronTesseract örneğinin Read metodunu, OcrInput nesnesini ileterek çağırır. Bu yöntem, sağlanan görüntüde OCR yapar ve metni çıkarır.
Çıkarılan Metni Gösterme:
Console.WriteLine(ocrResult.Text);Console.WriteLine(ocrResult.Text);Console.WriteLine(ocrResult.Text)$vbLabelText $csharpLabelSon olarak, çıkarılan metin Console.WriteLine kullanılarak konsola yazdırılır, görüntüden elde edilen OCR sonucu gösterilir.
Bu kod snippet'i, belirtilen görüntüde metin tanıma işlemi için IronOCR kullanarak OCR yapar ve çıkarılan metni konsola çıkartır.
Giriş Görüntüsü

Çıktı

Görüntü Üzerindeki Belirli Bölgede OCR Yapma
Ayrıca IronOCR kullanarak görüntü üzerindeki belirli bölgelerde OCR yapabilirsiniz. İşte bir kod örneği:
using IronOcr;
using IronSoftware.Drawing;
using System;
// Create a new instance of the IronTesseract class
var ocrTesseract = new IronTesseract();
// Specify the region on the image to be processed
using (var ocrInput = new OcrInput())
{
var ContentArea = new CropRectangle(x: 20, y: 20, width: 400, height: 50);
// Add the image with the defined content area
ocrInput.AddImage("r3.png", ContentArea);
// Perform OCR on the specified region and extract text
var ocrResult = ocrTesseract.Read(ocrInput);
// Print the extracted text to the console
Console.WriteLine(ocrResult.Text);
}using IronOcr;
using IronSoftware.Drawing;
using System;
// Create a new instance of the IronTesseract class
var ocrTesseract = new IronTesseract();
// Specify the region on the image to be processed
using (var ocrInput = new OcrInput())
{
var ContentArea = new CropRectangle(x: 20, y: 20, width: 400, height: 50);
// Add the image with the defined content area
ocrInput.AddImage("r3.png", ContentArea);
// Perform OCR on the specified region and extract text
var ocrResult = ocrTesseract.Read(ocrInput);
// Print the extracted text to the console
Console.WriteLine(ocrResult.Text);
}Imports IronOcr
Imports IronSoftware.Drawing
Imports System
' Create a new instance of the IronTesseract class
Private ocrTesseract = New IronTesseract()
' Specify the region on the image to be processed
Using ocrInput As New OcrInput()
Dim ContentArea = New CropRectangle(x:= 20, y:= 20, width:= 400, height:= 50)
' Add the image with the defined content area
ocrInput.AddImage("r3.png", ContentArea)
' Perform OCR on the specified region and extract text
Dim ocrResult = ocrTesseract.Read(ocrInput)
' Print the extracted text to the console
Console.WriteLine(ocrResult.Text)
End UsingBu C# kodu, optik karakter tanıma (OCR) için IronOCR kütüphanesini kullanmaktadır. İlk olarak IronOCR ve System dahil gerekli kütüphaneleri ithal eder. OCR motoru olan bir IronTesseract örneği oluşturulur. Kod, tanımlı bir bölgeye odaklanarak bir CropRectangle kullanarak işlenecek görüntüde belirli bir İçerik Alanı ayarlar. Bu belirlenmiş alandaki görüntü ('r3.png'), ardından OCR işleme için eklenir. OCR motoru belirtilen içerik alanını okur, metni çıkarır ve elde edilen metin Console.WriteLine kullanılarak konsola yazdırılır.
Çıktı

Sonuç
Optik karakter tanıma (OCR) kütüphaneleri gibi özellikle IronOCR'u kullanarak makine öğrenmesi yoluyla görüntülerden metin çıkarma, bilgisayarlı görü ve doğal dil işleme kesişiminde devrim niteliğinde bir adım temsil eder. Hem OCR teknolojisi hem de derin öğrenme teknikleri, görsel metni düzenlenebilir ve aranabilir veriye etkili bir şekilde dönüştürerek belge dijitalleştirme, içerik indeksleme ve erişilebilirlik artırma gibi önemli amaçlara hizmet eder.
Önde gelen bir OCR kütüphanesi olarak IronOCR, taranmış görüntülerin ve PDF'lerin birden fazla dil ve yazı tipi stilinde dijital, düzenlenebilir içeriğe doğru şekilde dönüştürülmesinde bu birleşmenin potansiyelini örnekler. C# gibi programlama dillerine sorunsuz entegrasyonu, çeşitli uygulamalar ve alanlarda görüntülerden metin çıkarma işleminin dönüştürücü etkisini daha da artırır.
IronOCR ve tüm ilgili özellikler hakkında daha fazla bilgi için bu bağlantıyı tıklayın. Görüntülerden metin çıkarma üzerine tam eğitim, şu bağlantıda mevcuttur. IronOCR lisansı, bu bağlantıdan satın alınabilir.
