Altbilgi içeriğine atla
OCR ARAçLARı

Resmi Metne Nasıl Dönüştürürsünüz

Gunumuz dijital caginda, resim tabanli icerigi okumasi kolay, duzenlenebilir, aranabilir metne dönüştürmek çok onemlidir. Bu, kagit tabanli belgelerin arsivlenmesi, fotograflardan anahtar bilgilerin cikarilmasi veya basili materyallerin dijital hale getirilmesi gibi durumlarda özellikle onemlidir. Optik Karakter Tanima (OCR) teknolojisi, bu donusum surecini otomatiklestirmek icin bir cozum sunar. IronOCR, .NET icin guclu bir OCR kutuphanesidir, bu amaca ulasmak icin çok guvenilir ve etkili bir arac.

Bu makale, IronOCR kullanarak bir resmi metne cevirmenin nasıl yapildigini anlatacak ve bu cevirinin, veri cikarma, arxivleme ve belge işleme gibi surecleri nasıl zaman kazandirir, hatalari azaltir ve daha verimli hale getirir geldigini incelenecektir.

Resmi Metne Cevirme Uzerine

  1. OCR calismasi icin bir C# kutuphanesi indir
  2. Yeni bir IronTesseract örneği oluşturun
  3. Görüntünüzü OcrImageInput kullanarak yükleyin
  4. Görüntünün içeriğini OcrRead kullanarak okuyun
  5. OCR sonucunu bir Metin dosyasina aktar

Neden Resmi Metne Cevirirsiniz?

Bir resimi metne cevirmek istemenizin bircok nedeni olabilir, bunlar arasinda:

  • Veri cikarma: Taranmis belgelerden ve görüntülerden arxiv veya veri işleme amaciyla metin cikarma.
  • Taranmis icerigi duzenleme: Daha once taranmis belgelerde metin duzenleyerek veya güncelleyerek, icerigin manuel olarak yeniden yazilmasi zamanini kazanin.
  • Erisilebilirligi iyilestirmek: Basili materyali dijital metne cevirerek ekran okuyucular veya metin-okuma uygulamalari icin erisilebilir hale getirin.
  • Otomasyon: Faturalardan, makbuzlardan veya kartvizitlerden metin okuyarak veri girisi ve işlemeyi otomatik hale getirin.

Görüntüleri Metne Cevirmek Icin Nasıl Başlarsiniz

Once IronOCR'nin guclu resimden-metine cevirme yeteneklerinin, fotograflardan metin cikarma işlemlerini nasıl kabiliyetli hale getirebilecegini incelemeden once, Docsumo gibi bir cevrimici arac kullanarak genel adim-adim sureci inceleyelim. Manuel kurulum gerektirmemeleri sayesinde, cevrimici OCR araclari, rastgele ya da tek seferlik OCR gorevleri yapmak isteyenler icin yararli bir secenektir. Elbette, OCR gorevlerini duzenli olarak yapmak ihtiyaçindaysaniz, IronOCR gibi guclu bir OCR araci edinmeniz daha iyi olabilir.

  1. Cevrimici OCR aracina gidin
  2. Resminizi yukleyin ve cikarma surecine başlayin
  3. Ortaya cikan veriyi bir Metin belgesi olarak indirin

1. Adim: Cevrimici OCR Aracina Gidin

Bilgisayar dosyalarindan metin cikarma işlemlerini başlatmak icin, kullanmak istedigimiz cevrimici resim OCR aracina gideriz.

Resmi Metne Dönüştürme: Şekil 1 - Docsumo OCR Aracı

2. Adim: Görüntünuzu Yukleyin ve Cikarim Surecine Başlayin

Simdi, "Dosya Yukle" dugmesine tiklayarak metin cikarmak istedigimiz görüntü dosyasini yukleyebiliriz. Arac hemen görüntüyu işlemeye başlayacaktir.

Resmi Metne Dönüştürme: Şekil 2 - Docsumo - Dosya İşleme

3. Adim: Ortaya Cikan Veriyi Bir Metin Belgesi Olarak Indirin

Resim islendikten sonra, cikardigimiz metni daha fazla kullanmak veya işlemek icin yeni bir Metin belgesi olarak indirebiliriz.

Resmi Metne Dönüştürme: Şekil 3 - Docsumo - Görüntü İşleme Tamamlandı

Ayrica dosyayi gormek ve icinde bulunan metinleri görüntülemek icin çeşitli bölümleri vurgulayabilirsiniz. Özellikle sadece belli bölümlerdeki metni görüntülemek istiyorsaniz bu çok faydali olabilir. Daha sonra, metni bir Metin belgesi, XLS veya JSON olarak indirmeye devam edebilirsiniz.

Resmi Metne Dönüştürme: Şekil 4

IronOCR ile Başlarken

IronOCR, görüntüler uzerinde OCR işlemleri yapmaniza olanak taniyan çok yonlu bir .NET kutuphanesidir. Sundugu genis kapsamli özelliklerle, çeşitli dosya formatlarini (PNG, JPEG, TIFF, ve PDF gibi) isleyebilir, görüntü düzeltmeleri yapabilir, uzman belgeleri (Pasaportlar, plaka levhalari, vb.) tarayabilir, taranmis dosyalar hakkinda gelişmiş bilgilere erisebilir, taranan belgeleri cevirir ve metni vurgular.

IronOCR Kutuphanesini Yukleyin

IronOCR ile görüntüleri okumaya başlamadan once, projeye yuklenmis olmadigi halde yuklemeniz gerekecektir. Visual Studio'da NuGet kullanarak IronOCR'yi kolayca yukleyebilirsiniz. NuGet Paket Yöneticisi Konsolunu açın ve şu komutu çalıştırın:

Install-Package IronOcr

Alternatif olarak, IronOCR'yi NuGet Paket Yonetici Cozumu sayfasi uzerinden araliyerek de yukleyebilirsiniz.

Resmi Metne Dönüştürme: Şekil 5

Kodunuzda IronOCR'yi kullanmak icin, kodun basinda dogru import ifadesine sahip oldugunuzu emin olun:

using IronOcr;
using IronOcr;
Imports IronOcr
$vbLabelText   $csharpLabel

Resmi Metne Cevirme: Temel Bir Örnek

Oncelikle, IronOCR kullanarak temel bir görüntüden-metine cevirme ornegine bir goz atalim. Bu, her tur OCR aracinin temel islevligidir ve bu örnek icin çevrimiçi arac icin kullandigimiz PNG dosyasini kullanacagiz. Bu örnekte, önce IronTesseract sınıfının bir örneğini oluşturduk ve onu ocr değişkenine atadık. Daha sonra, sağlanan görüntü dosyasından yeni bir OcrImageInput nesnesi oluşturmak için OcrImageInput sınıfını kullanıyoruz. Son olarak, görüntüden metni okumak için Read yöntemi kullanılır ve bir OcrResult nesnesi döndürüyor. Daha sonra, çıkarılan metne erişebilir ve ocrResult.Text kullanarak konsola gösterebiliriz.

using IronOcr;

IronTesseract ocr = new IronTesseract();

// Load the image from which to extract text
using OcrImageInput image = new OcrImageInput("example.png");

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
using IronOcr;

IronTesseract ocr = new IronTesseract();

// Load the image from which to extract text
using OcrImageInput image = new OcrImageInput("example.png");

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
Imports IronOcr

Private ocr As New IronTesseract()

' Load the image from which to extract text
Private OcrImageInput As using

' Perform OCR to extract text
Private ocrResult As OcrResult = ocr.Read(image)

' Output the extracted text to the console
Console.WriteLine(ocrResult.Text)
$vbLabelText   $csharpLabel

Görüntü Ciktisi

Resmi Metne Dönüştürme: Şekil 6

Farkli Resim Formatlarini İşlemek

IronOCR çoklu görüntü formatlarini destekler: PNG, JPEG, BMP, GIF ve TIFF. Farkli görüntü formatlarindan metin okumak için surec ayni kalir, sadece dogru uzantiya sahip dosyayi yuklemelisiniz.

using IronOcr;

IronTesseract ocr = new IronTesseract();

// Load a BMP image
using OcrImageInput image = new OcrImageInput("example.bmp");

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
using IronOcr;

IronTesseract ocr = new IronTesseract();

// Load a BMP image
using OcrImageInput image = new OcrImageInput("example.bmp");

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
Imports IronOcr

Private ocr As New IronTesseract()

' Load a BMP image
Private OcrImageInput As using

' Perform OCR to extract text
Private ocrResult As OcrResult = ocr.Read(image)

' Output the extracted text to the console
Console.WriteLine(ocrResult.Text)
$vbLabelText   $csharpLabel

OCR'nin Dogrulugunu Arttirmak

OCR performansı, dil, görüntü cozunurlugu ve görüntüdeki gurultu seviyesini duzenleyerek optimize edilerek iyilestirilebilir. Metin çıkarma doğruluğunu artırmak için, kalitesi artırılması gereken bir görüntü üzerinde DeNoise() ve Sharpen() yöntemlerini kullanarak OCR'ı nasıl ayarlayabileceğiniz aşağıda açıklanmıştır:

using IronOcr;

IronTesseract ocr = new IronTesseract();

// Load the image and apply image processing to improve accuracy
using OcrImageInput image = new OcrImageInput("example.png");
image.DeNoise();
image.Sharpen();

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
using IronOcr;

IronTesseract ocr = new IronTesseract();

// Load the image and apply image processing to improve accuracy
using OcrImageInput image = new OcrImageInput("example.png");
image.DeNoise();
image.Sharpen();

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Output the extracted text to the console
Console.WriteLine(ocrResult.Text);
Imports IronOcr

Private ocr As New IronTesseract()

' Load the image and apply image processing to improve accuracy
Private OcrImageInput As using
image.DeNoise()
image.Sharpen()

' Perform OCR to extract text
Dim ocrResult As OcrResult = ocr.Read(image)

' Output the extracted text to the console
Console.WriteLine(ocrResult.Text)
$vbLabelText   $csharpLabel

Cikarilan Metni Aktarma

Metni resimden-metine cevirme surecinin temellerini ogrendiğimize gore, sonucuc metni sonradan kullanma icin nasıl aktarabilecegimizi inceleyelim. Bu örnek icin, görüntüyu yuklemek ve taramak icin onceki surecin aynisini kullanacagiz. Daha sonra, File.WriteAllText("output.txt", ocrResult.Text) kullanarak output.txt adlı yeni bir metin dosyası oluştururuz ve çıkarılan metni dosyaya kaydederiz.

using IronOcr;
using System.IO;

IronTesseract ocr = new IronTesseract();

// Load the image
using OcrImageInput image = new OcrImageInput("example.png");

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Save the extracted text to a file
File.WriteAllText("output.txt", ocrResult.Text);
using IronOcr;
using System.IO;

IronTesseract ocr = new IronTesseract();

// Load the image
using OcrImageInput image = new OcrImageInput("example.png");

// Perform OCR to extract text
OcrResult ocrResult = ocr.Read(image);

// Save the extracted text to a file
File.WriteAllText("output.txt", ocrResult.Text);
Imports IronOcr
Imports System.IO

Private ocr As New IronTesseract()

' Load the image
Private OcrImageInput As using

' Perform OCR to extract text
Private ocrResult As OcrResult = ocr.Read(image)

' Save the extracted text to a file
File.WriteAllText("output.txt", ocrResult.Text)
$vbLabelText   $csharpLabel

Resmi Metne Dönüştürme: Şekil 7

IronOCR'nin Ana Özellikleri

  1. Yuksek Dogruluk: IronOCR, gelişmiş Tesseract OCR algoritmalarini kullanir ve karisik görüntüleri işlemek icin icinde yer alan araclari içerir, bu da yuksek dogrulugu garanti eder.
  2. Coklu-dil Destegi: 125+ dili destekler, Latin, Kiril, Arap, ve Asya karakterleri gibi birden fazla yazilim skripleri dahil. Ancak unutulmamalidir ki, IronOCR ile birlikte yalnizca Ingilizce yuklenir. Diğer dilleri kullanmak icin, o dil icin ek bir dil paketi yuklemeniz gerekecektir.
  3. PDF OCR: IronOCR, belgesel nesillerin saptanabilmesi icin taranmis PDF'lerden metin cikartabilir.
  4. Görüntü Temizleme: Ileri işleme araclari sunar: egiklik giderme, gurultu giderme, ve tersleme gibi özellikler kullanarak daha iyi OCR dogrulugu icin görüntü kalitesini iyilestirin.
  5. Kolay Entegrasyon: API, ister bir konsol uygulamasi, bir web uygulamasi ya da masaustu yazilim olsun, herhangi bir .NET projesi ile sorunsuz entegre olur.

Resimleri Metne Cevirmenin Yaygin Kullanım Durumları

  • Veri Girisini Otomatiklestirme: Isletmeler, formlardan, makbuzlardan veya kartvizitlerden veri otomatik olarak cikarmak icin OCR'yi kullanabilir.
  • Belge Arsivleme: Organizasyonlar fiziksel belgeleri dijitalize ederek, arama yapılabilir hale getirip daha kolay saklayabilir.
  • Erisilebilirlik: Basili materyaller, ekran okuyucu ya da diğer yardimci teknoloji uygulariyla kullanim icin metne cevrilebilir.
  • Araştırma ve Analiz: Tarali araştırma materyallerinin hizla metne cevrilmesi ve diğer yazilim araclariyla entegrasyon icin analiz edilebilir.
  • Calisma: Taranmis calisma notlarini duzenlenebilir metne cevirin ve IronWord, Microsoft Word veya Google dokümanlari gibi araclarda daha fazla duzenleme icin bir Word belgesi olarak kaydedin.

Sonuç

IronOCR kullanarak bir görüntüden metni cevirme, belge işleme gorevlerini ele almanin hizli, dogru ve etkili bir yoludur. Ister taranmis belgelerle, ister dijital görüntülerle ya da PDF belgeleri ile calisirken, IronOCR sureci basit hale getirir, yuksek dogruluk, coklu dil destegi ve guclu görüntü işleme araclari sunar. Bu arac, belge yonetim akisini duzenlemek, veri cikarmayi otomatiklestirmek veya erisilebilirligi artirmak isteyen isletmeler icin idealdir.

Ücretsiz deneme kullanarak bugun IronOCR'nin guclu özelliklerini kendiniz deneyin. Calisma alani icine kolaylikla entegre edebilir ve OCR gorevlerini hizla işlemeye başlayabilirsiniz!

Kannaopat Udonpant
Yazılım Mühendisi
Yazılım Mühendisi olmadan önce, Kannapat Japonya'daki Hokkaido Üniversitesi'nden Çevresel Kaynaklar alanında doktora yaptı. Derecesini tamamlarken, Biyoprodüksiyon Mühendisliği Bölümü'nün bir parçası olan Taşıt Robotik Laboratuvarı'na da üye oldu. 2022'de, Iron Software mühendislik ekibine katılmak iç...
Daha Fazlasını Oku

Iron Destek Ekibi

Haftanın 5 günü, 24 saat çevrimiçiyiz.
Sohbet
E-posta
Beni Ara