Altbilgi içeriğine atla
OCR ARAçLARı

Mac İçin En İyi OCR [Ücretsiz Çevrimiçi Araçlar]

1.0 Giris

Tarama yapilmis belgelerin gunumuzdeki dijital ortamdaki kullanimi, OCR (Optik Karakter Tanima) teknolojisi sayesinde devrim niteliginde bir değişiklik gecirdi. Bu teknoloji, bilgisayarlara taranmis PDF belgeleri dahil çeşitli kaynaklardan metin tanimlama ve cikarma becerisi kazandirarak, PDF belgelerini hizla duzenlememize ve onlar ile etkilesime gecmemize olanak tanir. Optik karakter tanima (OCR) yazilimi olan Adobe Acrobat gibi programlar kullanarak, taranmis belgelerden metin cikarmak ve bunlari duzenlenebilir PDF'lere veya arama yapilabilir, görüntü tabanli PDF'lere dönüştürmek hizli ve basittir.

Geliştiriciler, Tesseract ve IronOCR gibi OCR kutuphanelerinin sundugu guclu araclar ve API'leri makine ogrenimi teknikleri ile birlestirerek, optik karakter tanima teknolojisinden tam olarak yararlanabilen ileri algoritmalardan faydalanabilirler. Bu kutuphaneler, yeni oluşturulan belgelerden ve daha once taranmis olanlardan yararli verileri daha duzenli bir sekilde organize etmek ve cikarmak icin dogru metin tanimlamayi saglar. OCR kullanarak taranmis belgeler ve sayfa resimlerinin potansiyelini maksimize etmek, kesintisiz içerik analizi ve hem bireysel hem de isletme verimlilik optimizasyonunu destekler. OCR taramasi, görüntüleri aranabilir PDF'lere dönüştürur ve OCR'yi gunumuzdeki teknoloji icin hayati bir arac haline getirir. Kağıt tabanli kayıtları sayısal hale getirmek, faturalarindan veri cikarmak ve belge erisilebilirligini artırmak icin kullanilir.

2.0 OCR Araçlari

Bu makalede, Mac kullanıcıları icin en iyi OCR yazilim araclarindan bazilarini tartisacagız. Bunlar sunlardir:

  1. Adobe Acrobat Pro DC
  2. ABBYY FineReader PDF
  3. Readiris 17
  4. IronOCR

2.1 Adobe Acrobat Pro DC

Orijinal belge tarama OCR programı ve 2023 yilinda Mac OCR yazilimi için en iyi secimimiz Adobe Acrobat Pro'dur. Adobe Acrobat Pro'nun PDF belgeleri oluşturma ve duzenleme, ayni zamanda PDF dosyalarini duzenlenebilir veya aranabilir formatlara dönüştürma işlemlerini saglayan Mac icin mevcut tek program olmasi sasirtici degildir. PDF formatı başlangıçta Adobe tarafından geliştirilmiştir. Piyasada birçok farklı PDF işlevi sunan başka ürünler olsa da, Adobe Document Cloud ile çevrimiçi Adobe Acrobat Pro DC'ye erişmek icin mevcut olmasina rağmen, Mac masaustu istemcisi mükemmel olmasi nedeniyle ozel bir yer edinir. Özellikle Adobe Acrobat, en son M1 ve M2 Mac'lerle uyumlu olan tek OCR programi oldugundan cazibesini daha da artırır.

  1. Başlamak için Acrobat'i calıştırın ve bir PDF dosyasi açin.
  2. Sağ pencerede, Edit PDF aracini seçin. Akrobat, belgenizi kısa sure sonra otomatik olarak bir optik karakter tanima (OCR) taramasi yaparak, PDF'nizin tamamen duzenlenebilir bir kopyasına dönüştürür.

Best OCR For Mac, Figure 1 - A PDF with Page 1 opened in Adobe Acrobat.

Bir öğeyi düzenlemek için üzerine tıklayın. Eklediginiz ek metin, orijinal yazı tipinin stiliyle eşleşecektir. Yeni değiştirilmiş belgenizi kaydetmek üzere Dosya > Farklı Kaydet'i seçin.

Adobe Acrobat DC yüklemesi hakkında daha fazla bilgiyi Adobe Acrobat web sitesinde öğrenebilirsiniz.

2.2 ABBYY FineReader PDF For Mac

ABBYY FineReader PDF OCR software for Mac, Mac icin ABBYY FineReader PDF OCR yazilim neredeyse 20 yildir mevcuttur, ancak bu surec boyunca cogunlukla ABBYY FineReader Pro olarak markalanmistir. ABBYY, macOS Big Sur'un piyasaya surulmesiyle FineReader PDF'i tanitmak icin FineReader ürün grubunu güncelledi. Ne yazik ki, sadece Intel Mac'lerle yöntemle calisir. ABBYY FineReader PDF for Mac, Rosetta ile kullanildiginda M1 ve M2 Mac ile uyumludur. Rosetta, macOS'de, Intel işlemciler için tasarlanmış yazılımları Apple Silicon ciplere uyarlayan bir programdir. M1/M2 çipleriyle dogal olarak uyumlu FineReader PDF'in Mac versiyonu yoktur. Bununla birlikte, hem Mac hem de PC icin en iyi masaustu OCR programlarindan biri olarak ABBYY FineReader PDF kalmaya devam etmektedir.

Orijinal belgenin kalitesi dogruluk oranini etkilerken, FineReader PDF'in OCR metin tanıma yetegi son derece basarili ve kesinlikle mevcut pazardaki en iyisidir. Taranmis belgenin orijinal formatı, metin büyüklüğü, yazı tipi stilleri, fotograflar, tablolar ve yerleşim planlari dahil olarak korunur. Ayrica, hizi ve hassas metin tanimasiyla formunun zirvesindedir. OCR işlemi yapmak için gerekli adımlar aşağıda sunulmuştur:

  1. ABBYY FineReader PDF'i başlatın.
  2. Hareketlendirilebilir PDF seçeneğini seçin, bu, bir PDF açmanıza ve bunu aranabilir bir PDF'e dönüştürmenize izin verir. Dönüştürülmüş PDF dosyalarını da kaydedebilirsiniz.

Mac için En İyi OCR, Şekil 2 - ABBYY FineReader kaynak diyalogu.

ABBYY FineReader hakkkında daha fazla bilgi almak için web sitesini ziyaret edin.

2.3 Readiris 17

Mac kullanıcıları, bir OCR çözümü olarak ReadIris 17'yi kullanabilirler. Ana kullanımı Windows'da olmasına rağmen, ReadIris, Mac kullanıcıları için bir OCR kapasiteli PDF okuyucu ve düzenleyici geliştirdi.

ReadIris 17 ile, kullanıcılar kolayca PDF'leri birleştirebilir, ayırabilir, koruyabilir ve imzalayabilir. Çevrimdışı Mac OCR yazılımı, PDF dosyalarının belge biçimini koruyarak Word, Excel, Aranabilir PDF veya PowerPoint'e dönüştürülmesine olanak tanır. Ancak, freemium sürümü aynı anda taranabilen sayfa sayısına sınırlamalar getirir.

Best OCR For Mac, Figure 3 - A PDF In ReadIris 17 with the text Hello world!.

Bir görüntüyü yazılıma girdim ve içinden metin çıkarmaya çalıştım. Ayrıca, ekranda görünen unsurları da yakaladı. Bazı sonraki işlemler gerekebilir.

Daha fazlasını öğrenmek için Iris web sitesini inceleyin.

2.4 IronOCR

IronOCR, standart Tesseract kütüphanesiyle karşılaştırıldığında Tesseract'ı geliştirir ve geliştirilmiş doğruluk, performans ve kararlılık sunan yerel bir C# OCR kütüphanesi sağlar. .NET araçları ve web siteleri kullanarak PDF'lerden ve görüntülerden metin çıkarılmasını sağlar. IronOCR, düz metin veya yapılandırılmış veriler olarak çıktılar sağlayabilen geniş bir yabancı dil yelpazesini destekler. Barkodları ve iç içe metinleri olan görüntüleri okuyabilir. Dot NET konsol, web, MVC ve masaüstü uygulamalarında geliştirilen uygulamalar Iron Software OCR kütüphanesinden yararlanabilir. Geliştirme ekibi, ticari dağıtımlar için doğrudan destek sunar. IronOCR, Visual Studio'nun en son sürümleriyle uyumludur.

IronOCR Avantajları

  1. Modern Tesseract 5 motorunu kullanarak, IronOCR çeşitli görüntülerden veya PDF dosyalarından kağıt belgeleri, barkodları ve QR kodlarını tarayabilir. Bu paket, OCR'ın masaüstü, konsol ve web uygulamalarına entegrasyonunu basitleştirir.
  2. IronOCR'un yardımıyla, taranmış PDF dosyalarını aranabilir PDF'lere dönüştürerek OCR yapabiliriz.
  3. IronOCR, dünya genelinde 125 farklı dili destekler, ayrıca özel diller ve kelime listeleri de sunar.
  4. Yazılım, 20'den fazla farklı türde barkod ve QR kodunu okuyabilir.
  5. IronOCR, hem barkod verilerini hem de düz metin çıktısını sağlar. Geliştiriciler, alternatif yapılandırılmış bir veri nesne paradigması yoluyla bir sisteme doğrudan giriş yapabilmek için tüm içeriğe erişebilirler. Bu, çevrim içi uygulamalarda mantıksal olarak düzenlenmiş başlıkları, paragrafları, satırları, kelimeleri ve karakterleri içerir.

Daha fazla bilgi için IronOCR web sitesine bakın.

IronOCR Kullanarak OCR İşleme

IronOCR, güçlü bir OCR kütüphanesi olarak, PDF belgelerinin dönüştürülmesini ve veri erişimini sağlar. Veri gizliliğinden ödün vermeden, etkili analiz ve işlem için makine tarafından okunabilir metne dönüştürmeyi kolaylaştırır. İşte OCR kullanarak bir görüntüden metin çıkarmak için IronOCR'un nasıl kullanıldığına dair bir örnek:

// Instantiate IronTesseract object to use IronOCR capabilities
var Ocr = new IronTesseract();

// Specify the language to use for OCR
Ocr.Language = OcrLanguage.EnglishBest;

// Define the Tesseract version to use
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;

// Use an OcrInput object to add images for OCR processing
using (OcrInput ocrInput = new OcrInput("Demo.gif"))
{
    // Perform OCR and obtain the result containing extracted text
    OcrResult ocrResult = Ocr.Read(ocrInput);

    // Print the extracted text to the console
    Console.WriteLine(ocrResult.Text);
}
// Instantiate IronTesseract object to use IronOCR capabilities
var Ocr = new IronTesseract();

// Specify the language to use for OCR
Ocr.Language = OcrLanguage.EnglishBest;

// Define the Tesseract version to use
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5;

// Use an OcrInput object to add images for OCR processing
using (OcrInput ocrInput = new OcrInput("Demo.gif"))
{
    // Perform OCR and obtain the result containing extracted text
    OcrResult ocrResult = Ocr.Read(ocrInput);

    // Print the extracted text to the console
    Console.WriteLine(ocrResult.Text);
}
' Instantiate IronTesseract object to use IronOCR capabilities
Dim Ocr = New IronTesseract()

' Specify the language to use for OCR
Ocr.Language = OcrLanguage.EnglishBest

' Define the Tesseract version to use
Ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5

' Use an OcrInput object to add images for OCR processing
Using ocrInput As New OcrInput("Demo.gif")
	' Perform OCR and obtain the result containing extracted text
	Dim ocrResult As OcrResult = Ocr.Read(ocrInput)

	' Print the extracted text to the console
	Console.WriteLine(ocrResult.Text)
End Using
$vbLabelText   $csharpLabel

Verilen kod parçacığında, IronTesseract OCR özelliklerini geliştirmektedir. OcrInput nesnesi, metin cikarma için resim ekleme konusunda basit bir arayuz oluşturmaktadır. Belirtilen resim yolu, IronOCR resimleri okuyup metni string formatında çıkararak OCR sürecini başlatmak için kullanılır.

Best OCR For Mac, Figure 4 - A PDF opened in Adobe Acrobat with the text Hello world!.

Aşağıdaki çıktı, sağlanan görüntüden metin çıkarıldığını göstermektedir; doğru bir çıkarım yapıldığını teyit eder. IronOCR, sonuçları kaydetmek için çeşitli çıkış formatlarını da destekler.

Best OCR For Mac, Figure 5 - The text Hello world! is displayed on the command line.

Sonuç

Piyasada bulunan birden fazla OCR aracı, faturaların veri işlenmesine izin verir. Görüntülerin OCR işlemi, sağlanan görüntülerden metin verilerinin çevrilmesini sağlar. İlk iki OCR aracı, fatura verilerini işleyerek manuel veri girişi olmadan otomatik tarama ve veri doğrulama yapılmasını sağlar. Bu araçlar genellikle pahalı olur ve genellikle etkin bir internet bağlantısı gerektirir, bu da kullanılabilirliklerini belirli ortamlarla sınırlar.

Öte yandan, IronOCR .NET Framework Standard 2, .NET Framework 4.5 ve .NET Core 2, 3 ve 5 gibi çeşitli .NET projelerini destekler. Ayrıca Xamarin, Azure, MAC ve Mono gibi çağdaş teknolojilerle çalışır. IronOCR, Tesseract'ın çıktısını geliştirir ve IronOCR yöntemlerini kullanarak yanlış taranmış kelimeleri veya görüntüleri düzeltir. Karmaşık Tesseract sözlük sistemi NuGet Paketi tarafından yönetilir. Iron OCR Kütüphanesi, bir OCR aracı oluşturmak için kullanılır. Bu nedenle, IronOCR, minimal kodlama ile faturaların otomasyonunu ve verilerin çıkarılmasını sağlamak için ideal bir fatura OCR yazılımıdır.

Çok sayıda görüntü formatını, PDF dosyalarını ve MultiFrame TIFF'yi destekleyen IronOCR, ek ayarlar gerektirmeden sorunsuz bir deneyim sunar. Optik karakter tanımanın ötesine geçerek, barkodları içeren görüntülerden veri çıkarımı için barkod tanımlama yetenekleri sunar. IronOCR'un uygun fiyatlı gelişim sürümünün ücretsiz denemesi mevcuttur ve IronOCR paketi satın alındığında ömür boyu lisans içerir. IronOCR paketi, birden fazla sistemi kapsayan tek bir fiyatlandırma sunduğundan mükemmel bir değer sunar. IronOCR'un maliyeti hakkında daha fazla detay için lütfen IronOCR web sitesini ziyaret edin.

Kannaopat Udonpant
Yazılım Mühendisi
Yazılım Mühendisi olmadan önce, Kannapat Japonya'daki Hokkaido Üniversitesi'nden Çevresel Kaynaklar alanında doktora yaptı. Derecesini tamamlarken, Biyoprodüksiyon Mühendisliği Bölümü'nün bir parçası olan Taşıt Robotik Laboratuvarı'na da üye oldu. 2022'de, Iron Software mühendislik ekibine katılmak iç...
Daha Fazlasını Oku

Iron Destek Ekibi

Haftanın 5 günü, 24 saat çevrimiçiyiz.
Sohbet
E-posta
Beni Ara