PDF OCR Metin Çıkarma
Iron Tesseract birçok görüntü formatını ve ayrıca PDF belgelerini okuyabilir. Bu özellik, geleneksel ücretsiz Tesseract motorlarıyla mümkün değildir.
OcrInput, taramaların kalitesi düşükse PDF özelliklerinin otomatik olarak düzeltilmesi seçeneği sunar.
Geliştiriciler, PDF'nin tamamını, belirli sayfaları veya tek bir kırpma alanını okumayı seçebilirler.
C#'da PDF Dosyasını OCR'ye Dönüştürme
- C# kütüphanesini indirerek PDF dosyasını OCR'a dönüştürün
- PDF
AddPdfyöntemini kullanarak PDF belgesi ekleyin - PDF belgesinin belirli sayfalarını
AddPdfPagesyöntemiyle - Eklenen PDF'lerde
Readyöntemini kullanarak eklenen PDF üzerinde OCR işlemi gerçekleştirin - Tüm QR Kodu değerlerini
Barcodesözelliğinde görüntüleyin. OCR sonucunu almak için Metin özelliğine erişin
C# PDF OCR
Birçok OCR aracı optimum koşullarda sorunsuz çalışır, ancak her koşulda daha yüksek kararlılık ve doğrulukla işini yapan bir araca ihtiyacınız varsa, IronOCR metin çıkarma çözümü tam da aradığınız şeydir.
Metin çıkarma için IronOCR, sıfırdan geliştirilmiştir ve gerçek dünya görüntülerini yüzde 99 doğrulukla dönüştürme yeteneğine sahiptir.
IronTesseract, bizim yerel C# OCR kütüphanemiz, her zaman iyi kalitede olmayan ve bazen çarpık olan gerçek dünya görüntülerinden karakterleri neredeyse insan gibi tanıyabilir.
OCR özelliğimiz, taramaların kalitesi düşük olduğunda PDF veya görüntü özelliklerinin otomatik olarak düzeltilmesini sağlar.
Şu anda mevcut olan sınıfının en iyisi OCR çözümünü size tanıtırken, bunu kendiniz de görebileceksiniz.
Görüntü veya PDF OCR Metin Çıkarma için Neden IronOCR?
Tesseract yönetimi için IronOCR çözümünü seçmek, aşağıdakileri içeren benzersiz yetenekleri göz önüne alındığında en mantıklı seçimdir:
- PDF OCR metin çıkarma motoru IronOCR for .NET, saf .NET ortamında kullanıma hazırdır.
- Bilgisayarınıza Tesseract'ın yüklenmesi gerekmez.
- En yeni motorlarla olağanüstü iyi çalışır: Tesseract 5 (ayrıca Tesseract 4 ve 3).
- Herhangi bir .NET projesinde kullanılabilir: .NET Framework 4.5 +, .NET Standard 2 + ve .NET Core 2, 3 & 5!
- Diğer açık kaynaklı Tesseract'lara kıyasla doğruluk ve hız açısından iyileştirilmiştir.
- IronOCR, Xamarin, Mono, Azure ve Docker geliştirme platformlarını destekler.
- NuGet paketlerini kullanarak karmaşık Tesseract sözlük sistemlerini yönetebilirsiniz.
- PDF'lerden, MultiFrame TIFF'lerden ve tüm önemli görüntü dosyalarından herhangi bir ek işlem yapmadan metin çıkarabilir.
- Metin çıkarma projenizden en iyi sonuçları elde etmek için düşük kaliteli ve çarpık görüntü taramalarını düzeltebilir.
Düşük kaliteli taramalarınız mı var? Sorun değil!
IronOCR, OCR görevleri söz konusu olduğunda bir üst seviyede öne çıkmaktadır. Gerçekte, birçok benzer ürün, makineyle basılmış, yüksek çözünürlüklü ve kusursuz metin veya görüntülerle iyi çalışacak şekilde üretilir; bu nedenle gerçek dünya uygulamalarında hatalı sonuçlar verir veya başarısız olur. Ancak, IronOCR'da durum böyle değildir.
IronOCR, kusurlu belgeleri düzeltmede mükemmeldir. Eğri taranmış bir görüntüyü düzeltebilir ve düşük kaliteli fotoğrafları iyileştirerek bunların aranabilir PDF belgeleri veya görüntüler haline gelmesini sağlayabilir. Ürünümüzü diğerlerinden ayıran da budur.
IronOCR performansını iş akışınıza uyacak şekilde ayarlayın
Iron Software OCR çözümü ile, iş akışınız için doğru dengeyi sağlamak amacıyla metin çıkarma görevlerinizin performansını ayarlayabilirsiniz. Bunun birçok kullanıcı ve geliştirici için çok önemli olduğunu biliyoruz, bu nedenle OCR çözümümüzü performans açısından ayarlanabilir ve esnek olacak şekilde tasarladık.
Örneğin, bir OCR işinin hızını etkileyen çok önemli bir faktör, giriş görüntüsünün kalitesidir. Arka plan gürültüsü az olduğunda ve görüntünün dpi değeri yüksek olduğunda (200 dpi iyi bir aralıktır), verim daha yüksek ve OCR sonuçları daha doğru olur. Ancak, IronOCR performans ayarlama özelliği sayesinde, düşük kaliteli görüntüler içeren görevler bile hızla tamamlanabilir.
Ayrıca, PNG veya TIFF gibi dijital gürültünün daha az olduğu giriş görüntüleri veya taranmış metin formatlarının seçilmesi, JPEG gibi düşük kaliteli görüntü formatlarına kıyasla daha hızlı sonuçlar verebilir.
IronOCR çözümünü kurmak çok kolaydır
Iron Software paketi, kurulumu ve çalıştırması çok kolaydır. En popüler geliştirme platformlarında kullanılabilir. Çözümümüz, Windows, Linux, macOS, Azure, AWS ve Docker'ı içeren çapraz platform desteğine sahiptir — C#'ın geliştiriciler arasında en çok tercih edilen Tesseract OCR motoru olmasının bir nedeni vardır.
125'ten fazla uluslararası dil desteği
OCR işleri için, bir yazılımın birden fazla dili desteklemesi onu daha kullanışlı hale getirir. IronOCR çözümü, 125 uluslararası dili desteklediği için vazgeçilmez bir araç haline gelmiştir. Bu diller, DLL dosyaları olarak dağıtılan dil paketleri aracılığıyla yüklenebilir. Bu araçlar bu web sitesinden veya Visual Studio için NuGet Paket Yöneticisi'nden indirilebilir.
OCR Dil Paketleri Nasıl Yüklenir
Yüz yirmi dil desteklenmektedir. İki yöntem kullanarak ek OCR Dil paketlerini indirebilirsiniz:
NuGet paketini yükleyin
NuGet'te IronOCR Dilleri'ni arayın.
OCR veri yöntemini kullanma
ocrdata dosyasını indirin ve .NET projenize veya program dosyalarınıza ekleyin.
Taranmış dosyalarınız veya resimlerinizden kolayca aranabilir belgeler oluşturun
Gurur duyduğumuz özelliklerden biri, Tesseract yazılımımızın giriş görüntüleri veya taranmış bir PDF dosyasından aranabilir bir PDF belgesi veya aranabilir metin oluşturabilmesidir. OCR sonucunuzu, C# ve VB.NET'te aranabilir bir PDF belgesi olacak şekilde PDF olarak dışa aktarabilirsiniz. Bu, işletmelerin ve kamu kurumlarının veritabanı doldurma, SEO ve PDF'ler konusunda gerçekten yardımcı olabilir.
En iyi OCR aracının gücünden yararlanın
IronOCR, görüntülerden ve belgelerden metin çıkarmak için sınıfının en iyisi bir araçtır. OCR görevlerini tamamlarken size rahat ve sorunsuz bir deneyim sunan bir dizi özellik, işlev ve çözümle birlikte gelir.
OCR Tesseract C# kütüphanelerimiz, C# ve .NET uygulamaları gibi geliştirme ortamlarında görüntülerden ve taranmış belgelerden metin ayıklamanıza yardımcı olabilir.
IronOCR ile şifre korumalı PDF belgelerini bile kolaylıkla açabilir ve metni sorunsuz bir şekilde çıkarabilirsiniz.
Ayrıca aşağıdaki özelliklere sahiptir:
- Yürütülebilir dosyalar veya C# kodu gerektirmez
- Tam PDF OCR desteği
- MVC, Web Uygulaması, Masaüstü, Konsol ve Sunucu Uygulaması ile uyumlu
- Tam .NET Core, Standard ve Framework desteği
C#veVB.NET kullanarak okuyun- QR kodlarını ve BARCODE'leri okur
- OCR'yi XHTML veya aranabilir bir PDF belgesine aktarır
- Çoklu iş parçacığını destekler
- Görüntüleri, koordinatları, istatistikleri, yazı tiplerini ve çok daha fazlasını çıkarır
IronOCR'ye Doğru Cesur Bir Adım Atın
Bu inanılmaz OCR çözümünün özelliklerini göz önünde bulundurursak, IronOCR'yi denemeye karar verirseniz kesinlikle pişman olmayacaksınız.
Yazılımımızı kullanmak sadece birkaç tık uzaklıkta. IronOCR'yi yükleyerek başlayın — bu son derece kolay bir işlemdir. Ayrıca, araçlarımızın ve kılavuzlarımızın kullanımıyla ilgili son derece yararlı ve ayrıntılı adım adım kılavuzlar mevcuttur; sorularınızı mümkün olan en kısa sürede (neredeyse anında) yanıtlayan kaynakları zengin destek merkezimizden bahsetmeye bile gerek yok.
Tereddüt etmeyin — IronOCR'yi bugün seçin. Bu, C#'da PDF dosyalarını okumayı öğrenmenin ilk ve en önemli adımıdır.
Hala tereddütleriniz varsa, Ücretsiz Deneme Lisansı anahtarımız tam size göre. Bu, IronOCR'nin en son sürümünün tüm potansiyelini hiçbir mali koşul olmadan keşfetmenize yardımcı olabilir. Bu, sizin için en uygun yazılım lisansını seçmenize yardımcı olabilir. Emin değilseniz, bulunduğunuz yerden bağımsız olarak uzman ekibimizle iletişime geçmekten çekinmeyin.

