Neden Tesseract Yerine IronOCR'u Tercih Etmelisiniz
Doğruluk
Tesseract
- Tesseract döndürülen, eğimli, düşük DPI, taranmış veya arka plan gürültüsü olan görüntülerle başa çıkamaz.
- Photoshop veya ImageMagick kullanarak görüntü ön işleme gerektirir.
- İşlemesi uzun sürebilir ve sıklıkla anlamsız bilgiler sağlar.
IronOCR
- IronOCR, süreci basitleştirmek için ön işleme yapar ve görüntü filtreleri uygular.
- Kullanıcılar, minimal yapılandırma ile genellikle %99,8 ila %100 doğruluk elde ederler.
Görüntü Uyumluluğu
Tesseract
- Yalnızca Leptonica PIX görüntü formatını kabul eder; bu, C#'da bir
IntPtrC++ nesnesidir. - PIX nesneleri yönetilen bellek değildir. C# içerisinde dikkatlice ele alınmadığında bellek sızıntılarına neden olur.
IronOCR
- Görüntüler bellek tarafından yönetilir.
- Geniş bir görüntü formatı yelpazesini destekler:
- Çoklu Çerçeve TIFF
- JPEG ve JPEG2000
- GIF
- PNG
- System.Drawing Bitmap'ler, Akış ve Bayt Dizisi/İkili Görüntü Verileri (
byte[])
- IronSoftware.System.Drawing, evrensel bir Bitmap formatına izin vererek System.Drawing'a olan bağımlılığı kaldırmayı hedefliyor.
Performans
Tesseract
- Doğru sonuçlar elde etmek için ince ayar yapılması gereken zayıf belgelenmiş ayarlar.
- Temiz belgeler ve önceden işlemden geçirilmiş görüntülere bağlıdır.
IronOCR
- Çoğu görüntüde sıfır yapılandırma ile doğru çalışır.
- Çok iş parçacıklı işlem ile çok çekirdekli işlemcilerden tam olarak yararlanır.
- Düşük çözünürlüklü görüntüler bile genellikle yüksek doğruluk sağlar.
- Photoshop gerektirmez.
API
Tesseract
- Az veya hiç destek yok ve yeni başlayanlar için dostça değil:
- Interop katmanları ile çalışmayı gerektirir. GitHub'da bulunan birçok eski, çözülmemiş sorunlar, bellek sızıntıları ve konsol uyarıları içerir.
- .NET Core veya Standard'ı desteklemeyebilir.
- Komut satırı EXE ile çalışmanın dağıtımı zordur ve virüs tarayıcıları ve güvenlik politikaları tarafından kesilebilir.
- Interop katmanları ile çalışmayı gerektirir. GitHub'da bulunan birçok eski, çözülmemiş sorunlar, bellek sızıntıları ve konsol uyarıları içerir.
IronOCR
- Tesseract için yönetilen ve test edilmiş bir .NET Kütüphanesi olan IronTesseract.
- IntelliSense desteği ile tam belgelenmiştir.
- Destek mühendisleri ekibi yardıma hazır.
Diller
Tesseract
- Yalnızca 100 dili destekler.
IronOCR
- 125'in üzerinde yerleşik dili destekler ve özel dil paketi desteği sağlar.
Sonuç
Tesseract, C++ geliştiricileri için mükemmel bir kaynaktır, ancak .NET için tamamlanmış bir OCR kütüphanesi değildir. Taranmış veya fotoğraflanmış görüntüler, Tesseract'ın doğru bir şekilde çalışabilmesi için ortogonal, standartlaştırılmış, yüksek çözünürlükte ve dijital parazit olmadan ön işleme tabi tutulmalıdır.
Buna karşılık, IronOCR bunu ve daha fazlasını, yalnızca tek satırlık bir kod ile yapabilir. IronOCR, dahili OCR motoru için çok iyi ayarlanmış bir Tesseract kullanır, C# için tasarlanmış olup, performans artırmaları ve ek standart özellikler içerir.

