Altbilgi içeriğine atla
OCR ARAçLARı

OCR Foto (Başlangıç Eğitimi)

Optik Karakter Tanıma (OCR) teknolojisi, dijital dunyada metinle etkileşim kurma şeklimizi dondurmuştur. OCR Foto araçları, görüntüleri metne dönüştürme yeteneği sunar, bu da basılı notları dijitalleştirmeyi daha kolay hale getirir.

Bu makalede, dört çevrim içi OCR aracını—hem ücretsiz hem de ücretli—inceleyeceğiz ve C# programında OCR'nin nasıl uygulanabileceğini gösteren IronOCR'ye bir girişle sone ereceğiz.

1. Google Vision API

Google Vision API, Google tarafından sağlanan görüntüden metne dönüştürme çözümünü oluşturmak için güçlü bir OCR çözümü sağlar. Görüntü ve PDF metin çıkartmasını destekler ve birden çok dili tanıyabilir.

OCR Foto (Yeni Başlayanlar İçin Eğitim): Şekil 1

Artılar

  • Yuksek doğruluk
  • Dil desteği
  • Diğer Google Cloud hizmetleriyle entegrasyon

Eksiler

  • API anahtarı gerektirir
  • Belirli bir kullanım eşiğini aştıktan sonra tamamen ücretsiz değil

Adım 1: API Anahtarı Alma

  • Google Cloud Konsolu'nu ziyaret edin.
  • Yeni bir projeyi oluşturun ya da mevcut bir projeyi seçin.
  • Cloud Vision API'yi etkinleştirin ve bir API anahtarı uretin.

Adım 2: API Istegi Yapma

  • HTTP POST isteği yapmak için cURL gibi bir araç veya tercih ettiğiniz bir programlama dilini kullanın.
  • Istek yüküne görüntü dosyası veya URL'yi dahil edin.
curl -s -X POST -H "Content-Type: application/json" \
    -H "Authorization: Bearer YOUR_API_KEY" \
    --data-binary @path/to/your/image.jpg \
    "https://vision.googleapis.com/v1/images:annotate?key=YOUR_API_KEY"
curl -s -X POST -H "Content-Type: application/json" \
    -H "Authorization: Bearer YOUR_API_KEY" \
    --data-binary @path/to/your/image.jpg \
    "https://vision.googleapis.com/v1/images:annotate?key=YOUR_API_KEY"
SHELL

Adım 3: Sonuçları Ayırma

  • API yanıtından tanınmış metni çıkartın.
{
  "responses": [
    {
      "textAnnotations": [
        {
          "description": "Hello World!",
          "boundingPoly": { /* bounding box coordinates */ }
        }
      ]
    }
  ]
}

2. Tesseract OCR

Tesseract Google tarafından geliştirilen bir açık kaynaklı OCR motorudur. 100'den fazla dili destekler ve doğruluk ve esneklik açısından yaygın olarak kullanılır. Çoklu dosya formatlarındaki görüntüleri dönüştürmeye yardımcı olur ve taranmış görüntüleri bile düzenlenebilir metne dönüştürür.

OCR Foto (Yeni Başlayanlar İçin Eğitim): Şekil 2

Artılar

  • Açık kaynaklı
  • Yuksek doğruluk
  • Topluluk desteği

Eksiler

  • Entegrasyon için ek araçlar gerekebilir
  • En iyi sonuçlar için görüntü ön işlemeye ihtiyaç duyulabilir.

Adım 1: Tesseract'ı Yükleyin

  • Resmi GitHub deposundan Tesseract OCR'yi indirin ve yükleyin.
  • Terminalden erişim sağlamak için Tesseract klasörünü PATH ortam değişkenine ekleyin.

Adım 2: Görüntüde OCR Çalıştırın

  • Bir terminal açın ve görüntünün bulunduğu klasöre gidin.
  • Aşağıdaki komutu çalıştırın:
tesseract path/to/your/image.jpg output.txt
tesseract path/to/your/image.jpg output.txt
SHELL

Adım 3: Sonuçları Görüntüleyin

  • Çıkardığınız metni görmek için oluşturulan metin dosyasını (output.txt) açın.

3. ABBYY FineReader Online

ABBYY FineReader Online, kullanıcıların taranmış belgeleri ve görüntüleri düzenlenebilir formatlara dönüştürmesine olanak tanıyan bulut tabanlı bir OCR hizmetidir.

Bu çevrimiçi araç, görüntülerden metin çıkarmak için çevrimiçi olarak ücretsiz kullanılabilir bir OCR'tabanlı metin dönüştürücü sunar.

OCR Foto (Yeni Başlayanlar İçin Eğitim): Şekil 3

Artılar

  • Kullanıcı dostu görüntü OCR aracı
  • Çeşitli giriş formatlarını destekler
  • Belge formatlamasını korur

Eksiler

  • Sınırlı ücretsiz kullanım
  • İnternet bağlantısı gerektirir

Adım 1: ABBYY FineReader Online'a Gidin

  • ABBYY FineReader Online web sitesine gidin.
  • Windows veya Mac için ücretsiz deneme sürümünü indirin.
  • Yazılımı yükleyin ve verilen adımları izleyin.

Adım 2: Görüntü Yükleyin

  • "Dosya Seç" düğmesine tıklayın ve görüntünüzü yükleyin.

Adım 3: Görüntüyü İşleyin

  • Görüntünün işlenmesini bekleyin. Araç, metni otomatik olarak çıkaracaktır.

Adım 4: Metni Düzenleyin

  • Çıkartılan metni kaydedin veya gerekli düzeltmeleri yapmak için düzenleyiciyi kullanın.
  • Word, Excel ve Metin formatlarında kaydedin.

4. Online OCR

Online OCR, çevrimiçi olarak görüntüden metne dönüştürme için çoklu dil desteği sunan web tabanlı bir OCR hizmetidir. Kullanıcılar doğrudan cihazlarından görüntü yükleyebilir veya URL sağlayabilirler.

Artılar

  • Basit kullanıcı arayüzü
  • Çeşitli giriş formatlarını destekler
  • Kısıtlamalarla birlikte ücretsiz kullanım

Eksiler

  • Sınırlı ücretsiz özellikler
  • İnternet bağlantısına bağlı

Adım 1: Online OCR'a Gidin

Web sitesine Online OCR gidin.

Adım 2: Görüntü Yükleyin

"Dosya Seç" düğmesine tıklayın ve görüntünüzü yükleyin.

OCR Foto (Yeni Başlayanlar İçin Eğitim): Şekil 4

Adım 3: Dil ve Çıkış Formatını Seçin

Görüntüdeki metnin dilini ve çıkış formatını seçin.

OCR Foto (Yeni Başlayanlar İçin Eğitim): Şekil 5

Adım 4: OCR Başlat

"Dönüştür" düğmesine tıklayarak OCR işlemini başlatın.

Adım 5: Metni İndir

İşlem tamamlandığında, sağlanan linkten çıkan metni indirin.

OCR Foto (Yeni Başlayanlar İçin Eğitim): Şekil 6

Introduction to IronOCR in C

Şimdi, geliştiricilere OCR işlevselliğini sorunsuz bir şekilde uygulamak için araçlar sağlayan güçlü bir C# OCR kütüphanesi olan IronOCR'ye derinlemesine bakalım. IronOCR, Iron Software ekibi tarafından geliştirilen önde gelen bir C# OCR kütüphanesidir.

IronOCR, C# geliştiricileri için özel olarak tasarlanmış güçlü bir Optik Karakter Tanıma (OCR) kütüphanesi olarak öne çıkar, görüntülerden doğru ve sorunsuz metin çıkarımı için etkili bir araç sağlar.

Güvenilirliği ve verimliliği ile tanınan IronOCR, belgelerden ve görüntülerden metin çıkarmak için kapsamlı bir çözüm arayan C# geliştiricileri arasında popülerlik kazanmıştır.

Doğruluk ve çok yönlülüğe odaklanan IronOCR, belge yönetim sistemlerinden veri çıkarma uygulamalarına kadar çeşitli projeler için tercih edilen bir seçenek olmuştur.

Gelişmiş OCR algoritmalarından yararlanan IronOCR, JPEG, PNG ve TIFF dahil olmak üzere çeşitli görüntü formatlarından metni doğru bir şekilde çözme konusunda ustadır. Çok dil desteğine de sahip olan bu kütüphane, çeşitli dil ihtiyaçlarına hitap eden uygulamalar için değerli bir araç haline gelir.

Bu kütüphane, popüler .NET çerçeveleriyle sorunsuz bir şekilde entegre olur ve C# uygulamalarında OCR işlevselliğinin uygulanmasını streamline eder.

İster taranmış belgelerle ister görüntülerle çalışıyor olun, IronOCR'nin kapsamlı özellikleri, geliştiricilere projelerine OCR yeteneklerini kolayca dahil etme yetkisi verir.

IronOCR Özelliklerini Ayrıntılı Olarak

  1. Gelişmiş OCR Algoritmaları: IronOCR, karmaşık senaryolarda bile yüksek doğruluğu sağlamak için temel karakter tanımanın ötesine geçen karmaşık OCR algoritmalarını kullanır.
  2. Görüntü Format Desteği: Geliştiriciler, IronOCR'nin JPEG, PNG ve TIFF gibi çeşitli görüntü formatlarını desteklemesinden faydalanarak, farklı görsel içerikleri esneklikle işleme kabiliyetine sahip olabilirler.
  3. Çoklu Dil Desteği: Uygulamaların küresel doğasını tanıyan IronOCR, farklı dillerdeki metinleri doğru bir şekilde çıkarmayı sağlayan çoklu dil desteği ile donatılmıştır.
  4. PDF Metin Çıkarma: IronOCR, görüntülerin yanı sıra PDF belgelerinden de metin çıkarmayı genişleterek, dijital formatlarda saklanan belgelerle ilgili senaryolarda uygulanabilirliğini artırır.
  5. .NET Çerçeveleri ile Entegrasyon: IronOCR, popüler .NET çerçeveleriyle sorunsuz bir şekilde entegre olur ve C# geliştiricilerinin projelerine OCR işlevselliğini zahmetsizce dahil etmelerini sağlar, bu da genişletilmiş konfigürasyon olmaksızın mümkündür.

Implementing OCR with IronOCR in C

Aşağıda, IronOCR kullanılarak C# ile bir görüntüden metin çıkarmanın basit bir örneği verilmiştir:

using IronOcr; // Import the IronOcr namespace

// Create an instance of IronTesseract
var ocr = new IronTesseract();

// Read text from the specified image file
string imageText = ocr.Read(@"images\image.png").Text;

// Output the extracted text
Console.WriteLine(imageText);
using IronOcr; // Import the IronOcr namespace

// Create an instance of IronTesseract
var ocr = new IronTesseract();

// Read text from the specified image file
string imageText = ocr.Read(@"images\image.png").Text;

// Output the extracted text
Console.WriteLine(imageText);
Imports IronOcr ' Import the IronOcr namespace

' Create an instance of IronTesseract
Private ocr = New IronTesseract()

' Read text from the specified image file
Private imageText As String = ocr.Read("images\image.png").Text

' Output the extracted text
Console.WriteLine(imageText)
$vbLabelText   $csharpLabel

Bu basit C# kod parçası, bir görüntü dosyasından metin okumak için IronOCR'nin nasıl kullanılabileceğini göstermektedir. Geliştiriciler, kendi özel gereksinimlerine bağlı olarak OCR sürecini daha fazla özelleştirebilirler.

IronOCR'nin gelişmiş işlevselliği hakkında daha fazla bilgi için lütfen doküman sayfasını ziyaret edin.

Sonuç

OCR foto araçları, görüntülerden metinsel içeriği dijitalleştirmede hayati bir rol oynar. Çeşitli çevrimiçi araçlar rahatlık sunsa da, IronOCR, geliştiricilere C# uygulamalarına OCR yeteneklerini entegre etmek için güçlü ve esnek bir çözüm sunmaktadır.

Çevrimiçi araçlar ile programlanabilir şekilde uygulanan kütüphaneler arasındaki seçim, doğruluk gereksinimleri, özelleştirme ihtiyaçları ve geliştiricilerin OCR süreci üzerinde aradıkları kontrol düzeyi gibi faktörlere bağlıdır.

IronOCR, bir ücretsiz deneme sunar. Yazılımı buradan indirin.

Kannaopat Udonpant
Yazılım Mühendisi
Yazılım Mühendisi olmadan önce, Kannapat Japonya'daki Hokkaido Üniversitesi'nden Çevresel Kaynaklar alanında doktora yaptı. Derecesini tamamlarken, Biyoprodüksiyon Mühendisliği Bölümü'nün bir parçası olan Taşıt Robotik Laboratuvarı'na da üye oldu. 2022'de, Iron Software mühendislik ekibine katılmak iç...
Daha Fazlasını Oku

Iron Destek Ekibi

Haftanın 5 günü, 24 saat çevrimiçiyiz.
Sohbet
E-posta
Beni Ara