Altbilgi içeriğine atla
OCR ARAçLARı

Python ile OCR Nasıl Geliştirilir

Dünya, büyük miktarda metinsel bilgiyle dolu. Erişilebilirliği biraz artırılmış olsaydı son derece yararlı olabilecek bir dizi değerli içerik var.

İşte bu noktada Optik Karakter Tanıma (OCR) teknolojisi devreye giriyor. Bir bilgisayarın, yalnızca makine görüşü olan ve bilgisayar bilimlerinin bir bölümü olarak temsil edilen bir türde, insan gibi görüntülerden "okuma" yapabildiğini hayal edin. Burada bilgisayarlara bir görüntüdeki farklı nesneleri tanımalarını ve ayırt etmelerini öğretebiliriz.

Bu eğitimde, basitliği ve çok yönlülüğü ile bilinen bir programlama dili olan Python kullanarak kendi OCR sisteminizi oluşturma sürecinde size rehberlik edeceğiz. Tesseract, IronOCR ve OpenCV gibi kütüphanelerin yardımıyla, kısa sürede belge görüntülerinden metin çıkartmanın, manipüle etmenin ve çalışmanın potansiyelini açığa çıkarabileceksiniz.

OCR Motorunun Gereksinimleri (Optik Karakter Tanıma)

OCR sistemimizi oluşturmaya derinlemesine girmeden önce ihtiyaçınız olan birkaç şey var:

  1. Python: Bilgisayarınıza Python'un kurulu olduğundan emin olun. Resmi Python web sitesinden indirebilirsiniz.
  2. Tesseract OCR'yi Kurun: Tesseract OCR, Google tarafından geliştirilen açık kaynaklı bir OCR motorudur. Projemizde kullanacağımız güçlü bir araçtır. Tesseract kütüphanesini GitHub'dan indirebilir ve Tesseract OCR kurulum süreci hakkında bilgi alabilirsiniz.
  3. Python Kutuphaneleri: Bu proje icin iki onemli Python kutuphanesi kullanacagiz: pytesseract ve opencv-python kutuphanesi. Bunları komut satırı istemcinizde veya terminalinizde aşağıdaki komutu kullanarak yükleyebilirsiniz:

    pip install pytesseract opencv-python
    pip install pytesseract opencv-python
    SHELL

Python ile bir OCR nasıl insa edilir: Sekil 1

OCR Sistemi Nasıl Kurulur

Python OCR Kütüphaneleri ve basit bir Python betiği yardımıyla Python kodu kullanarak kolayca OCR oluşturabilirsiniz.

Adım 1: Kütüphaneleri İçe Aktarın

Her şeyden önce, gerekli kütüphaneleri içe aktarmanız gerekecek:

import cv2  # OpenCV library for computer vision
import pytesseract  # Tesseract library for OCR
import cv2  # OpenCV library for computer vision
import pytesseract  # Tesseract library for OCR
PYTHON

Adım 2: Bir Görüntüyü Okuyun ve İşleyin

OCR doğruluğunu artırmak için görüntüyü OpenCV kullanarak yükleyin ve ön işlemini yapın:

# Load the image using OpenCV
image = cv2.imread('sample_image.png') 

# Convert the image to grayscale
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) 

# Apply thresholding or other preprocessing techniques if needed
# This step helps in enhancing the quality for better OCR results
# Load the image using OpenCV
image = cv2.imread('sample_image.png') 

# Convert the image to grayscale
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) 

# Apply thresholding or other preprocessing techniques if needed
# This step helps in enhancing the quality for better OCR results
PYTHON

Adım 3: OCR için Tesseract'ı Kullanın

Şimdi işlenmiş görüntüde OCR yapmak için Tesseract OCR motorunu kullanma zamanı:

# Set the path to the Tesseract executable
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files (x86)\Tesseract-OCR\tesseract.exe'

# Use pytesseract to perform OCR on the grayscale image
text = pytesseract.image_to_string(gray_image)
# Set the path to the Tesseract executable
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files (x86)\Tesseract-OCR\tesseract.exe'

# Use pytesseract to perform OCR on the grayscale image
text = pytesseract.image_to_string(gray_image)
PYTHON

Adım 4: Sonuçları Göster

Orijinal görüntüyü ve çıkarılan metni görselleştirmek istiyorsanız OpenCV kullanarak onları gösterebilirsiniz:

# Display the original image using OpenCV
cv2.imshow('Original Image', image) 
cv2.waitKey(0) 

# Print the extracted text to the console
print("Extracted Text:", text) 

cv2.destroyAllWindows()  # Close the OpenCV window
# Display the original image using OpenCV
cv2.imshow('Original Image', image) 
cv2.waitKey(0) 

# Print the extracted text to the console
print("Extracted Text:", text) 

cv2.destroyAllWindows()  # Close the OpenCV window
PYTHON

Orijinal Görüntü

Python ile bir OCR nasıl insa edilir: Sekil 2

Çıkarılan Metin

Python ile bir OCR nasıl insa edilir: Sekil 3

Görüldüğü gibi, sonuç görüntünün kalitesine ve karmaşıklığına bağlı olarak değişebilir ve bazı durumlarda, karmaşık yapılar içeren (tablolar gibi) görüntüler için ek eğitim (makine öğrenme eğitimi gibi) gerekebilir.

IronOCR

Veri dolu bir dünyada, basılı metni makine tarafından okunabilir içeriğe zahmetsizce dönüştürme yeteneği dönüşümcü bir beceridir.

IronOCR ile tanışın – geliştiricilerin uygulamalarına güçlü Optik Karakter Tanıma (OCR) yeteneklerini kolayca entegre etmelerine olanak tanıyan son teknoloji bir teknoloji.

İster taranmış belgelerden veri çıkarın, ister veri girişi otomasyonunu gerçekleştirin, ister erişilebilirliği artırın, IronOCR, geleneksel metin tanımanın sınırlarını aşan kapsamlı bir çözüm sunar.

Bu keşifte, IronOCR'un çok yönlü özelliklerini ortaya çıkararak ve fiziksel ve dijital dünyalar arasındaki boşluğu kapatma potansiyelini öne çıkararak derinlemesine inceliyoruz.

IronOCR'nin Kurulumu

Aşağıdaki komutu çalıştırarak NuGet Paket Yöneticisi Konsolu'nu kullanarak IronOCR'u kolayca yükleyebilirsiniz.

Install-Package IronOcr

IronOCR, resmi NuGet Web Sitesi'nden de indirilebilir.

IronOCR kullanarak Görüntüden Metin Çıkarma

Bu bölümde, IronOCR kullanarak görüntülerden metinleri nasıl kolayca çıkarabileceğinizi göreceğiz. Aşağıda, görüntüden metin çıkaran kaynak kodu bulunmaktadır.

using IronOcr;
using System;

var ocr = new IronTesseract();

using (var input = new OcrInput())
{
    input.AddImage("r3.png");
    OcrResult result = ocr.Read(input);
    string text = result.Text;
    Console.WriteLine(result.Text);
}
using IronOcr;
using System;

var ocr = new IronTesseract();

using (var input = new OcrInput())
{
    input.AddImage("r3.png");
    OcrResult result = ocr.Read(input);
    string text = result.Text;
    Console.WriteLine(result.Text);
}
Imports IronOcr
Imports System

Private ocr = New IronTesseract()

Using input = New OcrInput()
	input.AddImage("r3.png")
	Dim result As OcrResult = ocr.Read(input)
	Dim text As String = result.Text
	Console.WriteLine(result.Text)
End Using
$vbLabelText   $csharpLabel

Çıktı

Python ile bir OCR nasıl insa edilir: Sekil 4

Sonuç

Bu öğreticide, Python'da Optik Karakter Tanıma (OCR) sistemi inşa etme sürecini inceleyerek görüntülerden metin çıkartma kapasitesini olağanüstü bir kolaylıkla ortaya koyduk.

Tesseract ve OpenCV gibi kütüphanelerden faydalanarak, resimlerin yüklenmesi ve ön işlenmesinden Tesseract OCR motorunu metin çıkartmak için kullanmaya kadar olan temel adımları gözden geçirdik.

IronOCR gibi ileri çözümlerin ele almaya çalıştığı doğruluk sınırlamaları gibi potansiyel zorluklara da değindik.

Kendi başınıza yapabileceğiniz bir yol seçseniz de veya karmaşık araçları benimseme yolunu seçseniz de, OCR dünyası resimleri işlemeye uygun metne dönüştürme, veri girişini kolaylaştırma ve erişilebilirliği artırma vaadi ile çağrıda bulunuyor. Bu yeni kazanılmış bilgiyle, görsel ve dijital alemleri sorunsuz bir şekilde birleştiren bir yolculuğa çıkmaya hazırsınız.

IronOCR ile başlamanın yollarını görmek için aşağıdaki bağlantıyı ziyaret edin. Görüntülerden metin çıkarmayın tüm öğretisi için buraya gidin.

Bugün IronOCR'u ücretsiz denemek istiyorsanız, IronOCR'un ticari bir ortamda, tüm kullanım alanlarını ve potansiyelini filigran olmadan keşfetmenizi sağlayan deneme sürümünden emin olun. 15 gün sonra kullanmaya devam etmek için basitçe bir lisans satın alın.

Kannaopat Udonpant
Yazılım Mühendisi
Yazılım Mühendisi olmadan önce, Kannapat Japonya'daki Hokkaido Üniversitesi'nden Çevresel Kaynaklar alanında doktora yaptı. Derecesini tamamlarken, Biyoprodüksiyon Mühendisliği Bölümü'nün bir parçası olan Taşıt Robotik Laboratuvarı'na da üye oldu. 2022'de, Iron Software mühendislik ekibine katılmak iç...
Daha Fazlasını Oku

Iron Destek Ekibi

Haftanın 5 günü, 24 saat çevrimiçiyiz.
Sohbet
E-posta
Beni Ara