Python ile OCR Nasıl Geliştirilir
Dünya, büyük miktarda metinsel bilgiyle dolu. Erişilebilirliği biraz artırılmış olsaydı son derece yararlı olabilecek bir dizi değerli içerik var.
İşte bu noktada Optik Karakter Tanıma (OCR) teknolojisi devreye giriyor. Bir bilgisayarın, yalnızca makine görüşü olan ve bilgisayar bilimlerinin bir bölümü olarak temsil edilen bir türde, insan gibi görüntülerden "okuma" yapabildiğini hayal edin. Burada bilgisayarlara bir görüntüdeki farklı nesneleri tanımalarını ve ayırt etmelerini öğretebiliriz.
Bu eğitimde, basitliği ve çok yönlülüğü ile bilinen bir programlama dili olan Python kullanarak kendi OCR sisteminizi oluşturma sürecinde size rehberlik edeceğiz. Tesseract, IronOCR ve OpenCV gibi kütüphanelerin yardımıyla, kısa sürede belge görüntülerinden metin çıkartmanın, manipüle etmenin ve çalışmanın potansiyelini açığa çıkarabileceksiniz.
OCR Motorunun Gereksinimleri (Optik Karakter Tanıma)
OCR sistemimizi oluşturmaya derinlemesine girmeden önce ihtiyaçınız olan birkaç şey var:
- Python: Bilgisayarınıza Python'un kurulu olduğundan emin olun. Resmi Python web sitesinden indirebilirsiniz.
- Tesseract OCR'yi Kurun: Tesseract OCR, Google tarafından geliştirilen açık kaynaklı bir OCR motorudur. Projemizde kullanacağımız güçlü bir araçtır. Tesseract kütüphanesini GitHub'dan indirebilir ve Tesseract OCR kurulum süreci hakkında bilgi alabilirsiniz.
-
Python Kutuphaneleri: Bu proje icin iki onemli Python kutuphanesi kullanacagiz:
pytesseractveopencv-pythonkutuphanesi. Bunları komut satırı istemcinizde veya terminalinizde aşağıdaki komutu kullanarak yükleyebilirsiniz:pip install pytesseract opencv-pythonpip install pytesseract opencv-pythonSHELL

OCR Sistemi Nasıl Kurulur
Python OCR Kütüphaneleri ve basit bir Python betiği yardımıyla Python kodu kullanarak kolayca OCR oluşturabilirsiniz.
Adım 1: Kütüphaneleri İçe Aktarın
Her şeyden önce, gerekli kütüphaneleri içe aktarmanız gerekecek:
import cv2 # OpenCV library for computer vision
import pytesseract # Tesseract library for OCR
import cv2 # OpenCV library for computer vision
import pytesseract # Tesseract library for OCR
Adım 2: Bir Görüntüyü Okuyun ve İşleyin
OCR doğruluğunu artırmak için görüntüyü OpenCV kullanarak yükleyin ve ön işlemini yapın:
# Load the image using OpenCV
image = cv2.imread('sample_image.png')
# Convert the image to grayscale
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
# Apply thresholding or other preprocessing techniques if needed
# This step helps in enhancing the quality for better OCR results
# Load the image using OpenCV
image = cv2.imread('sample_image.png')
# Convert the image to grayscale
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
# Apply thresholding or other preprocessing techniques if needed
# This step helps in enhancing the quality for better OCR results
Adım 3: OCR için Tesseract'ı Kullanın
Şimdi işlenmiş görüntüde OCR yapmak için Tesseract OCR motorunu kullanma zamanı:
# Set the path to the Tesseract executable
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files (x86)\Tesseract-OCR\tesseract.exe'
# Use pytesseract to perform OCR on the grayscale image
text = pytesseract.image_to_string(gray_image)
# Set the path to the Tesseract executable
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files (x86)\Tesseract-OCR\tesseract.exe'
# Use pytesseract to perform OCR on the grayscale image
text = pytesseract.image_to_string(gray_image)
Adım 4: Sonuçları Göster
Orijinal görüntüyü ve çıkarılan metni görselleştirmek istiyorsanız OpenCV kullanarak onları gösterebilirsiniz:
# Display the original image using OpenCV
cv2.imshow('Original Image', image)
cv2.waitKey(0)
# Print the extracted text to the console
print("Extracted Text:", text)
cv2.destroyAllWindows() # Close the OpenCV window
# Display the original image using OpenCV
cv2.imshow('Original Image', image)
cv2.waitKey(0)
# Print the extracted text to the console
print("Extracted Text:", text)
cv2.destroyAllWindows() # Close the OpenCV window
Orijinal Görüntü

Çıkarılan Metin

Görüldüğü gibi, sonuç görüntünün kalitesine ve karmaşıklığına bağlı olarak değişebilir ve bazı durumlarda, karmaşık yapılar içeren (tablolar gibi) görüntüler için ek eğitim (makine öğrenme eğitimi gibi) gerekebilir.
IronOCR
Veri dolu bir dünyada, basılı metni makine tarafından okunabilir içeriğe zahmetsizce dönüştürme yeteneği dönüşümcü bir beceridir.
IronOCR ile tanışın – geliştiricilerin uygulamalarına güçlü Optik Karakter Tanıma (OCR) yeteneklerini kolayca entegre etmelerine olanak tanıyan son teknoloji bir teknoloji.
İster taranmış belgelerden veri çıkarın, ister veri girişi otomasyonunu gerçekleştirin, ister erişilebilirliği artırın, IronOCR, geleneksel metin tanımanın sınırlarını aşan kapsamlı bir çözüm sunar.
Bu keşifte, IronOCR'un çok yönlü özelliklerini ortaya çıkararak ve fiziksel ve dijital dünyalar arasındaki boşluğu kapatma potansiyelini öne çıkararak derinlemesine inceliyoruz.
IronOCR'nin Kurulumu
Aşağıdaki komutu çalıştırarak NuGet Paket Yöneticisi Konsolu'nu kullanarak IronOCR'u kolayca yükleyebilirsiniz.
Install-Package IronOcr
IronOCR, resmi NuGet Web Sitesi'nden de indirilebilir.
IronOCR kullanarak Görüntüden Metin Çıkarma
Bu bölümde, IronOCR kullanarak görüntülerden metinleri nasıl kolayca çıkarabileceğinizi göreceğiz. Aşağıda, görüntüden metin çıkaran kaynak kodu bulunmaktadır.
using IronOcr;
using System;
var ocr = new IronTesseract();
using (var input = new OcrInput())
{
input.AddImage("r3.png");
OcrResult result = ocr.Read(input);
string text = result.Text;
Console.WriteLine(result.Text);
}
using IronOcr;
using System;
var ocr = new IronTesseract();
using (var input = new OcrInput())
{
input.AddImage("r3.png");
OcrResult result = ocr.Read(input);
string text = result.Text;
Console.WriteLine(result.Text);
}
Imports IronOcr
Imports System
Private ocr = New IronTesseract()
Using input = New OcrInput()
input.AddImage("r3.png")
Dim result As OcrResult = ocr.Read(input)
Dim text As String = result.Text
Console.WriteLine(result.Text)
End Using
Çıktı

Sonuç
Bu öğreticide, Python'da Optik Karakter Tanıma (OCR) sistemi inşa etme sürecini inceleyerek görüntülerden metin çıkartma kapasitesini olağanüstü bir kolaylıkla ortaya koyduk.
Tesseract ve OpenCV gibi kütüphanelerden faydalanarak, resimlerin yüklenmesi ve ön işlenmesinden Tesseract OCR motorunu metin çıkartmak için kullanmaya kadar olan temel adımları gözden geçirdik.
IronOCR gibi ileri çözümlerin ele almaya çalıştığı doğruluk sınırlamaları gibi potansiyel zorluklara da değindik.
Kendi başınıza yapabileceğiniz bir yol seçseniz de veya karmaşık araçları benimseme yolunu seçseniz de, OCR dünyası resimleri işlemeye uygun metne dönüştürme, veri girişini kolaylaştırma ve erişilebilirliği artırma vaadi ile çağrıda bulunuyor. Bu yeni kazanılmış bilgiyle, görsel ve dijital alemleri sorunsuz bir şekilde birleştiren bir yolculuğa çıkmaya hazırsınız.
IronOCR ile başlamanın yollarını görmek için aşağıdaki bağlantıyı ziyaret edin. Görüntülerden metin çıkarmayın tüm öğretisi için buraya gidin.
Bugün IronOCR'u ücretsiz denemek istiyorsanız, IronOCR'un ticari bir ortamda, tüm kullanım alanlarını ve potansiyelini filigran olmadan keşfetmenizi sağlayan deneme sürümünden emin olun. 15 gün sonra kullanmaya devam etmek için basitçe bir lisans satın alın.




