Gelişmiş Okuma İçin OCR Konfigürasyonu

This article was translated from English: Does it need improvement?
Translated
View the article in English

IronOCR, standard OCR'nin ötesine geçen ReadPassport, ReadLicensePlate ve ReadPhoto gibi ileri düzey tarama okuma yöntemleri sağlar. Bu yöntemler, IronOcr.Extensions.AdvancedScan paketi tarafından desteklenmektedir. Bu yöntemlerin metin işlemesini hassaslaştırmak için, IronOCR geliştiricilere karakter listeleme, arka listeleme, barkod tespiti, veri tablosu okuama ve daha fazlası üzerinde tam kontrol sağlayan TesseractConfiguration sınıfını açar.

Bu makale, gerçek dunya senaryolarında OCR'yi yapılandırma icin ileri düzey okuma ve uygulama örneklere yönelik TesseractConfiguration özelliklerini kapsar.

Hızlı Başlangıç: OCR Çıktısını Bir Karakter Beyaz Listesiyle Sınırlayın

Read cagrisi yapmadan once TesseractConfiguration uzerinde WhiteListCharacters ayarlayın. Beyaz listede olmayan herhangi bir karakter sonuçtan sessizce çıkarılır, böylece son işlem olmadan gürültü ortadan kaldırılır.

  1. NuGet Paket Yöneticisi ile https://www.nuget.org/packages/IronOcr yükleyin

    PM > Install-Package IronOcr
  2. Bu kod parçasını kopyalayıp çalıştırın.

    var result = new IronTesseract() { Configuration = new TesseractConfiguration { WhiteListCharacters = "ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789- " } }.Read(new OcrInput("image.png")); Console.WriteLine(result.Text);
  3. Canlı ortamınızda test etmek için dağıtın

    Bugün projenizde IronOCR kullanmaya başlayın ücretsiz deneme ile

    arrow pointer


TesseractConfiguration Özellikleri

TesseractConfiguration sınıfı, OCR davranışını özelleştirmek için aşağıdaki özellikleri sağlar. Bunlar IronTesseract.Configuration aracılığıyla ayarlanır.

Özellik Tür Açıklama
WhiteListCharacters string Bu dizede bulunan karakterler yalnızca OCR çıktısında tanınacaktır. Diğer tüm karakterler hariç tutulur.
BlackListCharacters string Bu dizedeki karakterler etkin bir şekilde göz ardı edilir ve OCR çıktısından çıkarılır.
ReadBarCodes bool OCR işlemi sırasında belge içinde barkod algılamayı etkinleştirir veya devre dışı bırakır.
ReadDataTables bool Tesseract kullanarak belge içinde tablo yapısı algılamayı etkinleştirir veya devre dışı bırakır.
PageSegmentationMode TesseractPageSegmentationMode Tesseract'in girdi görüntüsünü nasıl bölümlendirdiğini belirler. Seçenekler arasında AutoOsd, Auto, SingleBlock, SingleLine, SingleWord ve daha fazlası bulunmaktadır.
RenderSearchablePdf bool Etkinleştirildiğinde, OCR çıktısı görünmez bir metin katmanı ile aranabilir bir PDF olarak kaydedilebilir.
RenderHocr bool Etkinleştirildiğinde, OCR çıktısı daha fazla işleme veya dışa aktarma için hOCR verilerini içerir.
TesseractVariables Dictionary İnce ayar kontrolü için düşük seviyeli Tesseract yapılandırma değişkenlerine doğrudan erişim sağlar.

TesseractVariables sözlüğü daha da ileriye giderek yüksek seviyeli özelliklerin yetersiz kaldığı durumlar için yuzlerce alt düzey Tesseract motor parametresini açığa çıkarır.

Aşağıdaki örnekler, karakter beyaz listesi ile başlayarak her bir özellik grubunu göstermektedir.

Plaka İçin Bir Karakter Beyaz Listesi Kurulumu

WhiteListCharacters icin yaygin bir kullanim tizigi OCR çıktılarını sadece plakada olası karakterlerle, büyük harf, rakam, tire ve boşluklarla sınırlamaktır. Bu, motorun beklenen karakter setinin dışındaki her şeyi göz ardı etmesini söyleyerek gürültüyü ortadan kaldırır ve doğruluğu artırır.

Girdi

Aşağıdaki araç kayıt belgesi, büyük harfli metin, küçük harfli metin, özel semboller (@, $, #, |, *) ve noktalamaların bir karışımını içerir.

OCR beyaz liste gösterimi için karışık karakterli araç kayıt kaydı

BlackListCharacters, `, and * gibi bilinen gürültü sembollerini aktif olarak hariç tutarak beyaz listeyi tamamlar.

:path=/static-assets/ocr/content-code-examples/how-to/ocr-configurations-for-advanced-reading.cs
using IronOcr;

// Initialize the Tesseract OCR engine
IronTesseract ocr = new IronTesseract();

ocr.Configuration = new TesseractConfiguration
{
    // Whitelist only characters that appear on license plates
    WhiteListCharacters = "ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789- ",

    // Blacklist common noise characters
    BlackListCharacters = "`~@#$%&*",
};

var ocrInput = new OcrInput();
// Load the input image
ocrInput.LoadImage("advanced-input.png");
// Perform OCR on the input image with ReadPhoto method
var results = ocr.ReadPhoto(ocrInput);

// Print the filtered text result to the console
Console.WriteLine(results.Text);
Imports IronOcr

' Initialize the Tesseract OCR engine
Dim ocr As New IronTesseract()

ocr.Configuration = New TesseractConfiguration With {
    ' Whitelist only characters that appear on license plates
    .WhiteListCharacters = "ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789- ",
    
    ' Blacklist common noise characters
    .BlackListCharacters = "`~@#$%&*"
}

Dim ocrInput As New OcrInput()
' Load the input image
ocrInput.LoadImage("advanced-input.png")
' Perform OCR on the input image with ReadPhoto method
Dim results = ocr.ReadPhoto(ocrInput)

' Print the filtered text result to the console
Console.WriteLine(results.Text)
$vbLabelText   $csharpLabel

Çıktı

OCR çıkışı sadece beyaz listeye alınmış plaka karakterlerini gösterir

Beyaz liste filtrelemesi sonuçlarda açıkça görülmektedir:

  • "Plaka: ABC-1234" "P ABC-1234" olur. Küçük harfli "late:" kelimesi çıkarılırken, plaka numarası tam olarak korunur.
  • "VIN: 1HGBH41JXMN109186" "VIN 1HGBH41JXMN109186" olur. İki nokta üst üste çıkarılır, ancak büyük harfli VIN ve tam numara korunur.
  • "Sahip: john.doe@email.com" "O" olur. Tamamen küçük harfli e-posta ve noktalama kaldırılır.
  • "Bölge: CA-90210 |Bölge #5" "R CA-90210 Z 5"** olur. Boru (|) and hash (#) kaldırılırken, büyük harfler ve sayılar korunur.
  • "Ücret: $125.00 + vergi*" "F 12500" olur. Dolar işareti, ondalık nokta, artı işareti ve küçük harfli "vergi" tamamen kaldırılır.
  • "Ref: ~record_v2^final" "R 2" olur. Tilde (~), alt tire, caret (^) ve tüm küçük harfler kaldırılır.

Ayni WhiteListCharacters ve BlackListCharacters yaklaşımı, sadece plaka değil, her tür belge için çalışır. Bir sonraki bölüm, bar kodları ve tablo yapısını aynı geçişte tespit etmeyi nasıl genişleteceğinizi gösterir.

Barkod ve Veri Tablosu Okuma Yapılandırması

IronOCR, belgelerde metinlerin yanı sıra barkodlar ve yapılandırılmış tabloları da tespit edebilir. Bu özellikler TesseractConfiguration aracılığıyla kontrol edilir:

IronTesseract ocr = new IronTesseract();

ocr.Configuration = new TesseractConfiguration
{
    // Enable barcode detection within documents
    ReadBarCodes = true,

    // Enable table structure detection
    ReadDataTables = true,
};
IronTesseract ocr = new IronTesseract();

ocr.Configuration = new TesseractConfiguration
{
    // Enable barcode detection within documents
    ReadBarCodes = true,

    // Enable table structure detection
    ReadDataTables = true,
};
Dim ocr As New IronTesseract()

ocr.Configuration = New TesseractConfiguration With {
    .ReadBarCodes = True,
    .ReadDataTables = True
}
$vbLabelText   $csharpLabel
  • ReadBarCodes: true ayarlandığında, IronOCR metine ek olarak belgede barkodları tarar. Barkodların beklenmediği durumlarda barkod algılamayı atlayarak @false ayarlayın ve işlemi hızlandırın.
  • ReadDataTables: true ayarlandığında, Tesseract belgede tablo yapılarını tespit etmeye ve korumaya calışır. Bu, faturalar, raporlar ve diğer tabular belgeler için kullanışlıdır.

Bu seçenekle WhiteListCharacters ve BlackListCharacters ile birlikte kullanıldığında karmaşık belgelerden neyin çıkarılacağı konusunda hassas kontrol sağlar.

Filtreleme ve algılama çıkarılacak olanı kontrol ederken, düzen yorumlaması ayrı bir endişe kaynağıdır. Bir sonraki bölüm, belge türü için doğru PageSegmentationMode seçmenin nasıl yapıldığını ele alır.

Sayfa Segmentasyon Modunu Kontrol Etme

PageSegmentationMode Tesseract'a tanima öncesi girdi görüntüsünü nasıl segmentleyeceğini söyler. Verilen bir düzen için yanlış modu seçmek, motorun metni yanlış okumasına veya tamamen atlamasına neden olur.

Mod Kullanim Durumu
AutoOsd Yönlendirme ve script algılamalı otomatik düzen analizi
Auto OSD olmadan otomatik düzen analizi (varsayılan)
SingleColumn Görüntünün tek bir metin sütunu olduğu varsayılır
SingleBlock Görüntünün tek bir uniform metin bloğu olduğu varsayılır
SingleLine Görüntünün tek bir metin satırı olduğu varsayılır
SparseText Herhangi bir sırada mümkün olduğunca fazla metin bulur

Tek satır içeren bir etiket veya pankart icin, SingleLine çok bloklu analizi ortadan kaldırır ve hem hızı hem doğruluğu artırır.

Girdi

single-line-label.png tam olarak bir satır kalın Courier metni içeren dar bir kargo etiketidir: SHIPPING LABEL: TRK-2024-XR9-001.

OCR Tek Satır segmentasyon modu için tek satırlı nakliye etiketi
IronTesseract ocr = new IronTesseract();

ocr.Configuration = new TesseractConfiguration
{
    PageSegmentationMode = TesseractPageSegmentationMode.SingleLine,
};

using OcrInput input = new OcrInput();
input.LoadImage("single-line-label.png");

OcrResult result = ocr.Read(input);
Console.WriteLine(result.Text);
IronTesseract ocr = new IronTesseract();

ocr.Configuration = new TesseractConfiguration
{
    PageSegmentationMode = TesseractPageSegmentationMode.SingleLine,
};

using OcrInput input = new OcrInput();
input.LoadImage("single-line-label.png");

OcrResult result = ocr.Read(input);
Console.WriteLine(result.Text);
Imports IronOcr

Dim ocr As New IronTesseract()

ocr.Configuration = New TesseractConfiguration With {
    .PageSegmentationMode = TesseractPageSegmentationMode.SingleLine
}

Using input As New OcrInput()
    input.LoadImage("single-line-label.png")

    Dim result As OcrResult = ocr.Read(input)
    Console.WriteLine(result.Text)
End Using
$vbLabelText   $csharpLabel

Düzensiz metin yerleşimine sahip taranmış bir sayfa icin, SparseText Auto daha fazla içerik kurtarır.

Girdi

receipt-scan.png köşe pazarı termal makbuzu, dört satır öğe (kahve, muffin, meyve suyu, granola çubuğu), kesikli ayırıcı, ara toplam, vergi ve toplam içeren bir reçetedir. Bu tür bir düzen, sabit blok segmentasyonu farklı yatay pozisyonlardaki girişleri kaçırır.

OCR SparseText segmentasyon modu için termal fiş
IronTesseract ocr = new IronTesseract();

ocr.Configuration = new TesseractConfiguration
{
    PageSegmentationMode = TesseractPageSegmentationMode.SparseText,
};

using OcrInput input = new OcrInput();
input.LoadImage("receipt-scan.png");

OcrResult result = ocr.Read(input);
Console.WriteLine(result.Text);
IronTesseract ocr = new IronTesseract();

ocr.Configuration = new TesseractConfiguration
{
    PageSegmentationMode = TesseractPageSegmentationMode.SparseText,
};

using OcrInput input = new OcrInput();
input.LoadImage("receipt-scan.png");

OcrResult result = ocr.Read(input);
Console.WriteLine(result.Text);
Imports IronTesseract

Dim ocr As New IronTesseract()

ocr.Configuration = New TesseractConfiguration With {
    .PageSegmentationMode = TesseractPageSegmentationMode.SparseText
}

Using input As New OcrInput()
    input.LoadImage("receipt-scan.png")

    Dim result As OcrResult = ocr.Read(input)
    Console.WriteLine(result.Text)
End Using
$vbLabelText   $csharpLabel

Belge türüne göre ayarlanmış düzen segmentasyonu ile, bir sonraki adım, çıkış formatını aşağı akış işlemine kontrol etmektir.

Aranabilir PDF'ler ve hOCR Çıkışları Oluşturmak

RenderSearchablePdf ve RenderHocr, IronOCR'un düz metin sonucunun yaninda ürettiği çıktıyı formatlarını kontrol eder.

RenderSearchablePdf, kullanıcların taranmış görüntü görünür durumdayken metni arama ve kopyalama sağlar, orijinal göruntunun üzerine görünmez metin katmanı yerleştirir ve bir PDF üretir. Bu, belge arşivleme iş süreçleri için standart çıkış formatıdır.

Girdi

scanned-document.pdf, IronOCR Solutions Ltd. tarafından gelen tek sayfali bir iş mektubudur. (15 Mart 2024 tarihli, DOC-2024-OCR-0315 referanslı). Sonuç searchable-output.pdf olarak kaydedilir.

IronTesseract ocr = new IronTesseract();

ocr.Configuration = new TesseractConfiguration
{
    RenderSearchablePdf = true,
};

using OcrInput input = new OcrInput();
input.LoadPdf("scanned-document.pdf");

OcrResult result = ocr.Read(input);
result.SaveAsSearchablePdf("searchable-output.pdf");
IronTesseract ocr = new IronTesseract();

ocr.Configuration = new TesseractConfiguration
{
    RenderSearchablePdf = true,
};

using OcrInput input = new OcrInput();
input.LoadPdf("scanned-document.pdf");

OcrResult result = ocr.Read(input);
result.SaveAsSearchablePdf("searchable-output.pdf");
Imports IronOcr

Dim ocr As New IronTesseract()

ocr.Configuration = New TesseractConfiguration With {
    .RenderSearchablePdf = True
}

Using input As New OcrInput()
    input.LoadPdf("scanned-document.pdf")

    Dim result As OcrResult = ocr.Read(input)
    result.SaveAsSearchablePdf("searchable-output.pdf")
End Using
$vbLabelText   $csharpLabel

Çıktı

Çıktı, girilenle aynı görünen ancak gizli bir metin katmanı içeren bir PDF'dir. searchable-output.pdf acın ve gömülü metnin aranabilir ve kopyalanabilir olduğunu doğrulamak için Ctrl+F kullanın.

RenderHocr, metin iceriğini her kelimenin bounding box koordinatlari ile birlikte kodlayan bir hOCR belgesi, HTML dosyası oluşturur. Bu, örneğin, belgenin düzen analizi veya belgenin sansürleme motorları için kesin kelime konumlandırmayı gerektiğinde kullanışlıdır.

Girdi

document-page.png başlığı "Çeyreklik Özet Q1 2024" ve gelir, işletme maliyetleri ve büyüme faktörlerini kapsayan iki paragraf finansal veri içeren bir belge sayfasıdır. Sonuç output.html olarak kaydedilir.

hOCR sınırlayıcı kutu çıktısı için belge sayfa girişi
IronTesseract ocr = new IronTesseract();

ocr.Configuration = new TesseractConfiguration
{
    RenderHocr = true,
};

using OcrInput input = new OcrInput();
input.LoadImage("document-page.png");

OcrResult result = ocr.Read(input);
result.SaveAsHocrFile("output.html");
IronTesseract ocr = new IronTesseract();

ocr.Configuration = new TesseractConfiguration
{
    RenderHocr = true,
};

using OcrInput input = new OcrInput();
input.LoadImage("document-page.png");

OcrResult result = ocr.Read(input);
result.SaveAsHocrFile("output.html");
Imports IronOcr

Dim ocr As New IronTesseract()

ocr.Configuration = New TesseractConfiguration With {
    .RenderHocr = True
}

Using input As New OcrInput()
    input.LoadImage("document-page.png")

    Dim result As OcrResult = ocr.Read(input)
    result.SaveAsHocrFile("output.html")
End Using
$vbLabelText   $csharpLabel

Çıktı

output.html her tanınmış kelimeyi bounding box koordinatları ile kodlar. hOCR yapısını incelemek için dosyayı bir tarayıcıda açın veya düzen analizi veya sansür için alt akış aracı olarak geçirin.

Üç çıktı formatını (düz metin, aranabilir PDF ve hOCR) tek bir okuma çağrısından almak gerekiyorsa her iki bayrak da aynı anda etkinleştirilebilir.

Bu çıkış bayrakları, okunan dilin bağımsız olarak çalışır, Latin olmayan yazı tipleri dahil. Bir sonraki bölüm, Japonca metnine karakter filtrelemeyi nasıl uygulayacağınızı gösterir.

Uluslararası Belgeler için Unicode Karakter Filtreleme

Çince, Japonca, veya Korece uluslararası belgeler icin, WhiteListCharacters ve BlackListCharacters özellikleri Unicode karakterleri ile çalışır. Bu, örneğin Japonca için sadece Hiragana ve Katakana gibi belirli scriptlere çıkışı sınırlamanıza olanak tanır.

Lütfen dikkate alin İlgili dil paketinin yüklendiğinden emin olun (örneğin, IronOcr.Languages.Japanese)
ilerlemeden önce. )}]

Girdi

Doküman, başlık (テスト), Hiragana ve Katakana ile sesli işaret varyantlarını (プ, で) karıştıran bir Japonca cümle, kara listeye alınmış parazit sembolleri (★, ■) ve Kanji'yi (価格) içeren bir fiyat satırı ile kara listeye alınmış sembolleri (§), daha fazla Kanji (購入), ek sesli işaret varyantlarını (プ, デ) ve temel Katakana (メモ, ール) içeren bir not satırı içerir. Beyaz liste, sadece temel Hiragana, temel Katakana, rakamlar ve yaygın Japon noktalamasını geçirir; üç parazit sembolü açıkça kara listeye alınmıştır.

OCR ileri yapılandırma Japon girişi

Hiragana ve Katakana için Unicode karakter aralıkları, WhiteListCharacters içinde dize literalleri olarak iletilir, gürültü sembolleri BlackListCharacters içinde listelenir.

Uyarı Konsol, Unicode karakterlerini görüntülemeyi desteklemeyebilir. Çıktıyı bir .txt dosyasına yönlendirmek, bu tür karakterlerle çalışırken sonuçları doğrulamanın güvenilir bir yoludur.

:path=/static-assets/ocr/content-code-examples/how-to/ocr-configurations-for-advanced-reading-jp.cs
using IronOcr;
using System.IO;

IronTesseract ocr = new IronTesseract();

ocr.Configuration = new TesseractConfiguration
{
    // Whitelist only Hiragana, Katakana, numbers, and common Japanese punctuation
    WhiteListCharacters = "あいうえおかきくけこさしすせそたちつてとなにぬねのはひふへほまみむめもやゆよらりるれろわをん" +
                            "アイウエオカキクケコサシスセソタチツテトナニヌネノハヒフヘホマミムメモヤユヨラリルレロワヲン" +
                            "0123456789、。?!()¥ー",

    // Blacklist common noise/symbols you want to ignore
    BlackListCharacters = "★■§",
};

var ocrInput = new OcrInput();

// Load Japanese input image
ocrInput.LoadImage("jp.png");

// Perform OCR on the input image with ReadPhoto method
var results = ocr.ReadPhoto(ocrInput);

// Write the text result directly to a file named "output.txt"
File.WriteAllText("output.txt", results.Text);

// You can add this line to confirm the file was saved:
Console.WriteLine("OCR results saved to output.txt");
Imports IronOcr
Imports System.IO

Dim ocr As New IronTesseract()

ocr.Configuration = New TesseractConfiguration With {
    .WhiteListCharacters = "あいうえおかきくけこさしすせそたちつてとなにぬねのはひふへほまみむめもやゆよらりるれろわをん" &
                           "アイウエオカキクケコサシスセソタチツテトナニヌネノハヒフヘホマミムメモヤユヨラリルレロワヲン" &
                           "0123456789、。?!()¥ー",
    .BlackListCharacters = "★■§"
}

Dim ocrInput As New OcrInput()

' Load Japanese input image
ocrInput.LoadImage("jp.png")

' Perform OCR on the input image with ReadPhoto method
Dim results = ocr.ReadPhoto(ocrInput)

' Write the text result directly to a file named "output.txt"
File.WriteAllText("output.txt", results.Text)

' You can add this line to confirm the file was saved:
Console.WriteLine("OCR results saved to output.txt")
$vbLabelText   $csharpLabel

Çıktı

OCR ileri yapılandırma Japon çıkışı

Filtrelenmiş bütün çıktı, bir metin dosyası olarak mevcuttur: jp-output.txt.

Beyaz liste yalnızca temel Hiragana ve Katakana karakterlerini içerdiğinden, プ (pu) ve デ (de) gibi türetilmiş sesli işaret varyantları çıkarılır. 価格 (fiyat) ve 購入 (satın alma) gibi Kanji karakterleri, beyaz liste karakter seti dışında kaldıkları için de dahil edilmez. , ve § gibi kara listeye alınmış semboller, beyaz listeye bakılmaksızın aktif olarak kaldırılır.

Sırada Ne Yapmalıyım?

İronOCR'u ileri okuma senaryoları için nasıl yapılandıracağınızı anladığınıza göre, şunları keşfedin:

Üretim kullanımı için, filigranları kaldırmak ve tam işlevselliğe erişmek amacıyla bir lisans almayı unutmayın.

Sıkça Sorulan Sorular

IronOCR'de TesseractConfiguration nedir?

IronOCR'de TesseractConfiguration, karakter beyaz listeleri, barkod okuma ve çok dilli destek gibi gelişmiş okuma yeteneklerini etkinleştirerek OCR ayarlarını özelleştirmeyi sağlar.

IronOCR'de bir karakter beyaz listesini nasıl kurabilirim?

IronOCR'de, OCR motorunun tanıyacağı karakterleri belirlemenize olanak tanıyan TesseractConfiguration aracılığıyla bir karakter beyaz listesi kurabilirsiniz, bu trafik plakalarını okuma gibi görevler için kullanışlıdır.

IronOCR barkodlar ve veri tablolarını okuyabilir mi?

Evet, IronOCR, kesin OCR veri çıkarma işlemleri için TesseractConfiguration özelliklerinde belirli ayarları yaparak barkodları ve veri tablolarını okumak üzere yapılandırılabilir.

IronOCR, Çince, Japonca ve Korece gibi uluslararası dilleri destekliyor mu?

IronOCR, çok dilli TesseractConfiguration seçenekleri aracılığıyla Çince, Japonca ve Korece dahil uluslararası dilleri destekler.

IronOCR'de gelişmiş OCR yapılandırmalarını kullanmanın faydaları nelerdir?

IronOCR'de gelişmiş OCR yapılandırmalarını kullanmak, dil özelleştirilmiş metin tanıma ve yapılandırılmış veri çıkarma gibi özel görevleri destekleyerek daha doğru ve etkili metin tanıma sağlar.

Belirli OCR görevleri için IronOCR'yi optimize etmek mümkün mü?

Evet, IronOCR, karakter beyaz listeleri gibi ayarları yapılandırarak ve barkod veya tablo tanımayı etkinleştirerek hedeflenen uygulamalar için performansı artırarak belirli OCR görevleri için optimize edilebilir.

IronOCR'de çok dilli desteği nasıl etkinleştiririm?

IronOCR'de çok dilli desteği etkinleştirmek için, OCR motorunun birden fazla dilde metni tanımasına izin vererek TesseractConfiguration'da dil ayarlarını ayarlayabilirsiniz.

Karakter beyaz listeleri nelerdir ve IronOCR'de nasıl kullanılırlar?

IronOCR'de karakter beyaz listeleri, OCR motorunun tanıması için yapılandırılan belirli karakterler dizisidir ve rakamları veya belirli metin desenlerini okumak gibi odaklanmış görevler idealidir.

IronOCR, yapılandırılmış veri biçimlerini okumak için kullanılabilir mi?

Evet, IronOCR, çeşitli veri çıkarma ihtiyaçları için çok yönlü OCR yetenekleri sağlayarak barkodlar ve tablolar gibi yapılandırılmış veri biçimlerini okumak ve işlemek üzere yapılandırılabilir.

Gelişmiş metin tanıma için IronOCR'de mevcut yapılandırmalar nelerdir?

IronOCR, belirli gereksinimlere göre gelişmiş metin tanıma yeteneklerini artırmak için karakter beyaz listeleri, çok dilli destek ve barkod tanıma gibi yapılandırmalar sunar.

Curtis Chau
Teknik Yazar

Curtis Chau, Bilgisayar Bilimleri alanında lisans derecesine sahiptir (Carleton Üniversitesi) ve Node.js, TypeScript, JavaScript ve React konularında uzmanlaşmış ön uç geliştirme üzerine uzmanlaşmıştır. Kullanıcı dostu ve estetik açıdan hoş arayüzler tasarlamaya tutkuyla bağlı olan Curtis, modern çerç...

Daha Fazlasını Oku
Başlamaya Hazır mısınız?
Nuget İndirmeler 5,585,834 | Sürüm: 2026.4 just released
Still Scrolling Icon

Hala Kaydiriyor musunuz?

Hızlı bir kanit mi istiyorsunuz? PM > Install-Package IronOcr
örnekleri çalıştır resminizin aranabilir metne donuşünü izleyin.