Üretimde su işareti olmadan test edin.
Nerede ihtiyaç duyarsanız çalışır.
Tam işlevselliğe sahip ürün için 30 gün alın.
Birkaç dakika içinde çalışır hale getirin.
Ürün denemeniz sırasında destek mühendis ekibimize tam erişim
using IronOcr;
string imageText = new IronTesseract().Read(@"images\image.png").Text;
Imports IronOcr
Private imageText As String = (New IronTesseract()).Read("images\image.png").Text
Install-Package IronOcr
IronOCR, hatalı taranmış görüntü ve PDF belgelerinden metni otomatik olarak tespit etme ve okuma yeteneği ile benzersizdir. IronTesseract sınıfı en basit API'yi sağlar.
C# OCR işlemlerinizin ince ayrintili kontrolunu ele gecirmek icin diğer kod örneklerini deneyin.
IronOCR her platformda, herhangi bir yerde bilinen en gelişmiş Tesseract derlemesini, artırılmış hız, doğruluk ve yerel DLL ve API ile sağlar.
.NET Framework, Standard, Core, Xamarin ve Mono için Tesseract 3, Tesseract 4 ve Tesseract 5 destekler.
IronTesseract sinifini örneklendirinRead metodunu kullaninText ozelligini eriserek OCR sonucunu alinusing IronOcr;
using System;
var ocrTesseract = new IronTesseract();
ocrTesseract.Language = OcrLanguage.Arabic;
using (var ocrInput = new OcrInput())
{
ocrInput.LoadImage(@"images\arabic.gif");
var ocrResult = ocrTesseract.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
}
// Example with a Custom Trained Font Being used:
var ocrTesseractCustomerLang = new IronTesseract();
ocrTesseractCustomerLang.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata");
ocrTesseractCustomerLang.AddSecondaryLanguage(OcrLanguage.EnglishBest);
using (var ocrInput = new OcrInput())
{
ocrInput.LoadPdf(@"images\mixed-lang.pdf");
var ocrResult = ocrTesseractCustomerLang.Read(ocrInput);
Console.WriteLine(ocrResult.Text);
}
Imports IronOcr
Imports System
Private ocrTesseract = New IronTesseract()
ocrTesseract.Language = OcrLanguage.Arabic
Using ocrInput As New OcrInput()
ocrInput.LoadImage("images\arabic.gif")
Dim ocrResult = ocrTesseract.Read(ocrInput)
Console.WriteLine(ocrResult.Text)
End Using
' Example with a Custom Trained Font Being used:
Dim ocrTesseractCustomerLang = New IronTesseract()
ocrTesseractCustomerLang.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata")
ocrTesseractCustomerLang.AddSecondaryLanguage(OcrLanguage.EnglishBest)
Using ocrInput As New OcrInput()
ocrInput.LoadPdf("images\mixed-lang.pdf")
Dim ocrResult = ocrTesseractCustomerLang.Read(ocrInput)
Console.WriteLine(ocrResult.Text)
End Using
Install-Package IronOcr
IronOCR, 125 uluslararasi dili destekler. Varsıyılan olarak yüklü gelen Ingilizce dışında, ek dil paketleri .NET projenize NuGet aracılığıyla eklenebilir veya Dil Sayfamızdan indirilebilir. Çoğu dil Hızlı, Standart (önerilir) ve En iyi kalite seçeneklerinde mevcuttur. En iyi kalite seçeneği daha doğru sonuçlar sunabilir, ancak işlem süresi açısından daha yavaş olacaktır.IronOCR Dil Destegi
using IronOcr;
using IronSoftware.Drawing;
// We can delve deep into OCR results as an object model of
// Pages, Barcodes, Paragraphs, Lines, Words and Characters
// This allows us to explore, export and draw OCR content using other APIs/
var ocrTesseract = new IronTesseract();
ocrTesseract.Configuration.ReadBarCodes = true;
using var ocrInput = new OcrInput();
var pages = new int[] { 1, 2 };
ocrInput.LoadImageFrames("example.tiff", pages);
OcrResult ocrResult = ocrTesseract.Read(ocrInput);
foreach (var page in ocrResult.Pages)
{
// Page object
int PageNumber = page.PageNumber;
string PageText = page.Text;
int PageWordCount = page.WordCount;
// null if we dont set Ocr.Configuration.ReadBarCodes = true;
OcrResult.Barcode[] Barcodes = page.Barcodes;
AnyBitmap PageImage = page.ToBitmap(ocrInput);
double PageWidth = page.Width;
double PageHeight = page.Height;
double PageRotation = page.Rotation; // angular correction in degrees from OcrInput.Deskew()
foreach (var paragraph in page.Paragraphs)
{
// Pages -> Paragraphs
int ParagraphNumber = paragraph.ParagraphNumber;
string ParagraphText = paragraph.Text;
AnyBitmap ParagraphImage = paragraph.ToBitmap(ocrInput);
int ParagraphX_location = paragraph.X;
int ParagraphY_location = paragraph.Y;
int ParagraphWidth = paragraph.Width;
int ParagraphHeight = paragraph.Height;
double ParagraphOcrAccuracy = paragraph.Confidence;
OcrResult.TextFlow paragrapthText_direction = paragraph.TextDirection;
foreach (var line in paragraph.Lines)
{
// Pages -> Paragraphs -> Lines
int LineNumber = line.LineNumber;
string LineText = line.Text;
AnyBitmap LineImage = line.ToBitmap(ocrInput);
int LineX_location = line.X;
int LineY_location = line.Y;
int LineWidth = line.Width;
int LineHeight = line.Height;
double LineOcrAccuracy = line.Confidence;
double LineSkew = line.BaselineAngle;
double LineOffset = line.BaselineOffset;
foreach (var word in line.Words)
{
// Pages -> Paragraphs -> Lines -> Words
int WordNumber = word.WordNumber;
string WordText = word.Text;
AnyBitmap WordImage = word.ToBitmap(ocrInput);
int WordX_location = word.X;
int WordY_location = word.Y;
int WordWidth = word.Width;
int WordHeight = word.Height;
double WordOcrAccuracy = word.Confidence;
foreach (var character in word.Characters)
{
// Pages -> Paragraphs -> Lines -> Words -> Characters
int CharacterNumber = character.CharacterNumber;
string CharacterText = character.Text;
AnyBitmap CharacterImage = character.ToBitmap(ocrInput);
int CharacterX_location = character.X;
int CharacterY_location = character.Y;
int CharacterWidth = character.Width;
int CharacterHeight = character.Height;
double CharacterOcrAccuracy = character.Confidence;
// Output alternative symbols choices and their probability.
// Very useful for spellchecking
OcrResult.Choice[] Choices = character.Choices;
}
}
}
}
}
Imports IronOcr
Imports IronSoftware.Drawing
' We can delve deep into OCR results as an object model of
' Pages, Barcodes, Paragraphs, Lines, Words and Characters
' This allows us to explore, export and draw OCR content using other APIs/
Private ocrTesseract = New IronTesseract()
ocrTesseract.Configuration.ReadBarCodes = True
Dim ocrInput As New OcrInput()
Dim pages = New Integer() { 1, 2 }
ocrInput.LoadImageFrames("example.tiff", pages)
Dim ocrResult As OcrResult = ocrTesseract.Read(ocrInput)
For Each page In ocrResult.Pages
' Page object
Dim PageNumber As Integer = page.PageNumber
Dim PageText As String = page.Text
Dim PageWordCount As Integer = page.WordCount
' null if we dont set Ocr.Configuration.ReadBarCodes = true;
Dim Barcodes() As OcrResult.Barcode = page.Barcodes
Dim PageImage As AnyBitmap = page.ToBitmap(ocrInput)
Dim PageWidth As Double = page.Width
Dim PageHeight As Double = page.Height
Dim PageRotation As Double = page.Rotation ' angular correction in degrees from OcrInput.Deskew()
For Each paragraph In page.Paragraphs
' Pages -> Paragraphs
Dim ParagraphNumber As Integer = paragraph.ParagraphNumber
Dim ParagraphText As String = paragraph.Text
Dim ParagraphImage As AnyBitmap = paragraph.ToBitmap(ocrInput)
Dim ParagraphX_location As Integer = paragraph.X
Dim ParagraphY_location As Integer = paragraph.Y
Dim ParagraphWidth As Integer = paragraph.Width
Dim ParagraphHeight As Integer = paragraph.Height
Dim ParagraphOcrAccuracy As Double = paragraph.Confidence
Dim paragrapthText_direction As OcrResult.TextFlow = paragraph.TextDirection
For Each line In paragraph.Lines
' Pages -> Paragraphs -> Lines
Dim LineNumber As Integer = line.LineNumber
Dim LineText As String = line.Text
Dim LineImage As AnyBitmap = line.ToBitmap(ocrInput)
Dim LineX_location As Integer = line.X
Dim LineY_location As Integer = line.Y
Dim LineWidth As Integer = line.Width
Dim LineHeight As Integer = line.Height
Dim LineOcrAccuracy As Double = line.Confidence
Dim LineSkew As Double = line.BaselineAngle
Dim LineOffset As Double = line.BaselineOffset
For Each word In line.Words
' Pages -> Paragraphs -> Lines -> Words
Dim WordNumber As Integer = word.WordNumber
Dim WordText As String = word.Text
Dim WordImage As AnyBitmap = word.ToBitmap(ocrInput)
Dim WordX_location As Integer = word.X
Dim WordY_location As Integer = word.Y
Dim WordWidth As Integer = word.Width
Dim WordHeight As Integer = word.Height
Dim WordOcrAccuracy As Double = word.Confidence
For Each character In word.Characters
' Pages -> Paragraphs -> Lines -> Words -> Characters
Dim CharacterNumber As Integer = character.CharacterNumber
Dim CharacterText As String = character.Text
Dim CharacterImage As AnyBitmap = character.ToBitmap(ocrInput)
Dim CharacterX_location As Integer = character.X
Dim CharacterY_location As Integer = character.Y
Dim CharacterWidth As Integer = character.Width
Dim CharacterHeight As Integer = character.Height
Dim CharacterOcrAccuracy As Double = character.Confidence
' Output alternative symbols choices and their probability.
' Very useful for spellchecking
Dim Choices() As OcrResult.Choice = character.Choices
Next character
Next word
Next line
Next paragraph
Next page
Install-Package IronOcr
IronOCR, Tesseract 5 kullanarak taradigi her sayfa icin gelişmiş bir sonuc nesnesi dondurur. Bu, her biri icin konum verileri, resimler, metin, istatistiksel guven, alternatif sembol secimleri, yazi tipi isimleri, yazi tipi boyutlari dekorasyonu, yazi tipleri ve pozisyon icerir:
Page Paragraph Word Barcode
Ürün, entegrasyon veya lisanslama sorularınız olsun; Iron ürün geliştirme ekibi tüm sorularınızı yanıtlamak için hazır. Kütüphanemizi projenizde en iyi şekilde kullanmak için bizimle iletişime geçin ve bir diyalog başlatın.
Soru SorIronOCR (Optik Karakter Tanıma) kütüphanesi, geliştiricilere Görüntüleri Metne çevirirken hızlı ve verimli sonuçlar sağlar. IronOCR, .NET, VB .NET ve C# ile çalışır. .NET çerçeveleri için özel olarak tasarlanmış, sizin için - geliştiriciye - projelerinizde optimum performans elde etmeniz için destek sağlar.
OCR, metin dosyalarını, barkodları, QR içeriklerini tanır ve alır. Ancak IronOCR, görüntülerden OCR okuma ve metin eklemenize olanak tanıyan çeşitli yöntemler de sunar; web, windows masaüstü veya konsol .NET projeleri için destek sağlar, neredeyse sınırsız görüntü formatları ve dosyalar, JPG, PNG, GIF, TIFF, BMP, JPEG veya PDF gibi.
Görüntü çıktıdan düz metin, karakterler, satırlar ve paragrafların tanıma sonuçları ilk başta karmaşık görünmeyebilir, IronOCR'un sonuçlarının aslında düşündüğünüzden daha kolay olduğunu göreceksiniz. IronOCR, hizalama için resmi tarar, gürültü giderme ve filtreleri ile kalite ve çözünürlüğü kontrol eder. Özelliklerini inceler, OCR motorunu optimize eder ve tanınma için eğitilmiş yapay zeka ağı kullanılır (görüntülerden metin) ve herhangi bir insan kadar iyi tanır.
OCR, bilgisayar için bile basit bir işlem değildir. Ancak IronOCR, aranabilir belgeler oluşturmayı %100 doğruluk ve minimum kod satırı ile daha hızlı ve daha basit hale getirir.
Eğitimi Okuyun
Yazılım, coğrafi sınırlarla sınırlı değildir — işletmeler sınırların ötesinde faaliyet gösterir ve sonuçlarını elde etmek için birden fazla dile güvenir. Benzer şekilde, yalnızca tek bir dilde belge tanıma yapan bir optik karakter tanıma (OCR) aracı her yönden büyük bir HAYIR'dır!
Birkaç OCR işlevselliği sağlayan çok dilli bir OCR kütüphanesiyle, birden çok dilde (Fransızca'dan Çince'ye kadar) taranmış bir PDF veya taranmış görüntüden aranabilir bir PDF dokümanı oluşturmanın faydalarından yararlanırsınız. Zamanınız ve çabanız, dinamik, kelime aranabilir bir PDF dokümanı ile kolaylaştırılmıştır, bu doküman siz, müşteriniz veya kuruluşunuz tarafından limitsiz kullanılabilir ve yeniden kullanılabilir.
Size, işinize ve OCR ihtiyaçlarınıza odaklanan güçlü bir şekilde, yerleşik veya talep üzerine, IronOCR kütüphanesi desteklenen dillerin geniş bir yelpazesine sahiptir. Bir sonraki .NET projeniz dil uyumluluğu endişelerinden kurtulabilir!
Arapça, İspanyolca, Fransızca, Almanca, İbranice, İtalyanca, Japonca, Basitleştirilmiş Çince, Geleneksel Çince (Mandarin), Danca, İngilizce, Fince, Portekizce, Rusça, İspanyolca veya İsveççe olsun, dilleri adlandırın ve biz onları size sağlarız! İstediğiniz dil paketlerini indirebilir veya daha fazla dil için 7/24 destekle iletişime geçebilirsiniz.
İlk adım, Windows Visual Studio için NuGet paket yükleyicimizi kullanmaktır.
Dil Paketlerini İndirIronOCR rakiplerinden nasıl farklıdır? OCR işlevselliklerini kolayca eklemenize, metin çıkarmanıza ve döndürülmüş görüntüleri taramanıza olanak sağlamanın yanı sıra, mükemmel olmayan taramalardan OCR yapma yeteneğine de sahiptir! Bugün piyasada bulunan birçok kullanıma hazır ürün aksine, gerçek dünya bireysel ve kurumsal uygulamalarda başarısızlığa mahkumdur, çoğu makine baskılı, yüksek çözünürlüklü ve mükemmel ayarlanmış metinlerle çalışır.
IronOCR, yerel bir C# OCR kütüphanesi olan IronTesseract DLL'i ile Google Tesseract'ın yeteneklerini genişletir, ücretsiz Tesseract kütüphanesinden daha yüksek doğruluk ve gelişmiş kararlılık sunar.
Elinizdeki en iyi araçla, mükemmel olmayan bir taranmış görüntünüz veya depolama klasörünüzde saklanan bir resminiz bile olsa — IronOCR'un görüntü işleme kütüphanesi gürültüyü temizler, döndürür, bozulmayı ve eğik hizalamayı azaltır ve çözünürlük ve kontrastı artırır. Gelişmiş Optik Karakter Tanıma (OCR) ayarları size — kodlayıcılara — en iyi aranabilir sonuçları tekrar tekrar elde etmek için araçlar ve kodlar sağlar.
İhtiyacınız olan kelimeleri arayın ve her zaman beklentinizin üzerinde sonuçlar alın: %99.8-100 doğru sonuçlar, PDF Belgeleri, çok çerçeveli TIFF dosyaları, JPEG & JPEG2000, GIF, PNG, BMP, WBMP, System.Drawing.Image, System.Drawing.Bitmap, System.IO.Streams görüntüleri, ikili görüntü verileri (byte[]), ve her şeyin ötesinde!
Tesseract'ın Alternatifi
.NET çerçevesindeki diğer .NET uygulamalarından farklı olarak, IronOCR'un paket yönetici konsolu ve tanınan metin konsolu içerisinde yer alan gelişmiş Optik Karakter Tanıma, kullanıcılarınıza bir görüntünün tamamından veya taranmış görüntülerden doğru metin okuma için birden fazla yazı tipi (Times New Roman'dan daha fantezi veya zor anlaşılan bir şeye kadar), ağırlık ve stilleri okumak için yetenek verir. Görüntünün belirli bölgelerini seçme yeteneğimiz, hız ve doğruluğu artırmaya yardımcı olur. Birkaç satırdan birkaç paragrafa kadar çoklu iş parçaları, OCR motorunu hızlandırır ve çok çekirdekli makinelerde birden fazla belge okumasına olanak tanır.
Hız ve doğruluk iddialarımız, karakter tanıma süreci ile sınırlı değildir. Aksine, iyileştirmeler kurulum noktasından itibaren başlar, çünkü IronOCR'un .NET OCR motoru, tam, iyi belgelenmiş bir .NET yazılım kütüphanesi olup, kurulumu kolaydır. Visual Studio için tek bir NuGet paket yöneticisi kurulumu ve MVC, WebApp, Masaüstü, Konsol ve Sunucu Uygulamaları ile çoklu iş parçaları uyumluluğu vardır.
Gizli belgelerinizi internet üzerinden göndermeden, harici web hizmetleri veya sürekli ücretler olmadan %99.8-100 OCR doğruluğu elde edebilirsiniz. Hantal C++ kodlaması olmadan, IronOCR, birden fazla karakter, kelime, satır, paragraf, metin ve doküman için tam PDF OCR desteği gerektiğinde yapılacak en net seçenektir.
Kodlamalarını mükemmelleştirmeye çalışan geliştiriciler için en iyi seçenekleri sunuyoruz, çünkü IronOCR, kutudan çıktığı gibi çalışır ve performans ayarlaması yapmaya ihtiyaç duymaz veya girdi görüntülerini önemli ölçüde değiştirmek gerekmez. En son IronOCR sürümü, önceki sürümlerden daha hızlı bir şekilde — on kata kadar daha hızlı çalışır ve %250 daha az hata yapar. Kendi yapılandırmalarımızı, OCR için mükemmel platform sağlamak üzere hedeflerinizi desteklemek için yükseltiyoruz!
Tüm Fonksiyon Listesini GörüntüleMobil cihazları bile kullanırken, eksiksiz .NET OCR kütüphanemiz, geliştiricilere iç huzuru sağlar, çünkü IronOCR, doğrudan bir .NET uygulamanıza yerleştirmek için içerik paragraflarını, satırları, kelimeleri, karakterleri ve görüntü dize sonuçlarını bölmenize olanak tanır.
Kaynak koddan sonuca kadar — elde edilen veriler, uygulamanıza aktarılmadığını düşünecek olursanız işe yaramazdı. IronOCR, sonuç verilerini daha geniş bir uygulama yelpazesinde, karmaşık web sitelerine entegrasyon ve daha hızlı yükleme süreleriyle çalışabileceğiniz sürdürülebilir bir format olan XHTML'e dışa aktarmanıza olanak tanır!
Ancak destek orada bitmez. Aranabilir PDF belgelere OCR dışa aktarma yeteneği, PDF belgelerini istediğiniz zaman saklama ve alma imkanını, size, müşterilerinize ve organizasyonunuza kolaylık sağlar! Özellikle, bir veritabanında birkaç anahtarla arayabileceğiniz 30 sayfalık bir sözleşmeniz olduğunda faydalıdır ve aranabilir PDF belgeler görme engelliler için faydalı olduğu kanıtlandığına göre şirketinizi uygun bir şekilde sunmanızı sağlar.
Bunun yanı sıra, OCR çıktınızı temsil eden, yerleşim bilgileri ve stil bilgileri sağlayan bir OCR formatına da sonuçlarınızı dışa aktarabilirsiniz, ve ilişkili bilgiyi standart HTML'de gömün.
Daha Fazla Bilgi Edinin
Ücretsiz topluluk geliştirme lisansları. Ticari lisanslar 749 $'dan başlar.
C# Tesseract OCR
Jim, IronOCR'nin geliştirilmesinde öncü figür olmuştur. OCR için görüntü işleme algoritmaları ve okuma yöntemleri tasarlar ve geliştirir.
Karşılaştırmayı Görün
C# OCR ASP.NET
Gemma'nın ekibi, arşiv yazılımları için IronOCR'yi kullanarak görüntülerden metin okumayı nasıl kullanıyor öğrenin. Gemma kendi kod örneklerini paylaşıyor.
Görüntüden Metin'e .NET Eğitim
Iron ekibinin .NET yazılım bileşeni pazarında 10 yıldan fazla deneyimi vardır.