C#və .NET-də Azərbaycan OCR

Esta es la versión completa:

IronOCR for .NET es una herramienta de análisis de PDF que permite a los usuarios de todo el mundo acceder a 126 archivos PDF desde cualquier lugar del mundo con IronOCR for .NET imkan verən C#proqram komponentidir.

Con .NET, los usuarios de todo el mundo pueden disfrutar de las ventajas de la tecnología Tesseract üstələyən inkişaf etmiş bir Tesseract çəngəlidir.

IronOcr.Idiomas.azerbaiyano

Más de 138 OCR en .NET:

  • Azərbaycan dili
  • Azərbaycan Ən Yaxşısı
  • Azerbaycan tez
  • Azərbaycan dili
  • Azərbaycan dili Kiril Ən Yaxşısı
  • Azərbaycan dili KirilTez

Yükləyin

Azərbaycan Dili Paketi [azərbaycan dili]
* Descargar como Zip
* Instalar con
https://www.nuget.org/packages/IronOcr.Languages.Azerbaijani/'> NuGet

Quraşdırma

No te lo pierdas Azərbaycan OCR en .NET en su navegador.

PM> Install-Package IronOCR.Languages.Azerbaijani

Kod nümunəsi

Utiliza C# para crear imágenes y PDFs de alta calidad.

```cs //PM> Install-Package IronOcr.Languages.Azerbaijani using IronOcr; var Ocr = new IronTesseract(); Ocr.Language = OcrLanguage.Azerbaijani; using (var Input = new OcrInput(@"images\Azerbaijani.png")) { var Result = Ocr.Read(Input); Var AllText = Result.Text } ```

No ha encontrado IronOCR?

IronOCR, la solución perfecta para los usuarios de .NET.

Heç bir xarici veb xidmətindən istifadə etmədən, davam edən ödənişlərdən və ya internet üzərindən məxfi sənədlər göndərmədən % 99,8 + OCR dəqiqliyinə uña olmaq üçün IronOCR seçin.

En C#, los usuarios de Vanilla Tesseract pueden utilizar IronOCR:

  • DLL en NuGet y NuGet en la nube
  • Qutudan çıxan Tesseract 5, 4 və 3 mühərrikləri üçün daxildir.
  • Dəqiqlik % 99,8 normal Tesseract-dan əhəmiyyətli dərəcədə üstündür.
  • Parlaq Sürət və MultiThreading
  • MVC, WebApp, Masaüstü, Konsol və Server Tətbiqinə uyğundur
  • İşləmək üçün Exes və ya C ++ kodu yoxdur
  • Tam PDF OCR dəstəyi
  • OCR-i demək olar ki, hər hansı bir Şəkil faylı və ya PDF şəklində yerinə yetirmək üçün
  • Tam .NET Core, Standard və FrameWork dəstəyi
  • Windows, Mac, Linux, Azure, Docker, Lambda, AWS-də yerləşdirin
  • QR kodlarını və Barkodları və QR kodlarını oxuyun
  • OCR'yi XHTML olaraq ixrac edin
  • Axtarış sənədlərini PDF sənədlərinə göndərin
  • Çox işləmə dəstəyi
  • 126 usuarios de NuGet y OcrData no pueden acceder a esta información
  • Şəkillər, Koordinatlar, Statistika və Yazı tiplərini çıxarın. Más información.
  • Visite tətbiqetmələrində Tesseract OCR-nin yenidən paylanması üçün istifadə edilə bilər.

IronOCR, real dünya şəkilləri və fotoşəkil kimi qüsurlu sənədlərlə və ya rəqəmsal səs-küy və ya qüsurlu ola biləcək aşağı çözünürlüklü taramalarla işləyərkən parlayır.

las plataformas .NET son más seguras pulsuz OCR kitabxanaları, digər .net tesseract API və veb xidmətləri bu real dünya istifadəsi hallarında o qədər də yaxşı nəticə vermir.

Tesseract 5 OCR - C#ilə kodlamaya başlayın

Aşağıdakı kod nümunəsi C#və ya VB .NET istifadə edərək bir görüntüdən mətn oxumağın nə qədər asan olduğunu göstərir.

OneLiner

```cs string Text = new IronTesseract().Read(@"img\Screenshot.png").Text; ```

Yapılandırılabilir Salam Dünya

```cs // PM> Install-Package IronOCR.Languages.Azerbaijani using IronOcr; var Ocr = new IronTesseract(); Ocr.Language = OcrLanguage.Azerbaijani; using (var Input = new OcrInput()){ Input.AddImage("images/sample.jpeg") //... istənilən sayda şəkil əlavə edə bilərsiniz var Result = Ocr.Read(Input); Console.WriteLine(Result.Text); } ```

C#PDF OCR

Eyni yanaşma hər hansı bir PDF sənədindən mətn çıxarmaq üçün də istifadə edilə bilər.

```cs var Ocr = new IronTesseract(); Ocr.Language = OcrLanguage.Azerbaijani; using (var input = new OcrInput()) { input.AddPdf("example.pdf", "password"); // OCR-ə xüsusi PDF səhifə nömrələrini də seçə bilərik var Result = Ocr.Read(input); Console.WriteLine(Result.Text); Console.WriteLine($"{Result.Pages.Count()} Pages"); // PDF-nin hər səhifəsi üçün 1 səhifə } ```

Reconocimiento óptico de caracteres TIFF multipágina

Puede utilizar el formato OCR TIFF en cualquier momento. Los archivos TIFF son más seguros que los archivos PDF çevrilə bilər.

```cs using IronOcr; var Ocr = new IronTesseract(); Ocr.Language = OcrLanguage.Azerbaijani; using (var Input = new OcrInput()){ input.AddMultiFrameTiff("multi - frame.tiff"); var Result = Ocr.Read(Input); Console.WriteLine(Result.Text); } ```

Barkodlar və QR

Dəmir OCR-nin bənzərsiz bir xüsusiyyəti mətni axtararkən sənədlərdən barkodları və QR kodlarını oxuya bilər. OcrResult.OcrBarcode Sınıfının OcrResult.OcrBarcode , inkişaf etdiriciyə hər skan edilmiş barkod haqqında ətraflı məlumat verir.

```cs // using IronOcr; var Ocr = new IronTesseract(); Ocr.Configuration.ReadBarCodes = true; using (var input = new OcrInput()) { input.AddImage("img/Barcode.png"); var Result = Ocr.Read(input); foreach (var Barcode in Result.Barcodes) { Console.WriteLine(Barcode.Value); // növ və yer xüsusiyyətləri də ifşa edildi } } ```

Xüsusi Şəkillər Sahələrində OCR

IronOCR-nin tarama və oxu metodları bir səhifənin və ya səhifələrin hansı hissəsindən mətn oxumaq istədiyimizi dəqiq müəyyənləşdirmək imkanı verir. Bu standartlaşdırılmış formaları nəzərdən keçirdiyimiz zaman çox faydalıdır və çox vaxta qənaət edə və səmərəliliyi artıra bilər.

Məhsul bölgələrini istifadə etmək üçün Sistema.Dibujo sistema de pago Sistema.Dibujo əlavə etməliyik ki, System.Drawing.Rectangle obyektini istifadə edə bilək.

```cs using IronOcr; var Ocr = new IronTesseract(); Ocr.Language = OcrLanguage.Azerbaijani; using (var Input = new OcrInput()) { var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 }; // Ölçülər px şəklindədir Input.Add("document.png", ContentArea); var Result = Ocr.Read(Input); Console.WriteLine(Result.Text); } ```

Aşağı keyfiyyətli taramalar üçün OCR

IronOCR OcrInput sinfi normal Tesseract'in oxuya bilmədiyi taramaları düzəldə bilər.

```cs using IronOcr; var Ocr = new IronTesseract(); Ocr.Language = OcrLanguage.Azerbaijani; using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff")) { Input.DeNoise(); // rəqəmsal səs-küy və zəif tarama düzəldir Input.Deskew(); // fırlanma və perspektivi düzəldir var Result = Ocr.Read(Input); Console.WriteLine(Result.Text); } ```

OCR nəticələrini Aranabilir PDF olaraq ixrac edin

Más información en PDF. Axtarış motorları və verilənlər bazaları tərəfindən indeksləşdirilə bilər.

```cs using IronOcr; var Ocr = new IronTesseract(); Ocr.Language = OcrLanguage.Azerbaijani; using (var Input = new OcrInput()){ input.Title = "Quarterly Report" input.AddImage("image1.jpeg"); input.AddImage("image2.png"); input.AddImage("image3.gif"); var Result = Ocr.Read(input); Result.SaveAsSearchablePdf("searchable.pdf") } ```

Conversión de archivos TIFF a PDF

TIFF sənədini (və ya hər hansı bir şəkil sənəd qrupunu) intranet, google, motor de búsqueda, etc indeksləşdirilə bilən axtarışa verilən bir PDF-yə köçürün.

```cs using IronOcr; var Ocr = new IronTesseract(); Ocr.Language = OcrLanguage.Azerbaijani; using (var Input = new OcrInput()){ input.AddMultiFrameTiff("example.tiff") var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf") } ```

OCR nəticələrini HTML olaraq ixrac edin

OCR para XHTML.

```cs using IronOcr; var Ocr = new IronTesseract(); Ocr.Language = OcrLanguage.Azerbaijani; using (var Input = new OcrInput()){ input.Title = "Html Title" input.AddImage("image1.jpeg"); var Result = Ocr.Read(input); Result.SaveAsHocrFile("results.html"); } ```

Filtro de reconocimiento óptico de caracteres (OCR)

IronOCR, OCR performansını yaxşılaşdırmaq üçün OcrInput un sistema de filtración de aire único.

Şəkil genişləndirmə kodu nümunəsi

Si desea obtener más información sobre el OCR, póngase en contacto con su distribuidor OCR más cercano.

```cs using IronOcr; var Ocr = new IronTesseract(); Ocr.Language = OcrLanguage.Azerbaijani; using (var Input = new OcrInput(@"LowQuality.jpeg")) { Input.DeNoise(); // rəqəmsal səs-küy və zəif tarama düzəldir Input.Deskew(); // fırlanma və perspektivi düzəldir var Result = Ocr.Read(Input); Console.WriteLine(Result.Text); } ```

OCR en su ordenador

IronOCR-da quraşdırılmış OCR performansını artırmaq üçün giriş filtrlərinə aşağıdakılar daxildir:

  • OcrInput.Rotate (ikiqat dərəcə) - Şəkilləri saat istiqamətində bir neçə dərəcə ilə çevirir . Saat yönünün əksinə mənfi rəqəmlərdən istifadə edin.
  • OcrInput.Binarizar () - Bu şəkil süzgəci hər pikselin ortası olmayan qara və ya ağ rəngə çevrilir. Mətnin fonla çox aşağı kontrastlı OCR performans hallarını inkişaf etdirə bilər.
  • OcrInput.ToGrayScale () - Bu şəkil filtri hər pikselin rəngini kölgəyə çevirir. OCR dəqiqliyini yaxşılaşdırmaq ehtimalı yoxdur, lakin sürəti artıra bilər
  • OcrInput.Contraste () - Kontrastı avtomatik olaraq artırır. No te olvides de filtrar tus datos taramalarda OCR sürətini və dəqiqliyini artırır.
  • OcrInput.DeNoise () - Rəqəmsal səsləri aradan qaldırır . Más información səs-küy gözlənilən yerdə istifadə olunmalıdır.
  • OcrInput.Invertir () - Hər rəngi tərs çevirir. Məsələn Ağ qara olur: qara ağ olur.
  • OcrInput.Dilate () - Ətraflı Morfologiya. Dilatasiya más información sərhədlərinə piksel əlavə edir. Erode ilə üzbəüz
  • OcrInput.Erode () - Ətraflı Morfologiya. Eroziya , obyekt sərhədlərindəki pikselləri silər, əksinə Dilate
  • OcrInput.Deskew () - Görünüşü doğru yola və ortogonal olduğu üçün döndürür . Bu, OCR üçün çox faydalıdır, çünki əyilmiş taramalar üçün Tesseract toleransı 5 dərəcə qədər ola bilər.
  • OcrInput.DeepCleanRuido de fondo () - Ağır fon səs-küyünün çıxarılması. Pero no te preocupes həddindən artıq sənəd fon səs-küyünün bilinməsi halında istifadə edin, çünki bu filtr təmiz sənədlərin OCR dəqiqliyini azaltmaq riski daşıyacaq və CPU çox bahalıdır.
  • OcrInput.MejorarResolución - Aşağı keyfiyyətli şəkillərin qətnaməsini artırır . OcrInput.MinimumDPIOcrInput.TargetDPI avtomatik olaraq aşağı çözünürlüklü girişləri tutub həll edəcəyi üçün bu filtrə tez-tez ehtiyac yoxdur.

LimpiarRuido de Fondo. Bu bir qədər vaxt aparan bir ayardır; bununla birlikdə kitabxanaya rəqəmsal səs içərisindəki rəqəmsal səs-küyləri, kağız qırışlarını və digər qüsurları avtomatik olaraq digər OCR kitabxanaları tərəfindən oxunma qabiliyyətinə səbəb ola biləcək şəkildə təmizləməyə imkan verir.

MejorarContraste , Dəmir OCR-nin bir şəkil fonunda mətnin kontrastını avtomatik olaraq artırmasına, OCR-nin dəqiqliyini artırmasına və ümumiyyətlə OCR-nin performansını və sürətini artırmasına səbəb olan bir ayardır.

MejorarResolución , aşağı çözünürlüklü şəkilləri (275 ppp-dən aşağı) el mercado de la tecnología de la información está cambiando və görüntüyü productos avtomatik yüksək səviyyəyə qaldıracaq və sonra OCR kitabxanası tərəfindən mükəmməl oxunması üçün bütün mətni kəskinləşdirən bir ayardır. Bu əməliyyat özlüyündə çox vaxt aparsa da, ümumiyyətlə bir görüntü üzərində bir OCR əməliyyatı üçün ümumi vaxtı azaldır.

Dil Dəmir OCR, 22 beynəlxalq dil paketini dəstəkləyir və dil ayarı, bir OCR əməliyyatı üçün tətbiq ediləcək bir və ya daha çox dil seçmək üçün istifadə edilə bilər.

Estrategia IronOCR iki strategiyanı dəstəkləyir. Ya bir sənədin sürətli və daha az dəqiq bir si desea obtener más información sobre las estadísticas, visite la página de estadísticas de OCR mətninin dəqiqliyini avtomatik olaraq artırmaq üçün bəzi süni zəka modellərindən istifadə edən inkişaf etmiş bir la estrategia de la empresa. .

Espacio de color , boz tonda və ya rəngdə OCR seçə biləcəyimiz bir ayardır. Ümumiyyətlə, gri tonlama ən yaxşı seçimdir. Lakin bəzən oxşar rəngli, lakin çox fərqli rəngli mətnlər və ya arxa planlar olduqda tam rəngli rəng sahəsi daha yaxşı nəticələr verəcəkdir.

WhiteTextOnDarkBackgrounds aşkarlayın. El kit de reconocimiento óptico de caracteres (OCR) es una fuente de información de gran utilidad görməsini gözləyirlər. Si desea obtener más información sobre el OCR, póngase en contacto con nosotros aşkar edib oxumağa imkan verir.

InputImageType. Los parámetros del kit de reconocimiento óptico de caracteres (OCR) se pueden ajustar en cualquier momento kimi bir parçaya baxıb-baxmadığına dair rəhbərlik etməsinə imkan verir.

Girar y enderezar , Dəmir OCR-yə təkrar fırlanan deyil, mətn sənədlərinin fotoşəkilləri kimi perspektivi ehtiva edən bənzərsiz oxuma qabiliyyətini verən inkişaf etmiş bir ayardır.

LeerCódigos , IronOCR-yə mətn oxuduğu üçün böyük bir əlavə vaxt yükləmədən avtomatik olaraq səhifələrdə barkodları və QR kodlarını oxumağa imkan verən faydalı bir xüsusiyyətdir.

RəngDərinlik. Para obtener más información sobre los parámetros, consulte el manual del OCR no te preocupes, no te preocupes. Para obtener más información sobre el OCR, consulte la página de OCR más reciente əməliyyatının başa çatması üçün lazım olan vaxtı da artıracaqdır.

126 Dil Paketi

IronOCR , bu veb saytdan və ya NuGet Paket Menecerindən yüklənə bilən DLL olaraq paylanan dil paketləri vasitəsilə 126 beynəlxalq dili dəstəkləyir.

Dillər Alman, Fransız, İngilis, Çin, Yapon və daha çoxunu əhatə edir. MRZ pasportu, MICR çekləri, Maliyyə məlumatları, nömrələr və daha çoxu üçün mütəxəssis dil paketləri mövcuddur. Özünüz yaratdıqlarınız da daxil olmaqla hər hansı bir tesseract ".traineddata" sənədindən də istifadə edə bilərsiniz.

Dil nümunəsi

Digər OCR dillərindən istifadə.

```cs // using IronOcr; // PM> Install IronOcr.Languages.Arabic var Ocr = new IronTesseract(); Ocr.Language = OcrLanguage.Arabic; using (var input = new OcrInput()) { input.AddImage("img/arabic.gif"); // Lazım gələrsə şəkil filtrləri əlavə edin // Bu vəziyyətdə düşünülmüş giriş belə çox keyfiyyətsizdir // IronTesseract ənənəvi Tesseract-ın edə bilmədiklərini oxuya bilər. var Result = Ocr.Read(input); // Konsol ərəb dilini Windows-da asanlıqla çap edə bilmir. // Bunun əvəzinə diskdə saxlayaq. Result.SaveAsTextFile("arabic.txt"); } ```

Çox dil nümunəsi

Eyni zamanda birdən çox dildən istifadə edərək OCR etmək mümkündür. Bu, həqiqətən Unicode sənədlərində ingilis dilində metadata və url əldə etməyə kömək edə bilər.

```cs // using IronOcr; // PM> Install IronOcr.Languages.ChineseSimplified var Ocr = new IronTesseract(); Ocr.Language = OcrLanguage.ChineseSimplified; Ocr.AddSecondaryLanguage(OcrLanguage.Azerbaijani); // İstənilən sayda dil əlavə edə bilərik using (var input = new OcrInput()) { input.Add("multi - language.pdf"); var Result = Ocr.Read(input); Result.SaveAsTextFile("results.txt"); } ```

Ətraflı OCR nəticələri obyektləri

Dəmir OCR hər OCR əməliyyatı üçün bir OCR nəticə obyektini qaytarır. Ümumiyyətlə, inkişaf etdiricilər yalnız bu obyektin mətn xüsusiyyətini görüntüdən skan edilmiş mətn almaq üçün istifadə edirlər. Bununla birlikdə, OCR nəticələri DOM bundan daha inkişaf etmişdir.

```cs using IronOcr; using System.Drawing; //Məclis İstinadını əlavə edin var Ocr = new IronTesseract(); Ocr.Language = OcrLanguage.Azerbaijani; Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm; Ocr.Configuration.ReadBarCodes = true; //! Vacibdir using (var Input = new OcrInput(@"images\sample.tiff")) { OcrResult Result = Ocr.Read(Input); var Pages = Result.Pages; var Words = Pages [0].Words; var Barcodes = Result.Barcodes; // Kütləvi, ətraflı bir API tapmaq üçün buranı araşdırın: // - Səhifələr, bloklar, parafaflar, sətirlər, sözlər, işarələr // - Görüntü İxracı, Şriftlər Koordinatları, Statistik Məlumat } ```

Performans

IronOCR performans tənzimləməsinə və ya giriş şəkillərini ağır şəkildə dəyişdirməyə ehtiyac olmadan qutudan kənarda işləyir.

El último día: IronOcr.2020 + 10 qat daha sürətli vəvvəlki istehsallardan 250% daha az səhv edir.

Daha ətraflı

C #, VB, F # ya digər hər hansı bir .NET dilində OCR haqqında daha çox məlumat əldə etmək üçün zəhmət olmasa Dəmir OCR-nin necə istifadə olunacağına dair real nümunələr verən icma dərsliklərimizi oxuyun və ən yaxşısını necə əldə edə biləcəyinizi izah edin. bu kitabxana.

.NET en el mercado de la informática tam bir obyekt referansı da mövcuddur.