सी # और .NET म हिदी ओसीआर

इस दसतावज क अनय ससकरण:

आयरनओसीआर एक सी # सॉफटवयर घटक ह जो .NET कोडरस को हिदी सहित 126 भाषाओ म छवियो और पीडीएफ दसतावजो स पाठ पढन की अनमति दता ह।

यह Tesseract का एक उननत काटा ह, जो विशष रप स .NET डवलपरस क लिए बनाया गया ह और गति और सटीकता दोनो क लिए नियमित रप स अनय Tesseract इजन को बहतर बनाता ह।

IronOcr.Languages.Hindi की सामगरी

इस पकज म .NET क लिए 40 OCR भाषाए ह:

  • हिदी
  • HindiBest
  • HindiFast

डाउनलोड

हिदी भाषा पक [ हिदी ]
* Download as जिप
* Install with
https://www.nuget.org/packages/IronOcr.Languages.Hindi/' NuGet

सथापना

सबस पहल हम अपना हिदी OCR पकज अपन .NET परोजकट म सथापित करना होगा।

PM> Install-Package IronOCR.Languages.Hindi

कोड उदाहरण

यह C#कोड उदाहरण एक छवि या पीडीएफ दसतावज स हिदी पाठ को पढता ह।

// PM> Install-Package IronOCR.Languages.Hindi
using IronOcr;

var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;

// Load the input image for OCR processing
using (var Input = new OcrInput(@"images\Hindi.png"))
{
    // Read the input image to extract text
    var Result = Ocr.Read(Input);

    // Store the extracted text
    var AllText = Result.Text;
}
// PM> Install-Package IronOCR.Languages.Hindi
using IronOcr;

var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;

// Load the input image for OCR processing
using (var Input = new OcrInput(@"images\Hindi.png"))
{
    // Read the input image to extract text
    var Result = Ocr.Read(Input);

    // Store the extracted text
    var AllText = Result.Text;
}
$vbLabelText   $csharpLabel

कयो चन आयरनओआरसीआर?

आयरन ओसीआर एक आसान-सथापित, परण और अचछी तरह स परलखित .NET सॉफटवयर लाइबररी ह।

किसी भी बाहरी वब सवाओ, चल रही फीस या इटरनट पर गोपनीय दसतावज भजन क बिना 99.8% + OCR सटीकता परापत करन क लिए IronOCR चन।

कयो C#डवलपरस वनिला टसरकट क ऊपर आयरनओसीआर चनत ह:

  • एकल DLL या NuGet क रप म सथापित कर
  • बॉकस स बाहर Tesseract 5, 4 और 3 इजन शामिल ह।
  • सटीकता 99.8% नियमित रप स टसरकट स बहतर परदरशन करती ह।
  • धधकती गति और मलटीथरडिग
  • MVC, WebApp, डसकटॉप, कसोल और सरवर अनपरयोग सगत
  • कोई Exes या C ++ कोड क साथ काम करन क लिए नही
  • परण पीडीएफ ओसीआर समरथन
  • OCR करन क लिए लगभग कोई भी इमज फाइल या PDF
  • फल .NET कोर, सटडरड और फरमवरक सपोरट
  • Windows, Mac, Linux, Azure, Docker, Lambda, AWS पर नियोजित कर
  • बारकोड और कयआर कोड पढ
  • निरयात OCR XHTML क रप म
  • निरयात OCR खोजा पीडीएफ दसतावजो क लिए
  • बहपरत समरथन
  • 126 अतरराषटरीय भाषाए सभी NuGet या OcrData फाइलो क माधयम स परबधित की गई ह
  • छविया, निरदशाक, साखयिकी और फॉनटस निकाल। सिरफ पाठ ही नही।
  • वाणिजयिक और मालिकाना अनपरयोगो क अदर Tesseract OCR को फिर स वितरित करन क लिए इसतमाल किया जा सकता ह।

असली दनिया की छवियो और अपरण दसतावजो जस तसवीरो, या कम रिजॉलयशन क सकन क साथ काम करन पर आयरन ओसीआर चमकता ह, जिसम डिजिटल शोर या खामिया हो सकती ह।

.NET पलटफॉरम क लिए अनय मकत OCR लाइबररीज जस अनय .net tesseract API और वब सवाए इन वासतविक विशव उपयोग मामलो पर इतना अचछा परदरशन नही करती ह।

Tesseract 5 क साथ OCR - C#म कोडिग शर कर

नीच दिए गए कोड का नमना दिखाता ह कि C#या VB .NET का उपयोग करक छवि स पाठ पढना कितना आसान ह।

एक लाइन

// Read text from an image in one line
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
// Read text from an image in one line
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
$vbLabelText   $csharpLabel

विनयास योगय नमसत विशव

// PM> Install-Package IronOCR.Languages.Hindi
using IronOcr;

var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;

// Initialize an OCR input object
using (var Input = new OcrInput()){
    // Add an image to the OCR input
    Input.AddImage("images/sample.jpeg");

    // You can add any number of images
    var Result = Ocr.Read(Input);

    // Output the text read from image
    Console.WriteLine(Result.Text);
}
// PM> Install-Package IronOCR.Languages.Hindi
using IronOcr;

var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;

// Initialize an OCR input object
using (var Input = new OcrInput()){
    // Add an image to the OCR input
    Input.AddImage("images/sample.jpeg");

    // You can add any number of images
    var Result = Ocr.Read(Input);

    // Output the text read from image
    Console.WriteLine(Result.Text);
}
$vbLabelText   $csharpLabel

सी # पीडीएफ ओसीआर

इसी तरह क दषटिकोण का उपयोग किसी भी पीडीएफ दसतावज स पाठ निकालन क लिए किया जा सकता ह।

using IronOcr;

var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;

using (var input = new OcrInput())
{
    // Add PDF file to the input. Specify password if required
    input.AddPdf("example.pdf", "password");

    // हम OCR क लिए विशिषट PDF पज सखयाए भी चन सकत ह

    var Result = Ocr.Read(input);

    // Output the text read from PDF
    Console.WriteLine(Result.Text);
    Console.WriteLine($"{Result.Pages.Count()} Pages"); // Print number of pages
}
using IronOcr;

var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;

using (var input = new OcrInput())
{
    // Add PDF file to the input. Specify password if required
    input.AddPdf("example.pdf", "password");

    // हम OCR क लिए विशिषट PDF पज सखयाए भी चन सकत ह

    var Result = Ocr.Read(input);

    // Output the text read from PDF
    Console.WriteLine(Result.Text);
    Console.WriteLine($"{Result.Pages.Count()} Pages"); // Print number of pages
}
$vbLabelText   $csharpLabel

मलटीपज टीआईएफएस क लिए ओसीआर

कई पषठ दसतावजो सहित ओसीआर रीडिग झगडा फाइल परारप। TIFF को सीध पीडीएफ फाइल म खोज जा सकन वाल टकसट क साथ बदला जा सकता ह।

using IronOcr;

var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;

using (var Input = new OcrInput()){
    // Add a multi-frame TIFF to the input
    Input.AddMultiFrameTiff("multi-frame.tiff");

    var Result = Ocr.Read(Input);

    // Output the text read from TIFF
    Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;

using (var Input = new OcrInput()){
    // Add a multi-frame TIFF to the input
    Input.AddMultiFrameTiff("multi-frame.tiff");

    var Result = Ocr.Read(Input);

    // Output the text read from TIFF
    Console.WriteLine(Result.Text);
}
$vbLabelText   $csharpLabel

बारकोड और कयआर

आयरन ओसीआर की एक अनठी विशषता यह ह कि यह दसतावजो स बारकोड और कयआर कोड पढ सकता ह जबकि यह पाठ क लिए सकन कर रहा ह। OcrResult.OcrBarcode Class क उदाहरण डवलपर को परतयक सकन किए गए बारकोड क बार म विसतत जानकारी दत ह।

using IronOcr;

var Ocr = new IronTesseract();
// Enable barcode reading configuration
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
    // Add an image containing a barcode to the input
    input.AddImage("img/Barcode.png");

    var Result = Ocr.Read(input);

    // Loop through all barcodes read from the image
    foreach (var Barcode in Result.Barcodes)
    {
        // Output the value of each barcode
        Console.WriteLine(Barcode.Value);

        // परकार और सथान क गण भी उजागर हए
    }
}
using IronOcr;

var Ocr = new IronTesseract();
// Enable barcode reading configuration
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
    // Add an image containing a barcode to the input
    input.AddImage("img/Barcode.png");

    var Result = Ocr.Read(input);

    // Loop through all barcodes read from the image
    foreach (var Barcode in Result.Barcodes)
    {
        // Output the value of each barcode
        Console.WriteLine(Barcode.Value);

        // परकार और सथान क गण भी उजागर हए
    }
}
$vbLabelText   $csharpLabel

छवियो क विशिषट कषतरो पर ओसीआर

आयरन ओसीआर क सभी सकनिग और रीडिग मथडस यह निरदिषट करत ह कि हम जिस पज या पज स टकसट पढना चाहत ह, उसका कौन सा हिससा ठीक ह। यह बहत उपयोगी ह जब हम मानकीकत रपो को दख रह ह और एक भयानक समय बचा सकत ह और दकषता म सधार कर सकत ह।

फसल कषतरो का उपयोग करन क लिए, हम System.Drawing लिए एक सिसटम सदरभ जोडना होगा ताकि हम System.Drawing.Rectangle ऑबजकट का उपयोग कर सक।

using IronOcr;
using System.Drawing;

var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;

using (var Input = new OcrInput())
{
    // Define the rectangle area for OCR within the image
    var ContentArea = new Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
    // आयाम px म ह

    Input.Add("document.png", ContentArea);

    var Result = Ocr.Read(Input);
    // Output the text read within the specified area
    Console.WriteLine(Result.Text);
}
using IronOcr;
using System.Drawing;

var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;

using (var Input = new OcrInput())
{
    // Define the rectangle area for OCR within the image
    var ContentArea = new Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
    // आयाम px म ह

    Input.Add("document.png", ContentArea);

    var Result = Ocr.Read(Input);
    // Output the text read within the specified area
    Console.WriteLine(Result.Text);
}
$vbLabelText   $csharpLabel

निमन गणवतता वाल सकन क लिए ओसीआर

लौह ओसीआर OcrInput वरग सकन को ठीक कर सकता ह जो सामानय OcrInput नही पढ सकता ह।

using IronOcr;

var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
    // Correct digital noise and poor scanning artifacts
    Input.DeNoise();

    // Correct rotations and perspective distortions
    Input.Deskew();

    var Result = Ocr.Read(Input);
    // Output the text read from the low-quality scan
    Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
    // Correct digital noise and poor scanning artifacts
    Input.DeNoise();

    // Correct rotations and perspective distortions
    Input.Deskew();

    var Result = Ocr.Read(Input);
    // Output the text read from the low-quality scan
    Console.WriteLine(Result.Text);
}
$vbLabelText   $csharpLabel

निरयात OCR एक खोजा पीडीएफ क रप म परिणाम ह

परतिलिपि करन योगय पाठ सटरिग क साथ पीडीएफ क लिए छवि। खोज इजन और डटाबस दवारा अनकरमित किया जा सकता ह।

using IronOcr;

var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;

using (var Input = new OcrInput()){
    // Set the title for the PDF
    Input.Title = "Quarterly Report";
    Input.AddImage("image1.jpeg");
    Input.AddImage("image2.png");
    Input.AddImage("image3.gif");

    var Result = Ocr.Read(input);
    // Save the result as a searchable PDF
    Result.SaveAsSearchablePdf("searchable.pdf");
}
using IronOcr;

var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;

using (var Input = new OcrInput()){
    // Set the title for the PDF
    Input.Title = "Quarterly Report";
    Input.AddImage("image1.jpeg");
    Input.AddImage("image2.png");
    Input.AddImage("image3.gif");

    var Result = Ocr.Read(input);
    // Save the result as a searchable PDF
    Result.SaveAsSearchablePdf("searchable.pdf");
}
$vbLabelText   $csharpLabel

खोजा पीडीएफ रपातरण क लिए झगडा

सीध एक खोज योगय PDF पर TIFF दसतावज (या छवि फाइलो क किसी भी समह) को ल जाए, जिस इटरानट, वबसाइट और Google खोज इजन दवारा अनकरमित किया जा सकता ह।

using IronOcr;

var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;

using (var Input = new OcrInput()){
    // Add a multi-frame TIFF
    Input.AddMultiFrameTiff("example.tiff");

    // Save OCR result as a searchable PDF
    Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf");
}
using IronOcr;

var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;

using (var Input = new OcrInput()){
    // Add a multi-frame TIFF
    Input.AddMultiFrameTiff("example.tiff");

    // Save OCR result as a searchable PDF
    Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf");
}
$vbLabelText   $csharpLabel

HTML क रप म निरयात OCR परिणाम

ओसीआर छवि एकसएचटीएमएल रपातरण म।

using IronOcr;

var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;

using (var Input = new OcrInput()){
    // Set HTML title
    Input.Title = "Html Title";
    Input.AddImage("image1.jpeg");

    var Result = Ocr.Read(input);
    // Save OCR result as HTML format
    Result.SaveAsHocrFile("results.html");
}
using IronOcr;

var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;

using (var Input = new OcrInput()){
    // Set HTML title
    Input.Title = "Html Title";
    Input.AddImage("image1.jpeg");

    var Result = Ocr.Read(input);
    // Save OCR result as HTML format
    Result.SaveAsHocrFile("results.html");
}
$vbLabelText   $csharpLabel

ओसीआर इमज एनहासमट फिलटर

IronOCR OCR परदरशन को बहतर बनान क लिए OcrInput ऑबजकट क लिए अदवितीय फिलटर परदान करता ह।

इमज एनहासमट कोड उदाहरण

OCR इनपट छवियो को बहतर, तज OCR परिणामो का उतपादन करन क लिए उचच गणवतता बनाता ह।

using IronOcr;

var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
    // Correct digital noise and poor scanning artifacts
    Input.DeNoise();

    // Correct rotations and perspective distortions
    Input.Deskew();

    var Result = Ocr.Read(Input);
    // Output the text read from the low-quality image
    Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
    // Correct digital noise and poor scanning artifacts
    Input.DeNoise();

    // Correct rotations and perspective distortions
    Input.Deskew();

    var Result = Ocr.Read(Input);
    // Output the text read from the low-quality image
    Console.WriteLine(Result.Text);
}
$vbLabelText   $csharpLabel

ओसीआर छवि फिलटर की सची

OCR परदरशन बढान क लिए इनपट फिलटर जो कि IronOCR म बनाए गए ह, शामिल ह:

  • OcrInput.Rotate (डबल डिगरी) - कई डिगरी दकषिणावरत छवियो को घमाता ह। विरोधी दकषिणावरत क लिए, नकारातमक सखयाओ का उपयोग कर।
  • OcrInput.Binarize () - यह छवि फिलटर हर पिकसल को बिना किसी मधय मदान क काला या सफद कर दता ह। पषठभमि क पाठ क बहत कम विपरीत OCR परदरशन मामलो म सधार कर सकत ह।
  • OcrInput.ToGrayScale () - यह छवि फिलटर हर पिकसल को गरसकल की छाया म बदल दता ह। OCR सटीकता म सधार करन क लिए परी तरह स लकिन गति म सधार हो सकता ह
  • OcrInput.Contrast () - सवचालित रप स इसक विपरीत बढता ह। यह फिलटर अकसर कम विपरीत सकन म ओसीआर गति और सटीकता म सधार करता ह।
  • OcrInput.DeNoise () - डिजिटल शोर को हटाता ह। इस फिलटर का उपयोग कवल वही किया जाना चाहिए, जहा शोर होन की उममीद हो।
  • OcrInput.Invert () - हर रग म इनवरट करता ह। जस सफद काला हो जाता ह: काला सफद हो जाता ह।
  • OcrInput.Dilate () - उननत आकति विजञान। Dilation एक छवि म वसतओ की सीमाओ म पिकसल जोडता ह। इरोड क विपरीत
  • OcrInput.Erode () - उननत आकति विजञान। कटाव वसत सीमाओ पर पिकसल को हटा दता ह
  • OcrInput.Deskew () - एक छवि को घमाता ह इसलिए यह सही तरीक स ऊपर और ऑरथोगोनल ह। यह ओसीआर क लिए बहत उपयोगी ह कयोकि तिरछी सकन क लिए टसरकट सहिषणता 5 डिगरी स कम हो सकती ह।
  • OcrInput.DeepCleanBackgroundNoise () - भारी पषठभमि शोर को हटान। कवल इस फिलटर का उपयोग कर यदि चरम दसतावज पषठभमि शोर जञात ह, कयोकि यह फिलटर सवचछ दसतावजो की ओसीआर सटीकता को कम करन का जोखिम भी लगा, और बहत सीपीय महगा ह।
  • OcrInput.EnhanceResolution - निमन गणवतता वाल चितरो क सकलप को बढाता ह। यह फिलटर अकसर आवशयक नही होता ह कयोकि OcrInput.MinimumDPI और OcrInput.TargetDPI सवचालित रप स कम रिजॉलयशन इनपट को पकडग और हल करग।

CleanBackgroundNoise। यह एक सटिग ह जो कछ समय लन वाली ह; हालाकि, यह लाइबररी को डिजिटल छवि क भीतर डिजिटल शोर, पपर crumples, और अनय खामियो को सवचालित रप स साफ करन की अनमति दता ह जो अनयथा इस अनय OCR पसतकालयो दवारा पढ जान म असमरथ बना दता ह।

एनहासकटरासट एक ऐसी सटिग ह जो आयरन ओसीआर को छवि की पषठभमि क खिलाफ सवचालित रप स पाठ क विपरीत को बढान का कारण बनता ह, जिसस ओसीआर की सटीकता बढ जाती ह और आमतौर पर परदरशन और ओसीआर की गति बढ जाती ह।

EnhanceResolution एक सटिग ह जो सवचालित रप स कम-रिजॉलयशन छवियो (जो 275 डीपीआई क अतरगत ह) का पता लगाएगा और सवचालित रप स छवि को अपसकल करगा और फिर सभी पाठ को तज कर दगा ताकि यह एक ओसीआर लाइबररी दवारा परी तरह स पढा जा सक। यदयपि यह ऑपरशन अपन आप म समय लन वाला ह, यह आमतौर पर एक छवि पर ओसीआर ऑपरशन क लिए समगर समय को कम करता ह।

भाषा आयरन ओसीआर 22 अतरराषटरीय भाषा पक का समरथन करता ह, और भाषा सटिग का उपयोग एक ओसीआर ऑपरशन क लिए लाग की जान वाली एक या अधिक भाषाओ का चयन करन क लिए किया जा सकता ह।

रणनीति आयरन ओसीआर दो रणनीतियो का समरथन करता ह। हम या तो किसी दसतावज क तज और कम सटीक सकन क लिए जा सकत ह, या एक उननत रणनीति का उपयोग कर सकत ह जो शबदो म एक दसर स वाकयो क साखयिकीय सबध को दखकर OCR पाठ की सटीकता को सवचालित रप स सधारन क लिए कछ कतरिम बदधिमतता मॉडल का उपयोग करता ह। ।

कलरसपस एक सटिग ह जिसक तहत हम गरसकल या रग म ओसीआर चन सकत ह। आम तौर पर, गरसकल सबस अचछा विकलप ह। हालाकि, कभी-कभी जब समान रग क गरथ या पषठभमि होत ह लकिन बहत अलग रग होत ह, तो एक परण-रग का रग बहतर परिणाम परदान करगा।

DetectWhiteTextOnDarkBackgrounds। आम तौर पर, सभी ओसीआर पसतकालयो को सफद पषठभमि पर काला पाठ दखन की उममीद ह। यह सटिग आयरन ओसीआर को सवचालित रप स नकारातमक पाठ, या सफद पाठ क साथ अधर पषठो का पता लगान और उनह पढन की अनमति दती ह।

InputImageType। यह सटिग डवलपर को ओसीआर लाइबररी का मारगदरशन करन की अनमति दती ह, चाह वह एक परण दसतावज या एक सनिपट जस सकरीनशॉट क रप म दख रही हो।

रोटटएडसटरीमन एक उननत सटिग ह जो आयरन ओसीआर को दसतावजो को पढन की अनठी कषमता परदान करता ह जो न कवल घमाए जात ह, बलकि शायद परिपरकषय भी होत ह, जस कि पाठ दसतावजो की तसवीर।

ReadBarcodes एक उपयोगी सविधा ह जो आयरन OCR को पषठो पर सवचालित रप स बारकोड और कयआर कोड पढन की अनमति दता ह कयोकि यह पाठ को भी पढता ह, बिना एक अतिरिकत अतिरिकत बोझ डाल।

रग की गहराई। यह सटिग निरधारित करता ह कि रग की गहराई निरधारित करन क लिए ओसीआर पसतकालय परति पिकसल कितन बिटस का उपयोग करगा। एक उचच रग गहराई OCR गणवतता को बढा सकती ह, लकिन OCR ऑपरशन को परा करन क लिए आवशयक समय को भी बढाएगी।

126 भाषा पक

आयरन OCR भाषा पक क माधयम स 126 अतरराषटरीय भाषाओ का समरथन करता ह, जिनह DLL क रप म वितरित किया जाता ह, जिस इस वबसाइट स या NuGet Package Manager स भी डाउनलोड किया जा सकता ह।

भाषाओ म जरमन, फरच, अगरजी, चीनी, जापानी और कई शामिल ह। पासपोरट एमआरजड, एमआईसीआर चक, फाइनशियल डटा, लाइसस पलट और कई और अधिक क लिए विशषजञ भाषा पक मौजद ह। आप किसी भी tesseract ".traineddata" फाइल का उपयोग कर सकत ह - जिसम आप सवय बनात ह।

भाषा उदाहरण

अनय ओसीआर भाषाओ का उपयोग करना।

// using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
// Set the OCR language to Arabic
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
    input.AddImage("img/arabic.gif");
    // यदि आवशयक हो तो छवि फिलटर जोड
    // इस मामल म, यहा तक कि सोचा इनपट बहत कम गणवतता वाला ह
    // IronTesseract पढ सकता ह कि पारपरिक Tesseract कया नही कर सकता।

    var Result = Ocr.Read(input);

    // Save the Arabic text to a file since console may not print Arabic correctly
    Result.SaveAsTextFile("arabic.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
// Set the OCR language to Arabic
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
    input.AddImage("img/arabic.gif");
    // यदि आवशयक हो तो छवि फिलटर जोड
    // इस मामल म, यहा तक कि सोचा इनपट बहत कम गणवतता वाला ह
    // IronTesseract पढ सकता ह कि पारपरिक Tesseract कया नही कर सकता।

    var Result = Ocr.Read(input);

    // Save the Arabic text to a file since console may not print Arabic correctly
    Result.SaveAsTextFile("arabic.txt");
}
$vbLabelText   $csharpLabel

एकाधिक भाषा उदाहरण

एक ही समय म कई भाषाओ का उपयोग करक ओसीआर करना भी सभव ह। यह वासतव म यनिकोड दसतावजो म अगरजी भाषा मटाडटा और यआरएल परापत करन म मदद कर सकता ह।

// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
// Set primary language to Simplified Chinese
Ocr.Language = OcrLanguage.ChineseSimplified;
// Add Hindi as a secondary language
Ocr.AddSecondaryLanguage(OcrLanguage.Hindi);

// हम कितनी भी भाषाए जोड सकत ह

using (var input = new OcrInput())
{
    input.Add("multi-language.pdf");
    var Result = Ocr.Read(input);
    // Save the multilingual text to a file
    Result.SaveAsTextFile("results.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
// Set primary language to Simplified Chinese
Ocr.Language = OcrLanguage.ChineseSimplified;
// Add Hindi as a secondary language
Ocr.AddSecondaryLanguage(OcrLanguage.Hindi);

// हम कितनी भी भाषाए जोड सकत ह

using (var input = new OcrInput())
{
    input.Add("multi-language.pdf");
    var Result = Ocr.Read(input);
    // Save the multilingual text to a file
    Result.SaveAsTextFile("results.txt");
}
$vbLabelText   $csharpLabel

विसतत OCR परिणाम ऑबजकट

आयरन OCR परतयक OCR ऑपरशन क लिए OCR परिणाम वसत दता ह। आमतौर पर, डवलपर कवल छवि स सकन किए गए टकसट को परापत करन क लिए इस ऑबजकट की टकसट सपतति का उपयोग करत ह। हालाकि, OCR परिणाम DOM इसस कही अधिक उननत ह।

using IronOcr;
using System.Drawing;

var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;
// Configuration settings
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true;

using (var Input = new OcrInput(@"images\sample.tiff"))
{
    OcrResult Result = Ocr.Read(Input);
    var Pages = Result.Pages;
    var Words = Pages[0].Words; // Access words of the first page
    var Barcodes = Result.Barcodes; // Access barcodes from the OCR result

    // Explore the OCR result API for details such as:
    // - Pages, Blocks, Paragraphs, Lines, Words, Characters
    // - Image export, Fonts, Coordinates, Statistical data
}
using IronOcr;
using System.Drawing;

var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;
// Configuration settings
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true;

using (var Input = new OcrInput(@"images\sample.tiff"))
{
    OcrResult Result = Ocr.Read(Input);
    var Pages = Result.Pages;
    var Words = Pages[0].Words; // Access words of the first page
    var Barcodes = Result.Barcodes; // Access barcodes from the OCR result

    // Explore the OCR result API for details such as:
    // - Pages, Blocks, Paragraphs, Lines, Words, Characters
    // - Image export, Fonts, Coordinates, Statistical data
}
$vbLabelText   $csharpLabel

परदरशन

आयरनओसीआर बॉकस स बाहर काम करता ह जिसम टयन क परदरशन की आवशयकता नही होती ह या इनपट छवियो को बहत अधिक सशोधित किया जाता ह।

गति धधक रही ह: IronOcr.2020 + 10 गना तज ह और पिछल बिलड की तलना म 250% कम तरटी करता ह।

और अधिक जान

OCR क बार म और अधिक जानन क लिए C #, VB, F #, या किसी भी अनय .NET भाषा म, कपया हमार समदाय टयटोरियल पढ, जो इस बात का वासतविक उदाहरण दत ह कि आयरन OCR का उपयोग कस किया जा सकता ह और इस बात की बारीकियो को दिखा सकता ह कि परीकषा स बाहर कस जाए यह पसतकालय।

.NET डवलपरस क लिए एक परण ऑबजकट सदरभ भी उपलबध ह।