सी # और .NET म हिदी ओसीआर
इस दसतावज क अनय ससकरण:
आयरनओसीआर एक सी # सॉफटवयर घटक ह जो .NET कोडरस को हिदी सहित 126 भाषाओ म छवियो और पीडीएफ दसतावजो स पाठ पढन की अनमति दता ह।
यह Tesseract का एक उननत काटा ह, जो विशष रप स .NET डवलपरस क लिए बनाया गया ह और गति और सटीकता दोनो क लिए नियमित रप स अनय Tesseract इजन को बहतर बनाता ह।
IronOcr.Languages.Hindi की सामगरी
इस पकज म .NET क लिए 40 OCR भाषाए ह:
- हिदी
- HindiBest
- HindiFast
डाउनलोड
हिदी भाषा पक [ हिदी ]
* Download as जिप
* Install with https://www.nuget.org/packages/IronOcr.Languages.Hindi/' NuGet
सथापना
सबस पहल हम अपना हिदी OCR पकज अपन .NET परोजकट म सथापित करना होगा।
PM> Install-Package IronOCR.Languages.Hindi
कोड उदाहरण
यह C#कोड उदाहरण एक छवि या पीडीएफ दसतावज स हिदी पाठ को पढता ह।
// PM> Install-Package IronOCR.Languages.Hindi
using IronOcr;
var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;
// Load the input image for OCR processing
using (var Input = new OcrInput(@"images\Hindi.png"))
{
// Read the input image to extract text
var Result = Ocr.Read(Input);
// Store the extracted text
var AllText = Result.Text;
}
// PM> Install-Package IronOCR.Languages.Hindi
using IronOcr;
var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;
// Load the input image for OCR processing
using (var Input = new OcrInput(@"images\Hindi.png"))
{
// Read the input image to extract text
var Result = Ocr.Read(Input);
// Store the extracted text
var AllText = Result.Text;
}
' PM> Install-Package IronOCR.Languages.Hindi
Imports IronOcr
Private Ocr = New IronTesseract()
' Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi
' Load the input image for OCR processing
Using Input = New OcrInput("images\Hindi.png")
' Read the input image to extract text
Dim Result = Ocr.Read(Input)
' Store the extracted text
Dim AllText = Result.Text
End Using
कयो चन आयरनओआरसीआर?
आयरन ओसीआर एक आसान-सथापित, परण और अचछी तरह स परलखित .NET सॉफटवयर लाइबररी ह।
किसी भी बाहरी वब सवाओ, चल रही फीस या इटरनट पर गोपनीय दसतावज भजन क बिना 99.8% + OCR सटीकता परापत करन क लिए IronOCR चन।
कयो C#डवलपरस वनिला टसरकट क ऊपर आयरनओसीआर चनत ह:
- एकल DLL या NuGet क रप म सथापित कर
- बॉकस स बाहर Tesseract 5, 4 और 3 इजन शामिल ह।
- सटीकता 99.8% नियमित रप स टसरकट स बहतर परदरशन करती ह।
- धधकती गति और मलटीथरडिग
- MVC, WebApp, डसकटॉप, कसोल और सरवर अनपरयोग सगत
- कोई Exes या C ++ कोड क साथ काम करन क लिए नही
- परण पीडीएफ ओसीआर समरथन
- OCR करन क लिए लगभग कोई भी इमज फाइल या PDF
- फल .NET कोर, सटडरड और फरमवरक सपोरट
- Windows, Mac, Linux, Azure, Docker, Lambda, AWS पर नियोजित कर
- बारकोड और कयआर कोड पढ
- निरयात OCR XHTML क रप म
- निरयात OCR खोजा पीडीएफ दसतावजो क लिए
- बहपरत समरथन
- 126 अतरराषटरीय भाषाए सभी NuGet या OcrData फाइलो क माधयम स परबधित की गई ह
- छविया, निरदशाक, साखयिकी और फॉनटस निकाल। सिरफ पाठ ही नही।
- वाणिजयिक और मालिकाना अनपरयोगो क अदर Tesseract OCR को फिर स वितरित करन क लिए इसतमाल किया जा सकता ह।
असली दनिया की छवियो और अपरण दसतावजो जस तसवीरो, या कम रिजॉलयशन क सकन क साथ काम करन पर आयरन ओसीआर चमकता ह, जिसम डिजिटल शोर या खामिया हो सकती ह।
.NET पलटफॉरम क लिए अनय मकत OCR लाइबररीज जस अनय .net tesseract API और वब सवाए इन वासतविक विशव उपयोग मामलो पर इतना अचछा परदरशन नही करती ह।
Tesseract 5 क साथ OCR - C#म कोडिग शर कर
नीच दिए गए कोड का नमना दिखाता ह कि C#या VB .NET का उपयोग करक छवि स पाठ पढना कितना आसान ह।
एक लाइन
// Read text from an image in one line
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
// Read text from an image in one line
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
' Read text from an image in one line
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
विनयास योगय नमसत विशव
// PM> Install-Package IronOCR.Languages.Hindi
using IronOcr;
var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;
// Initialize an OCR input object
using (var Input = new OcrInput()){
// Add an image to the OCR input
Input.AddImage("images/sample.jpeg");
// You can add any number of images
var Result = Ocr.Read(Input);
// Output the text read from image
Console.WriteLine(Result.Text);
}
// PM> Install-Package IronOCR.Languages.Hindi
using IronOcr;
var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;
// Initialize an OCR input object
using (var Input = new OcrInput()){
// Add an image to the OCR input
Input.AddImage("images/sample.jpeg");
// You can add any number of images
var Result = Ocr.Read(Input);
// Output the text read from image
Console.WriteLine(Result.Text);
}
' PM> Install-Package IronOCR.Languages.Hindi
Imports IronOcr
Private Ocr = New IronTesseract()
' Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi
' Initialize an OCR input object
Using Input = New OcrInput()
' Add an image to the OCR input
Input.AddImage("images/sample.jpeg")
' You can add any number of images
Dim Result = Ocr.Read(Input)
' Output the text read from image
Console.WriteLine(Result.Text)
End Using
सी # पीडीएफ ओसीआर
इसी तरह क दषटिकोण का उपयोग किसी भी पीडीएफ दसतावज स पाठ निकालन क लिए किया जा सकता ह।
using IronOcr;
var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;
using (var input = new OcrInput())
{
// Add PDF file to the input. Specify password if required
input.AddPdf("example.pdf", "password");
// हम OCR क लिए विशिषट PDF पज सखयाए भी चन सकत ह
var Result = Ocr.Read(input);
// Output the text read from PDF
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages"); // Print number of pages
}
using IronOcr;
var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;
using (var input = new OcrInput())
{
// Add PDF file to the input. Specify password if required
input.AddPdf("example.pdf", "password");
// हम OCR क लिए विशिषट PDF पज सखयाए भी चन सकत ह
var Result = Ocr.Read(input);
// Output the text read from PDF
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages"); // Print number of pages
}
Imports IronOcr
Private Ocr = New IronTesseract()
' Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi
Using input = New OcrInput()
' Add PDF file to the input. Specify password if required
input.AddPdf("example.pdf", "password")
' हम OCR क लिए विशिषट PDF पज सखयाए भी चन सकत ह
Dim Result = Ocr.Read(input)
' Output the text read from PDF
Console.WriteLine(Result.Text)
Console.WriteLine($"{Result.Pages.Count()} Pages") ' Print number of pages
End Using
मलटीपज टीआईएफएस क लिए ओसीआर
कई पषठ दसतावजो सहित ओसीआर रीडिग झगडा फाइल परारप। TIFF को सीध पीडीएफ फाइल म खोज जा सकन वाल टकसट क साथ बदला जा सकता ह।
using IronOcr;
var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;
using (var Input = new OcrInput()){
// Add a multi-frame TIFF to the input
Input.AddMultiFrameTiff("multi-frame.tiff");
var Result = Ocr.Read(Input);
// Output the text read from TIFF
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;
using (var Input = new OcrInput()){
// Add a multi-frame TIFF to the input
Input.AddMultiFrameTiff("multi-frame.tiff");
var Result = Ocr.Read(Input);
// Output the text read from TIFF
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
' Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi
Using Input = New OcrInput()
' Add a multi-frame TIFF to the input
Input.AddMultiFrameTiff("multi-frame.tiff")
Dim Result = Ocr.Read(Input)
' Output the text read from TIFF
Console.WriteLine(Result.Text)
End Using
बारकोड और कयआर
आयरन ओसीआर की एक अनठी विशषता यह ह कि यह दसतावजो स बारकोड और कयआर कोड पढ सकता ह जबकि यह पाठ क लिए सकन कर रहा ह। OcrResult.OcrBarcode
Class क उदाहरण डवलपर को परतयक सकन किए गए बारकोड क बार म विसतत जानकारी दत ह।
using IronOcr;
var Ocr = new IronTesseract();
// Enable barcode reading configuration
Ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
// Add an image containing a barcode to the input
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
// Loop through all barcodes read from the image
foreach (var Barcode in Result.Barcodes)
{
// Output the value of each barcode
Console.WriteLine(Barcode.Value);
// परकार और सथान क गण भी उजागर हए
}
}
using IronOcr;
var Ocr = new IronTesseract();
// Enable barcode reading configuration
Ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
// Add an image containing a barcode to the input
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
// Loop through all barcodes read from the image
foreach (var Barcode in Result.Barcodes)
{
// Output the value of each barcode
Console.WriteLine(Barcode.Value);
// परकार और सथान क गण भी उजागर हए
}
}
Imports IronOcr
Private Ocr = New IronTesseract()
' Enable barcode reading configuration
Ocr.Configuration.ReadBarCodes = True
Using input = New OcrInput()
' Add an image containing a barcode to the input
input.AddImage("img/Barcode.png")
Dim Result = Ocr.Read(input)
' Loop through all barcodes read from the image
For Each Barcode In Result.Barcodes
' Output the value of each barcode
Console.WriteLine(Barcode.Value)
' परकार और सथान क गण भी उजागर हए
Next Barcode
End Using
छवियो क विशिषट कषतरो पर ओसीआर
आयरन ओसीआर क सभी सकनिग और रीडिग मथडस यह निरदिषट करत ह कि हम जिस पज या पज स टकसट पढना चाहत ह, उसका कौन सा हिससा ठीक ह। यह बहत उपयोगी ह जब हम मानकीकत रपो को दख रह ह और एक भयानक समय बचा सकत ह और दकषता म सधार कर सकत ह।
फसल कषतरो का उपयोग करन क लिए, हम System.Drawing
लिए एक सिसटम सदरभ जोडना होगा ताकि हम System.Drawing.Rectangle
ऑबजकट का उपयोग कर सक।
using IronOcr;
using System.Drawing;
var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;
using (var Input = new OcrInput())
{
// Define the rectangle area for OCR within the image
var ContentArea = new Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// आयाम px म ह
Input.Add("document.png", ContentArea);
var Result = Ocr.Read(Input);
// Output the text read within the specified area
Console.WriteLine(Result.Text);
}
using IronOcr;
using System.Drawing;
var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;
using (var Input = new OcrInput())
{
// Define the rectangle area for OCR within the image
var ContentArea = new Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// आयाम px म ह
Input.Add("document.png", ContentArea);
var Result = Ocr.Read(Input);
// Output the text read within the specified area
Console.WriteLine(Result.Text);
}
Imports IronOcr
Imports System.Drawing
Private Ocr = New IronTesseract()
' Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi
Using Input = New OcrInput()
' Define the rectangle area for OCR within the image
Dim ContentArea = New Rectangle() With {
.X = 215,
.Y = 1250,
.Height = 280,
.Width = 1335
}
' आयाम px म ह
Input.Add("document.png", ContentArea)
Dim Result = Ocr.Read(Input)
' Output the text read within the specified area
Console.WriteLine(Result.Text)
End Using
निमन गणवतता वाल सकन क लिए ओसीआर
लौह ओसीआर OcrInput
वरग सकन को ठीक कर सकता ह जो सामानय OcrInput
नही पढ सकता ह।
using IronOcr;
var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
// Correct digital noise and poor scanning artifacts
Input.DeNoise();
// Correct rotations and perspective distortions
Input.Deskew();
var Result = Ocr.Read(Input);
// Output the text read from the low-quality scan
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
// Correct digital noise and poor scanning artifacts
Input.DeNoise();
// Correct rotations and perspective distortions
Input.Deskew();
var Result = Ocr.Read(Input);
// Output the text read from the low-quality scan
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
' Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi
Using Input = New OcrInput("img\Potter.LowQuality.tiff")
' Correct digital noise and poor scanning artifacts
Input.DeNoise()
' Correct rotations and perspective distortions
Input.Deskew()
Dim Result = Ocr.Read(Input)
' Output the text read from the low-quality scan
Console.WriteLine(Result.Text)
End Using
निरयात OCR एक खोजा पीडीएफ क रप म परिणाम ह
परतिलिपि करन योगय पाठ सटरिग क साथ पीडीएफ क लिए छवि। खोज इजन और डटाबस दवारा अनकरमित किया जा सकता ह।
using IronOcr;
var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;
using (var Input = new OcrInput()){
// Set the title for the PDF
Input.Title = "Quarterly Report";
Input.AddImage("image1.jpeg");
Input.AddImage("image2.png");
Input.AddImage("image3.gif");
var Result = Ocr.Read(input);
// Save the result as a searchable PDF
Result.SaveAsSearchablePdf("searchable.pdf");
}
using IronOcr;
var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;
using (var Input = new OcrInput()){
// Set the title for the PDF
Input.Title = "Quarterly Report";
Input.AddImage("image1.jpeg");
Input.AddImage("image2.png");
Input.AddImage("image3.gif");
var Result = Ocr.Read(input);
// Save the result as a searchable PDF
Result.SaveAsSearchablePdf("searchable.pdf");
}
Imports IronOcr
Private Ocr = New IronTesseract()
' Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi
Using Input = New OcrInput()
' Set the title for the PDF
Input.Title = "Quarterly Report"
Input.AddImage("image1.jpeg")
Input.AddImage("image2.png")
Input.AddImage("image3.gif")
Dim Result = Ocr.Read(input)
' Save the result as a searchable PDF
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
खोजा पीडीएफ रपातरण क लिए झगडा
सीध एक खोज योगय PDF पर TIFF दसतावज (या छवि फाइलो क किसी भी समह) को ल जाए, जिस इटरानट, वबसाइट और Google खोज इजन दवारा अनकरमित किया जा सकता ह।
using IronOcr;
var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;
using (var Input = new OcrInput()){
// Add a multi-frame TIFF
Input.AddMultiFrameTiff("example.tiff");
// Save OCR result as a searchable PDF
Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf");
}
using IronOcr;
var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;
using (var Input = new OcrInput()){
// Add a multi-frame TIFF
Input.AddMultiFrameTiff("example.tiff");
// Save OCR result as a searchable PDF
Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf");
}
Imports IronOcr
Private Ocr = New IronTesseract()
' Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi
Using Input = New OcrInput()
' Add a multi-frame TIFF
Input.AddMultiFrameTiff("example.tiff")
' Save OCR result as a searchable PDF
Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
End Using
HTML क रप म निरयात OCR परिणाम
ओसीआर छवि एकसएचटीएमएल रपातरण म।
using IronOcr;
var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;
using (var Input = new OcrInput()){
// Set HTML title
Input.Title = "Html Title";
Input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
// Save OCR result as HTML format
Result.SaveAsHocrFile("results.html");
}
using IronOcr;
var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;
using (var Input = new OcrInput()){
// Set HTML title
Input.Title = "Html Title";
Input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
// Save OCR result as HTML format
Result.SaveAsHocrFile("results.html");
}
Imports IronOcr
Private Ocr = New IronTesseract()
' Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi
Using Input = New OcrInput()
' Set HTML title
Input.Title = "Html Title"
Input.AddImage("image1.jpeg")
Dim Result = Ocr.Read(input)
' Save OCR result as HTML format
Result.SaveAsHocrFile("results.html")
End Using
ओसीआर इमज एनहासमट फिलटर
IronOCR OCR परदरशन को बहतर बनान क लिए OcrInput
ऑबजकट क लिए अदवितीय फिलटर परदान करता ह।
इमज एनहासमट कोड उदाहरण
OCR इनपट छवियो को बहतर, तज OCR परिणामो का उतपादन करन क लिए उचच गणवतता बनाता ह।
using IronOcr;
var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
// Correct digital noise and poor scanning artifacts
Input.DeNoise();
// Correct rotations and perspective distortions
Input.Deskew();
var Result = Ocr.Read(Input);
// Output the text read from the low-quality image
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
// Correct digital noise and poor scanning artifacts
Input.DeNoise();
// Correct rotations and perspective distortions
Input.Deskew();
var Result = Ocr.Read(Input);
// Output the text read from the low-quality image
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
' Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi
Using Input = New OcrInput("LowQuality.jpeg")
' Correct digital noise and poor scanning artifacts
Input.DeNoise()
' Correct rotations and perspective distortions
Input.Deskew()
Dim Result = Ocr.Read(Input)
' Output the text read from the low-quality image
Console.WriteLine(Result.Text)
End Using
ओसीआर छवि फिलटर की सची
OCR परदरशन बढान क लिए इनपट फिलटर जो कि IronOCR म बनाए गए ह, शामिल ह:
- OcrInput.Rotate (डबल डिगरी) - कई डिगरी दकषिणावरत छवियो को घमाता ह। विरोधी दकषिणावरत क लिए, नकारातमक सखयाओ का उपयोग कर।
- OcrInput.Binarize () - यह छवि फिलटर हर पिकसल को बिना किसी मधय मदान क काला या सफद कर दता ह। पषठभमि क पाठ क बहत कम विपरीत OCR परदरशन मामलो म सधार कर सकत ह।
- OcrInput.ToGrayScale () - यह छवि फिलटर हर पिकसल को गरसकल की छाया म बदल दता ह। OCR सटीकता म सधार करन क लिए परी तरह स लकिन गति म सधार हो सकता ह
- OcrInput.Contrast () - सवचालित रप स इसक विपरीत बढता ह। यह फिलटर अकसर कम विपरीत सकन म ओसीआर गति और सटीकता म सधार करता ह।
- OcrInput.DeNoise () - डिजिटल शोर को हटाता ह। इस फिलटर का उपयोग कवल वही किया जाना चाहिए, जहा शोर होन की उममीद हो।
- OcrInput.Invert () - हर रग म इनवरट करता ह। जस सफद काला हो जाता ह: काला सफद हो जाता ह।
- OcrInput.Dilate () - उननत आकति विजञान। Dilation एक छवि म वसतओ की सीमाओ म पिकसल जोडता ह। इरोड क विपरीत
- OcrInput.Erode () - उननत आकति विजञान। कटाव वसत सीमाओ पर पिकसल को हटा दता ह
- OcrInput.Deskew () - एक छवि को घमाता ह इसलिए यह सही तरीक स ऊपर और ऑरथोगोनल ह। यह ओसीआर क लिए बहत उपयोगी ह कयोकि तिरछी सकन क लिए टसरकट सहिषणता 5 डिगरी स कम हो सकती ह।
- OcrInput.DeepCleanBackgroundNoise () - भारी पषठभमि शोर को हटान। कवल इस फिलटर का उपयोग कर यदि चरम दसतावज पषठभमि शोर जञात ह, कयोकि यह फिलटर सवचछ दसतावजो की ओसीआर सटीकता को कम करन का जोखिम भी लगा, और बहत सीपीय महगा ह।
- OcrInput.EnhanceResolution - निमन गणवतता वाल चितरो क सकलप को बढाता ह। यह फिलटर अकसर आवशयक नही होता ह कयोकि OcrInput.MinimumDPI और OcrInput.TargetDPI सवचालित रप स कम रिजॉलयशन इनपट को पकडग और हल करग।
CleanBackgroundNoise। यह एक सटिग ह जो कछ समय लन वाली ह; हालाकि, यह लाइबररी को डिजिटल छवि क भीतर डिजिटल शोर, पपर crumples, और अनय खामियो को सवचालित रप स साफ करन की अनमति दता ह जो अनयथा इस अनय OCR पसतकालयो दवारा पढ जान म असमरथ बना दता ह।
एनहासकटरासट एक ऐसी सटिग ह जो आयरन ओसीआर को छवि की पषठभमि क खिलाफ सवचालित रप स पाठ क विपरीत को बढान का कारण बनता ह, जिसस ओसीआर की सटीकता बढ जाती ह और आमतौर पर परदरशन और ओसीआर की गति बढ जाती ह।
EnhanceResolution एक सटिग ह जो सवचालित रप स कम-रिजॉलयशन छवियो (जो 275 डीपीआई क अतरगत ह) का पता लगाएगा और सवचालित रप स छवि को अपसकल करगा और फिर सभी पाठ को तज कर दगा ताकि यह एक ओसीआर लाइबररी दवारा परी तरह स पढा जा सक। यदयपि यह ऑपरशन अपन आप म समय लन वाला ह, यह आमतौर पर एक छवि पर ओसीआर ऑपरशन क लिए समगर समय को कम करता ह।
भाषा आयरन ओसीआर 22 अतरराषटरीय भाषा पक का समरथन करता ह, और भाषा सटिग का उपयोग एक ओसीआर ऑपरशन क लिए लाग की जान वाली एक या अधिक भाषाओ का चयन करन क लिए किया जा सकता ह।
रणनीति आयरन ओसीआर दो रणनीतियो का समरथन करता ह। हम या तो किसी दसतावज क तज और कम सटीक सकन क लिए जा सकत ह, या एक उननत रणनीति का उपयोग कर सकत ह जो शबदो म एक दसर स वाकयो क साखयिकीय सबध को दखकर OCR पाठ की सटीकता को सवचालित रप स सधारन क लिए कछ कतरिम बदधिमतता मॉडल का उपयोग करता ह। ।
कलरसपस एक सटिग ह जिसक तहत हम गरसकल या रग म ओसीआर चन सकत ह। आम तौर पर, गरसकल सबस अचछा विकलप ह। हालाकि, कभी-कभी जब समान रग क गरथ या पषठभमि होत ह लकिन बहत अलग रग होत ह, तो एक परण-रग का रग बहतर परिणाम परदान करगा।
DetectWhiteTextOnDarkBackgrounds। आम तौर पर, सभी ओसीआर पसतकालयो को सफद पषठभमि पर काला पाठ दखन की उममीद ह। यह सटिग आयरन ओसीआर को सवचालित रप स नकारातमक पाठ, या सफद पाठ क साथ अधर पषठो का पता लगान और उनह पढन की अनमति दती ह।
InputImageType। यह सटिग डवलपर को ओसीआर लाइबररी का मारगदरशन करन की अनमति दती ह, चाह वह एक परण दसतावज या एक सनिपट जस सकरीनशॉट क रप म दख रही हो।
रोटटएडसटरीमन एक उननत सटिग ह जो आयरन ओसीआर को दसतावजो को पढन की अनठी कषमता परदान करता ह जो न कवल घमाए जात ह, बलकि शायद परिपरकषय भी होत ह, जस कि पाठ दसतावजो की तसवीर।
ReadBarcodes एक उपयोगी सविधा ह जो आयरन OCR को पषठो पर सवचालित रप स बारकोड और कयआर कोड पढन की अनमति दता ह कयोकि यह पाठ को भी पढता ह, बिना एक अतिरिकत अतिरिकत बोझ डाल।
रग की गहराई। यह सटिग निरधारित करता ह कि रग की गहराई निरधारित करन क लिए ओसीआर पसतकालय परति पिकसल कितन बिटस का उपयोग करगा। एक उचच रग गहराई OCR गणवतता को बढा सकती ह, लकिन OCR ऑपरशन को परा करन क लिए आवशयक समय को भी बढाएगी।
126 भाषा पक
आयरन OCR भाषा पक क माधयम स 126 अतरराषटरीय भाषाओ का समरथन करता ह, जिनह DLL क रप म वितरित किया जाता ह, जिस इस वबसाइट स या NuGet Package Manager स भी डाउनलोड किया जा सकता ह।
भाषाओ म जरमन, फरच, अगरजी, चीनी, जापानी और कई शामिल ह। पासपोरट एमआरजड, एमआईसीआर चक, फाइनशियल डटा, लाइसस पलट और कई और अधिक क लिए विशषजञ भाषा पक मौजद ह। आप किसी भी tesseract ".traineddata" फाइल का उपयोग कर सकत ह - जिसम आप सवय बनात ह।
भाषा उदाहरण
अनय ओसीआर भाषाओ का उपयोग करना।
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic
var Ocr = new IronTesseract();
// Set the OCR language to Arabic
Ocr.Language = OcrLanguage.Arabic;
using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// यदि आवशयक हो तो छवि फिलटर जोड
// इस मामल म, यहा तक कि सोचा इनपट बहत कम गणवतता वाला ह
// IronTesseract पढ सकता ह कि पारपरिक Tesseract कया नही कर सकता।
var Result = Ocr.Read(input);
// Save the Arabic text to a file since console may not print Arabic correctly
Result.SaveAsTextFile("arabic.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic
var Ocr = new IronTesseract();
// Set the OCR language to Arabic
Ocr.Language = OcrLanguage.Arabic;
using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// यदि आवशयक हो तो छवि फिलटर जोड
// इस मामल म, यहा तक कि सोचा इनपट बहत कम गणवतता वाला ह
// IronTesseract पढ सकता ह कि पारपरिक Tesseract कया नही कर सकता।
var Result = Ocr.Read(input);
// Save the Arabic text to a file since console may not print Arabic correctly
Result.SaveAsTextFile("arabic.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.Arabic
Dim Ocr = New IronTesseract()
' Set the OCR language to Arabic
Ocr.Language = OcrLanguage.Arabic
Using input = New OcrInput()
input.AddImage("img/arabic.gif")
' यदि आवशयक हो तो छवि फिलटर जोड
' इस मामल म, यहा तक कि सोचा इनपट बहत कम गणवतता वाला ह
' IronTesseract पढ सकता ह कि पारपरिक Tesseract कया नही कर सकता।
Dim Result = Ocr.Read(input)
' Save the Arabic text to a file since console may not print Arabic correctly
Result.SaveAsTextFile("arabic.txt")
End Using
एकाधिक भाषा उदाहरण
एक ही समय म कई भाषाओ का उपयोग करक ओसीआर करना भी सभव ह। यह वासतव म यनिकोड दसतावजो म अगरजी भाषा मटाडटा और यआरएल परापत करन म मदद कर सकता ह।
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified
var Ocr = new IronTesseract();
// Set primary language to Simplified Chinese
Ocr.Language = OcrLanguage.ChineseSimplified;
// Add Hindi as a secondary language
Ocr.AddSecondaryLanguage(OcrLanguage.Hindi);
// हम कितनी भी भाषाए जोड सकत ह
using (var input = new OcrInput())
{
input.Add("multi-language.pdf");
var Result = Ocr.Read(input);
// Save the multilingual text to a file
Result.SaveAsTextFile("results.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified
var Ocr = new IronTesseract();
// Set primary language to Simplified Chinese
Ocr.Language = OcrLanguage.ChineseSimplified;
// Add Hindi as a secondary language
Ocr.AddSecondaryLanguage(OcrLanguage.Hindi);
// हम कितनी भी भाषाए जोड सकत ह
using (var input = new OcrInput())
{
input.Add("multi-language.pdf");
var Result = Ocr.Read(input);
// Save the multilingual text to a file
Result.SaveAsTextFile("results.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.ChineseSimplified
Dim Ocr = New IronTesseract()
' Set primary language to Simplified Chinese
Ocr.Language = OcrLanguage.ChineseSimplified
' Add Hindi as a secondary language
Ocr.AddSecondaryLanguage(OcrLanguage.Hindi)
' हम कितनी भी भाषाए जोड सकत ह
Using input = New OcrInput()
input.Add("multi-language.pdf")
Dim Result = Ocr.Read(input)
' Save the multilingual text to a file
Result.SaveAsTextFile("results.txt")
End Using
विसतत OCR परिणाम ऑबजकट
आयरन OCR परतयक OCR ऑपरशन क लिए OCR परिणाम वसत दता ह। आमतौर पर, डवलपर कवल छवि स सकन किए गए टकसट को परापत करन क लिए इस ऑबजकट की टकसट सपतति का उपयोग करत ह। हालाकि, OCR परिणाम DOM इसस कही अधिक उननत ह।
using IronOcr;
using System.Drawing;
var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;
// Configuration settings
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true;
using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages[0].Words; // Access words of the first page
var Barcodes = Result.Barcodes; // Access barcodes from the OCR result
// Explore the OCR result API for details such as:
// - Pages, Blocks, Paragraphs, Lines, Words, Characters
// - Image export, Fonts, Coordinates, Statistical data
}
using IronOcr;
using System.Drawing;
var Ocr = new IronTesseract();
// Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi;
// Configuration settings
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true;
using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages[0].Words; // Access words of the first page
var Barcodes = Result.Barcodes; // Access barcodes from the OCR result
// Explore the OCR result API for details such as:
// - Pages, Blocks, Paragraphs, Lines, Words, Characters
// - Image export, Fonts, Coordinates, Statistical data
}
Imports IronOcr
Imports System.Drawing
Private Ocr = New IronTesseract()
' Set the OCR language to Hindi
Ocr.Language = OcrLanguage.Hindi
' Configuration settings
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm
Ocr.Configuration.ReadBarCodes = True
Using Input = New OcrInput("images\sample.tiff")
Dim Result As OcrResult = Ocr.Read(Input)
Dim Pages = Result.Pages
Dim Words = Pages(0).Words ' Access words of the first page
Dim Barcodes = Result.Barcodes ' Access barcodes from the OCR result
' Explore the OCR result API for details such as:
' - Pages, Blocks, Paragraphs, Lines, Words, Characters
' - Image export, Fonts, Coordinates, Statistical data
End Using
परदरशन
आयरनओसीआर बॉकस स बाहर काम करता ह जिसम टयन क परदरशन की आवशयकता नही होती ह या इनपट छवियो को बहत अधिक सशोधित किया जाता ह।
गति धधक रही ह: IronOcr.2020 + 10 गना तज ह और पिछल बिलड की तलना म 250% कम तरटी करता ह।
और अधिक जान
OCR क बार म और अधिक जानन क लिए C #, VB, F #, या किसी भी अनय .NET भाषा म, कपया हमार समदाय टयटोरियल पढ, जो इस बात का वासतविक उदाहरण दत ह कि आयरन OCR का उपयोग कस किया जा सकता ह और इस बात की बारीकियो को दिखा सकता ह कि परीकषा स बाहर कस जाए यह पसतकालय।
.NET डवलपरस क लिए एक परण ऑबजकट सदरभ भी उपलबध ह।