સી # અને .નેટ માં ગુજરાતી ઓ.સી.આર.

આ દસ્તાવેજના અન્ય સંસ્કરણો:

આયર્નઓસીઆર એ સી # સ softwareફ્ટવેર ઘટક છે. NET કોડર્સ છબીઓ અને પીડીએફ દસ્તાવેજોમાંથી ટેક્સ્ટને 126 ભાષામાં ગુજરાતી સહિત વાંચવા માટે પરવાનગી આપે છે.

તે ટેસરેક્ટનો એક અદ્યતન કાંટો છે, જે ફક્ત. નેટ વિકાસકર્તાઓ માટે જ બનાવવામાં આવ્યો છે અને નિયમિતપણે ઝડપ અને ચોકસાઈ બંને માટે અન્ય ટેસ્સેરેક્ટ એન્જિનોને આઉટપર્ફોર્મ કરે છે.

IronOcr.Languages.Gujarati ના સમાવિષ્ટો

આ પેકેજમાં નેટ. માટે 120 ઓસીઆર ભાષાઓ શામેલ છે:

  • ગુજરાતી
  • ગુજરાતીબેસ્ટ
  • ગુજરાતીફાસ્ટ
  • ગુજરાતીઅલ્ફાબેટ
  • ગુજરાતીઅલ્ફાબેટબેસ્ટ
  • ગુજરાતીઅલ્ફાબેટ ફાસ્ટ

ડાઉનલોડ કરો

ગુજરાતી ભાષા પ Packક [ગુજરાતી]
* Download as ઝિપ
* Install with as
https://www.nuget.org/packages/IronOcr.Languages.Gujarati/'> ન્યુગેટ

સ્થાપન

આપણે જે કરવાનું છે તે પ્રથમ વસ્તુ તમારા. નેટ પ્રોજેક્ટ પર અમારા ગુજરાતી ઓસીઆર પેકેજને ઇન્સ્ટોલ કરવાની છે.

PM> Install-Package IronOCR.Languages.Gujarati

કોડ ઉદાહરણ

આ સી # કોડ ઉદાહરણ છબી અથવા પીડીએફ દસ્તાવેજમાંથી ગુજરાતી લખાણ વાંચે છે.

//PM> Install-Package IronOcr.Languages.Gujarati
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;
using (var Input = new OcrInput(@"images\Gujarati.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
//PM> Install-Package IronOcr.Languages.Gujarati
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;
using (var Input = new OcrInput(@"images\Gujarati.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
'PM> Install-Package IronOcr.Languages.Gujarati
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Gujarati
Using Input = New OcrInput("images\Gujarati.png")
Dim Result = Ocr.Read(Input)
Dim AllText As Var = Result.Text
End Using
VB   C#

આયર્નઓસીઆર કેમ પસંદ કરો?

આયર્ન ઓસીઆર એ એક સ્થાપિત કરવા માટે સરળ, સંપૂર્ણ અને સારી રીતે દસ્તાવેજીકૃત. નેટ સોફ્ટવેર લાઇબ્રેરી છે.

કોઈપણ બાહ્ય વેબ સેવાઓનો ઉપયોગ કર્યા વિના, ચાલુ ફી અથવા ઇન્ટરનેટ ઉપર ગુપ્ત દસ્તાવેજો મોકલ્યા વિના 99.8% + OCR ચોકસાઈ મેળવવા માટે આયર્નઓસીઆર પસંદ કરો.

સી # ડેવલપર્સ વેનિલા પરીક્ષણ પર આયર્નઓસીઆર કેમ પસંદ કરે છે:

  • એકલ DLL અથવા નુગેટ તરીકે સ્થાપિત કરો
  • બ ofક્સની બહાર પરીક્ષણ 5, 4 અને 3 એન્જિન્સ માટે શામેલ છે.
  • ચોકસાઈ 99.8% નિયમિત પરીક્ષણને નોંધપાત્ર પ્રદર્શન કરે છે.
  • બ્લીઝિંગ સ્પીડ અને મલ્ટિ થ્રેડિંગ
  • એમવીસી, વેબ એપ, ડેસ્કટ .પ, કન્સોલ અને સર્વર એપ્લિકેશન સુસંગત છે
  • સાથે કામ કરવા માટે કોઈ એક્ઝ અથવા સી ++ કોડ નથી
  • સંપૂર્ણ પીડીએફ ઓસીઆર સપોર્ટ
  • લગભગ કોઈપણ છબી ફાઇલ અથવા પીડીએફને ઓસીઆર કરવા માટે
  • સંપૂર્ણ. નેટ કોર, સ્ટાન્ડર્ડ અને ફ્રેમવર્ક સપોર્ટ
  • વિંડોઝ, મ ,ક, લિનક્સ, એઝ્યુર, ડોકર, લેમ્બડા, એડબ્લ્યુએસ પર જમાવટ કરો
  • બારકોડ અને ક્યૂઆર કોડ વાંચો
  • એક્સએચટીએમએલ તરીકે ઓસીઆર નિકાસ કરો
  • શોધવા યોગ્ય પીડીએફ દસ્તાવેજો પર ઓસીઆર નિકાસ કરો
  • મલ્ટિથ્રિડિંગ સપોર્ટ
  • 126 આંતરરાષ્ટ્રીય ભાષાઓ બધી નુગેટ અથવા cક્રેટા ડેટા ફાઇલો દ્વારા સંચાલિત
  • છબીઓ, સંકલન, આંકડા અને ફોન્ટ્સ કા Fો. માત્ર લખાણ જ નહીં.
  • વેપારી અને માલિકીની એપ્લિકેશંસની અંદર પરીક્ષણ ઓસીઆરને ફરીથી વિતરિત કરવા માટે વાપરી શકાય છે.

વાસ્તવિક વિશ્વની છબીઓ અને ફોટોગ્રાફ્સ જેવા અપૂર્ણ દસ્તાવેજો અથવા ડિજિટલ અવાજ અથવા અપૂર્ણતા હોઈ શકે તેવા નિમ્ન રિઝોલ્યુશનના સ્કેન સાથે કામ કરતી વખતે આયર્ન ઓસીઆર ચમકતો હોય છે.

. નેટ પ્લેટફોર્મ માટે અન્ય નિ: શુલ્ક ઓસીઆર લાઇબ્રેરીઓ જેમ કે અન્ય. નેટ ટેસ્સેરેટ એપીઆઇ અને વેબ સેવાઓ આ વાસ્તવિક વિશ્વના ઉપયોગના કેસો પર એટલું સારું પ્રદર્શન કરતી નથી.

પરીક્ષણ 5 સાથેના ઓસીઆર - સી # માં કોડિંગ પ્રારંભ કરો

નીચે આપેલ કોડ નમૂના બતાવે છે કે સી # અથવા વીબી .NET નો ઉપયોગ કરીને છબીમાંથી ટેક્સ્ટ વાંચવું કેટલું સરળ છે.

વનલાઈનર

string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
VB   C#

હેલ્લો વર્લ્ડ રૂપરેખાંકિત

// PM> Install-Package IronOCR.Languages.Gujarati
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... તમે કોઈપણ સંખ્યામાં છબીઓ ઉમેરી શકો છો
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
// PM> Install-Package IronOCR.Languages.Gujarati
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... તમે કોઈપણ સંખ્યામાં છબીઓ ઉમેરી શકો છો
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
' PM> Install-Package IronOCR.Languages.Gujarati
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Gujarati
Using Input = New OcrInput()
Input.AddImage("images/sample.jpeg") var Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

સી # પીડીએફ ઓસીઆર

કોઈ પણ પીડીએફ દસ્તાવેજમાંથી ટેક્સ્ટ કાractવા માટે સમાન અભિગમનો ઉપયોગ કરી શકાય છે.

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// અમે ઓસીઆર પર વિશિષ્ટ પીડીએફ પૃષ્ઠ નંબરો પણ પસંદ કરી શકીએ છીએ

var Result = Ocr.Read(input);

Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// પીડીએફના દરેક પૃષ્ઠ માટે 1 પૃષ્ઠ
}
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// અમે ઓસીઆર પર વિશિષ્ટ પીડીએફ પૃષ્ઠ નંબરો પણ પસંદ કરી શકીએ છીએ

var Result = Ocr.Read(input);

Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// પીડીએફના દરેક પૃષ્ઠ માટે 1 પૃષ્ઠ
}
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Gujarati
Using input = New OcrInput()
input.AddPdf("example.pdf", "password")
' અમે ઓસીઆર પર વિશિષ્ટ પીડીએફ પૃષ્ઠ નંબરો પણ પસંદ કરી શકીએ છીએ

Dim Result = Ocr.Read(input)

Console.WriteLine(Result.Text)
Console.WriteLine($"{Result.Pages.Count()} Pages")
' પીડીએફના દરેક પૃષ્ઠ માટે 1 પૃષ્ઠ
End Using
VB   C#

મલ્ટિપેજ ટીઆઈએફએફ માટે ઓસીઆર

OCR રીડિંગ TIFF ફાઇલ ફોર્મેટ સહિત અનેક પૃષ્ઠ દસ્તાવેજો. ટીઆઈએફએફને સીધા પીડીએફ ફાઇલમાં પણ શોધી શકાય તેવા ટેક્સ્ટ સાથે રૂપાંતરિત કરી શકાય છે.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Gujarati

Using Input = New OcrInput()
input.AddMultiFrameTiff("multi - frame.tiff")
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

બારકોડ્સ અને ક્યૂઆર

આયર્ન ઓસીઆરની એક વિશિષ્ટ સુવિધા એ છે કે જ્યારે તે ટેક્સ્ટને સ્કેન કરે છે ત્યારે તે દસ્તાવેજોમાંથી બારકોડ અને ક્યૂઆર કોડ વાંચી શકે છે. OcrResult.OcrBarcode વર્ગના ઉદાહરણો વિકાસકર્તાને દરેક સ્કેન કરેલા બારકોડ વિશે વિગતવાર માહિતિ આપે છે.

// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// પ્રકાર અને સ્થાન ગુણધર્મો પણ ખુલ્લી
}
}
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;

using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// પ્રકાર અને સ્થાન ગુણધર્મો પણ ખુલ્લી
}
}
' using IronOcr;
Dim Ocr = New IronTesseract()
Ocr.Configuration.ReadBarCodes = True

Using input = New OcrInput()
input.AddImage("img/Barcode.png")
Dim Result = Ocr.Read(input)
For Each Barcode In Result.Barcodes
Console.WriteLine(Barcode.Value)
' પ્રકાર અને સ્થાન ગુણધર્મો પણ ખુલ્લી
Next Barcode
End Using
VB   C#

છબીઓના વિશિષ્ટ ક્ષેત્રો પર ઓસીઆર

આયર્ન ઓસીઆરની બધી સ્કેનીંગ અને વાંચવાની પદ્ધતિઓ પૃષ્ઠ અથવા પૃષ્ઠોના કયા ભાગમાંથી આપણે ટેક્સ્ટ વાંચવા માંગીએ છીએ તે ચોક્કસપણે સ્પષ્ટ કરવાની ક્ષમતા પ્રદાન કરે છે. જ્યારે અમે પ્રમાણિત સ્વરૂપો જોઈએ છીએ ત્યારે આ ખૂબ ઉપયોગી છે અને ઘણું સમય બચાવી શકીએ છીએ અને કાર્યક્ષમતામાં સુધારો કરી શકીએ છીએ.

પાકના પ્રદેશોનો ઉપયોગ કરવા માટે, આપણે System.Drawing માટે સિસ્ટમ સંદર્ભ ઉમેરવાની જરૂર પડશે જેથી આપણે System.Drawing.Rectangle object System.Drawing.Rectangle ઉપયોગ કરી શકીએ.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;

using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// પરિમાણો px માં છે

Input.Add("document.png", ContentArea);

var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;

using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// પરિમાણો px માં છે

Input.Add("document.png", ContentArea);

var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Gujarati

Using Input = New OcrInput()
Dim ContentArea = New System.Drawing.Rectangle() With {
	.X = 215,
	.Y = 1250,
	.Height = 280,
	.Width = 1335
}
' પરિમાણો px માં છે

Input.Add("document.png", ContentArea)

Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

ઓછી ગુણવત્તાવાળા સ્કેન માટે ઓ.સી.આર.

આયર્ન ઓસીઆર OcrInput વર્ગ સ્કેનને ઠીક કરી શકે છે જે સામાન્ય OcrInput વાંચી શકતું નથી.

using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // ડિજિટલ અવાજ અને નબળા સ્કેનીંગને સુધારે છે
Input.Deskew(); // પરિભ્રમણ અને પરિપ્રેક્ષ્યને સુધારે છે
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;

using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // ડિજિટલ અવાજ અને નબળા સ્કેનીંગને સુધારે છે
Input.Deskew(); // પરિભ્રમણ અને પરિપ્રેક્ષ્યને સુધારે છે
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Gujarati

Using Input = New OcrInput("img\Potter.LowQuality.tiff")
Input.DeNoise() ' ડિજિટલ અવાજ અને નબળા સ્કેનીંગને સુધારે છે
Input.Deskew() ' પરિભ્રમણ અને પરિપ્રેક્ષ્યને સુધારે છે
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

શોધના યોગ્ય પીડીએફ તરીકે ઓસીઆર પરિણામોને નિકાસ કરો

નકલ કરવા યોગ્ય ટેક્સ્ટ શબ્દમાળાઓ સાથે પીડીએફ પરની છબી. શોધ એંજીન અને ડેટાબેસેસ દ્વારા અનુક્રમિત કરી શકાય છે.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;

using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");

var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;

using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");

var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Gujarati

Using Input = New OcrInput()
input.Title = "Quarterly Report" input.AddImage("image1.jpeg")
input.AddImage("image2.png")
input.AddImage("image3.gif")

Dim Result = Ocr.Read(input)
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
VB   C#

TIFF પીડીએફ કન્વર્ઝન શોધી શકાય તેવું છે

ટીઆઈએફએફ દસ્તાવેજ (અથવા ઇમેજ ફાઇલોના કોઈપણ જૂથ) ને સીધા શોધી પીડીએફમાં કન્વર્ટ કરો જે ઇન્ટ્રાનેટ, વેબસાઇટ અને ગૂગલ સર્ચ એન્જીન દ્વારા અનુક્રમિત કરી શકાય છે.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;

using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Gujarati

Using Input = New OcrInput()
input.AddMultiFrameTiff("example.tiff") var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
End Using
VB   C#

HTML તરીકે OCR પરિણામો નિકાસ કરો

ઓસીઆર છબીથી એક્સએચટીએમએલ રૂપાંતર.

using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
using IronOcr;

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
Imports IronOcr

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Gujarati
Using Input = New OcrInput()
input.Title = "Html Title" input.AddImage("image1.jpeg")
Dim Result = Ocr.Read(input)
Result.SaveAsHocrFile("results.html")
End Using
VB   C#

OCR છબી વૃદ્ધિ ફિલ્ટર્સ

આયર્નઓસીઆર ઓસીઆર પ્રભાવને સુધારવા માટે OcrInput for OcrInput માટે અનન્ય ફિલ્ટર્સ OcrInput કરે છે.

છબી વૃદ્ધિ કોડ ઉદાહરણ

વધુ, ઝડપી ઓસીઆર પરિણામો ઉત્પન્ન કરવા માટે ઓસીઆર ઇનપુટ છબીઓને ઉચ્ચ ગુણવત્તા બનાવે છે.

using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // ડિજિટલ અવાજ અને નબળા સ્કેનીંગને સુધારે છે
Input.Deskew(); // પરિભ્રમણ અને પરિપ્રેક્ષ્યને સુધારે છે
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;

using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // ડિજિટલ અવાજ અને નબળા સ્કેનીંગને સુધારે છે
Input.Deskew(); // પરિભ્રમણ અને પરિપ્રેક્ષ્યને સુધારે છે
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Gujarati

Using Input = New OcrInput("LowQuality.jpeg")
Input.DeNoise() ' ડિજિટલ અવાજ અને નબળા સ્કેનીંગને સુધારે છે
Input.Deskew() ' પરિભ્રમણ અને પરિપ્રેક્ષ્યને સુધારે છે
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
VB   C#

OCR ઇમેજ ફિલ્ટર્સની સૂચિ

આયર્નઓસીઆર માં સમાયેલ ઓસીઆર પ્રભાવને વધારવા માટે ઇનપુટ ફિલ્ટર્સમાં શામેલ છે:

  • OcrInput.Rotate (ડબલ ડિગ્રી) - સંખ્યાબંધ ડિગ્રી દ્વારા ઘડિયાળની દિશામાં છબીઓ ફેરવે છે. એન્ટિ-ક્લોકવાઇઝ માટે, નકારાત્મક સંખ્યાઓનો ઉપયોગ કરો.
  • OcrInput.Binarize () - આ છબી ફિલ્ટર દરેક પિક્સેલને કાળો અથવા સફેદ કોઈ મધ્યમ ગ્રાઉન્ડ વગર ફેરવે છે. પૃષ્ઠભૂમિમાં ટેક્સ્ટના ખૂબ ઓછા વિરોધાભાસનાં OCR પ્રભાવનાં કેસોમાં સુધારો કરી શકે છે.
  • OcrInput.ToGrayScale () - આ ઇમેજ ફિલ્ટર દરેક પિક્સેલને ગ્રેસ્કેલની છાયામાં ફેરવે છે. OCR ચોકસાઈ સુધારવા માટે અસંભવિત છે પરંતુ ઝડપ સુધારી શકે છે
  • OcrInput.Contrast () - આપમેળે વિપરીતતામાં વધારો થાય છે. આ ફિલ્ટર ઘણીવાર નીચા વિપરીત સ્કેનમાં OCR ગતિ અને ચોકસાઈમાં સુધારો કરે છે.
  • OcrInput.DeNoise () - ડિજિટલ અવાજ દૂર કરે છે. અવાજની અપેક્ષા હોય ત્યાં જ આ ફિલ્ટરનો ઉપયોગ કરવો જોઈએ.
  • OcrInput.Invert () - દરેક રંગ .ંધી પાડે છે. દા.ત. સફેદ કાળો થાય છે: કાળો સફેદ થાય છે.
  • Cક્રિનપુટ.ડિલેટ () - એડવાન્સ્ડ મોર્ફોલોજી. ડિલેશન ઇમેજમાં પદાર્થોની સીમાઓ પર પિક્સેલ્સ ઉમેરે છે. ઇરોડની વિરુદ્ધ
  • OcrInput.Erode () - એડવાન્સ્ડ મોર્ફોલોજી. ઇરોશન objectબ્જેક્ટની સીમાઓ પર પિક્સેલ્સને દૂર કરે છે
  • Cક્રિનપુટ.ડેસ્ક્યુ () - એક છબી ફેરવે છે જેથી તે સાચી રીત ઉપર અને ઓર્થોગોનલ છે. આ ઓસીઆર માટે ખૂબ ઉપયોગી છે કારણ કે સ્ક્યુડ સ્કેન માટે ટેસ્સેરેટ સહિષ્ણુતા 5 ડિગ્રી જેટલી ઓછી હોઈ શકે છે.
  • Cક્રિનપુટ.દીપક્લિયનબેકગ્રાઉન્ડનોઇસ () - ભારે પૃષ્ઠભૂમિ અવાજ દૂર. આ ફિલ્ટરનો ઉપયોગ ફક્ત આત્યંતિક દસ્તાવેજની પૃષ્ઠભૂમિ અવાજને જાણીતા કિસ્સામાં જ થાય છે, કારણ કે આ ફિલ્ટર પણ સ્વચ્છ દસ્તાવેજોની OCR ચોકસાઈ ઘટાડવાનું જોખમ લેશે, અને તે ખૂબ સીપીયુ છે.
  • Cક્રિનપુટ.એન્હceન્સ રિઝોલ્યુશન - નીચી ગુણવત્તાવાળી છબીઓનું રીઝોલ્યુશન વધારે છે. આ ફિલ્ટરને ઘણીવાર આવશ્યકતા હોતી નથી કારણ કે cક્રિનપુટ.મિનિમમડીપીઆઇ અને cક્રિનપુટ.ટાર્ગેટડીપીઆઈ આપમેળે ઓછી રીઝોલ્યુશન ઇનપુટ્સને પકડશે અને તેને હલ કરશે.

ક્લીનબેકગ્રાઉન્ડનોઇસ. આ એક સેટિંગ છે જે કંઈક સમય માંગી લે છે; જો કે, તે લાઇબ્રેરીને ડિજિટલ ઇમેજની અંદર આપમેળે ડિજિટલ અવાજ, કાગળના ભંગાર અને અન્ય અપૂર્ણતાઓને સાફ કરવાની મંજૂરી આપે છે જે અન્ય ઓસીઆર લાઇબ્રેરીઓ દ્વારા વાંચવામાં અસમર્થ બનાવે છે.

એન્હેન્સકોન્ટ્રાસ્ટ એ એક સેટિંગ છે જે આયર્ન ઓસીઆરને છબીની પૃષ્ઠભૂમિ સામે આપમેળે ટેક્સ્ટનો વિરોધાભાસ વધારવા માટેનું કારણ બને છે, ઓસીઆરની ચોકસાઈ વધે છે અને સામાન્ય રીતે પ્રભાવ અને ઓસીઆરની ગતિમાં વધારો થાય છે.

એન્હેન્સરેઝોલ્યુશન એ એક સેટિંગ છે જે આપમેળે લો-રિઝોલ્યુશન છબીઓ (જે 275 ડીપીઆઈ હેઠળ છે) ને શોધી કા andશે અને આપમેળે છબીને અપસ્કલે કરશે અને પછી બધા ટેક્સ્ટને શાર્પ કરશે જેથી તે ઓસીઆર લાઇબ્રેરી દ્વારા સંપૂર્ણ રીતે વાંચી શકાય. જો કે આ કામગીરી પોતે સમય માંગી લેતી હોય છે, તે સામાન્ય રીતે એક છબી પરના ઓસીઆર ઓપરેશન માટેનો એકંદર સમય ઘટાડે છે.

ભાષા આયર્ન ઓસીઆર 22 આંતરરાષ્ટ્રીય ભાષાના પેકને સપોર્ટ કરે છે, અને ભાષા સેટિંગનો ઉપયોગ એક અથવા વધુ બહુવિધ ભાષાઓને ઓસીઆર ઓપરેશન માટે લાગુ કરવા માટે પસંદ કરવા માટે થઈ શકે છે.

સ્ટ્રેટેજી આયર્ન ઓસીઆર બે વ્યૂહરચનાને ટેકો આપે છે. અમે કાં તો દસ્તાવેજના ઝડપી અને ઓછા સચોટ સ્કેન માટે જવાનું પસંદ કરી શકીએ છીએ, અથવા એક વાક્યમાં શબ્દોના આંકડાકીય સંબંધોને જોઈને આપમેળે ઓસીઆર ટેક્સ્ટની ચોકસાઈ સુધારવા માટે કેટલાક કૃત્રિમ ગુપ્તચર મોડેલોનો ઉપયોગ કરીને અદ્યતન વ્યૂહરચનાનો ઉપયોગ કરી શકીએ છીએ. .

કલરસ્પેસ એ એક સેટિંગ છે જેના દ્વારા આપણે ગ્રેસ્કેલ અથવા રંગમાં OCR પસંદ કરી શકીએ છીએ. સામાન્ય રીતે, ગ્રેસ્કેલ એ શ્રેષ્ઠ વિકલ્પ છે. જો કે, કેટલીકવાર જ્યારે સમાન રંગની પાઠો અથવા બેકગ્રાઉન્ડ હોય છે પરંતુ ખૂબ જ ભિન્ન રંગ હોય છે, ત્યારે રંગનું સંપૂર્ણ સ્થાન વધુ સારા પરિણામ પ્રદાન કરશે.

વ્હાઇટટેક્સ્ટઓન ડાર્કબેકગ્રાઉન્ડ્સ શોધો. સામાન્ય રીતે, બધી ઓસીઆર લાઇબ્રેરીઓ સફેદ પૃષ્ઠભૂમિ પર કાળા ટેક્સ્ટ જોવાની અપેક્ષા રાખે છે. આ સેટિંગ આયર્ન ઓસીઆરને સફેદ ટેક્સ્ટવાળા નકારાત્મક અથવા શ્યામ પૃષ્ઠોને આપમેળે શોધી કા themવાની અને તેમને વાંચવાની મંજૂરી આપે છે.

ઇનપુટમેજ ટાઇપ. આ સેટિંગ વિકાસકર્તાને OCR લાઇબ્રેરીને માર્ગદર્શન આપવા માટે પરવાનગી આપે છે કે શું તે કોઈ સંપૂર્ણ દસ્તાવેજ અથવા સ્નિપેટ જોઈ રહ્યો છે, જેમ કે સ્ક્રીનશોટ.

રોટેટએન્ડસ્ટેરાઈન એ એક એડવાન્સ્ડ સેટિંગ છે જે આયર્ન ઓસીઆરને એવા દસ્તાવેજો વાંચવાની અનન્ય ક્ષમતાને મંજૂરી આપે છે જે ફક્ત ફેરવવામાં આવતા નથી, પરંતુ સંભવિત પરિમાણો ધરાવે છે, જેમ કે ટેક્સ્ટ દસ્તાવેજોના ફોટોગ્રાફ્સ.

રીડબાર્કોડ્સ એ એક ઉપયોગી સુવિધા છે જે આયર્ન ઓસીઆરને પૃષ્ઠો પર આપમેળે બારકોડ્સ અને ક્યૂઆર કોડ્સ વાંચવાની મંજૂરી આપે છે કારણ કે તે વધારાના સમયનો મોટો બોજો ઉમેર્યા વિના ટેક્સ્ટ પણ વાંચે છે.

કલરડેપ્થ. આ સેટિંગ નક્કી કરે છે કે રંગની depthંડાઈ નક્કી કરવા માટે, પિક્સેલ દીઠ કેટલા બિટ્સનો ઉપયોગ થશે. Colorંચી રંગની depthંડાઈ OCR ગુણવત્તામાં વધારો કરી શકે છે, પરંતુ OCR કામગીરી પૂર્ણ થવા માટે જરૂરી સમય પણ વધારશે.

126 ભાષા પેક

આયર્ન ઓસીઆર ભાષાના પેક દ્વારા 126 આંતરરાષ્ટ્રીય ભાષાઓને સમર્થન આપે છે જે ડીએલએલ તરીકે વિતરિત કરવામાં આવે છે, જે આ વેબસાઇટથી ડાઉનલોડ કરી શકાય છે, અથવા ન્યુગેટ પેકેજ મેનેજરમાંથી પણ .

ભાષાઓમાં જર્મન, ફ્રેન્ચ, અંગ્રેજી, ચાઇનીઝ, જાપાનીઝ અને વધુ શામેલ છે. પાસપોર્ટ એમઆરઝેડ, એમઆઈસીઆર ચકાસણી, નાણાકીય ડેટા, લાઇસન્સ પ્લેટો અને ઘણા વધુ માટે નિષ્ણાત ભાષાનું પેક છે. તમે કોઈપણ પરીક્ષણ ".ટ્રેઇનડેટા" ફાઇલનો ઉપયોગ કરી શકો છો - જેમાં તમે જાતે બનાવો છો.

ભાષા ઉદાહરણ

અન્ય ઓસીઆર ભાષાઓનો ઉપયોગ કરવો.

// using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// જો જરૂરી હોય તો ઇમેજ ફિલ્ટર્સ ઉમેરો
// આ કિસ્સામાં, વિચાર્યું પણ ઇનપુટ ખૂબ જ ઓછી ગુણવત્તાવાળી છે
// આયર્નટ્રેસરેક્ટ વાંચી શકે છે કે પરંપરાગત પરીક્ષણ શું કરી શકતું નથી.

var Result = Ocr.Read(input);

// કન્સોલ વિન્ડોઝ પર અરબી સરળતાથી છાપી શકતું નથી.
// ચાલો તેના બદલે ડિસ્ક પર સંગ્રહિત કરીએ.
Result.SaveAsTextFile("arabic.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;

using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// જો જરૂરી હોય તો ઇમેજ ફિલ્ટર્સ ઉમેરો
// આ કિસ્સામાં, વિચાર્યું પણ ઇનપુટ ખૂબ જ ઓછી ગુણવત્તાવાળી છે
// આયર્નટ્રેસરેક્ટ વાંચી શકે છે કે પરંપરાગત પરીક્ષણ શું કરી શકતું નથી.

var Result = Ocr.Read(input);

// કન્સોલ વિન્ડોઝ પર અરબી સરળતાથી છાપી શકતું નથી.
// ચાલો તેના બદલે ડિસ્ક પર સંગ્રહિત કરીએ.
Result.SaveAsTextFile("arabic.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.Arabic

Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Arabic

Using input = New OcrInput()
input.AddImage("img/arabic.gif")
' જો જરૂરી હોય તો ઇમેજ ફિલ્ટર્સ ઉમેરો
' આ કિસ્સામાં, વિચાર્યું પણ ઇનપુટ ખૂબ જ ઓછી ગુણવત્તાવાળી છે
' આયર્નટ્રેસરેક્ટ વાંચી શકે છે કે પરંપરાગત પરીક્ષણ શું કરી શકતું નથી.

Dim Result = Ocr.Read(input)

' કન્સોલ વિન્ડોઝ પર અરબી સરળતાથી છાપી શકતું નથી.
' ચાલો તેના બદલે ડિસ્ક પર સંગ્રહિત કરીએ.
Result.SaveAsTextFile("arabic.txt")
End Using
VB   C#

બહુવિધ ભાષા ઉદાહરણ

તે જ સમયે બહુવિધ ભાષાઓનો ઉપયોગ કરીને ઓસીઆર શક્ય છે. આ યુનિકોડ દસ્તાવેજોમાં અંગ્રેજી ભાષાના મેટાડેટા અને યુઆરએલ મેળવવા માટે ખરેખર મદદ કરી શકે છે.

// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Gujarati);

// આપણે કોઈપણ સંખ્યાની ભાષાઓ ઉમેરી શકીએ

using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Gujarati);

// આપણે કોઈપણ સંખ્યાની ભાષાઓ ઉમેરી શકીએ

using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.ChineseSimplified

Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.ChineseSimplified
Ocr.AddSecondaryLanguage(OcrLanguage.Gujarati)

' આપણે કોઈપણ સંખ્યાની ભાષાઓ ઉમેરી શકીએ

Using input = New OcrInput()
input.Add("multi - language.pdf")
Dim Result = Ocr.Read(input)
Result.SaveAsTextFile("results.txt")
End Using
VB   C#

વિગતવાર ઓસીઆર પરિણામો jectsબ્જેક્ટ્સ

આયર્ન ઓસીઆર દરેક ઓસીઆર ઓપરેશન માટે ઓસીઆર પરિણામ resultબ્જેક્ટ પરત કરે છે. સામાન્ય રીતે, વિકાસકર્તાઓ છબીમાંથી ટેક્સ્ટ સ્કેન કરવા માટે ફક્ત આ objectબ્જેક્ટની ટેક્સ્ટ પ્રોપર્ટીનો ઉપયોગ કરે છે. જો કે, OCR પરિણામો DOM આ કરતા વધુ પ્રગત છે.

using IronOcr;
using System.Drawing; //એસેમ્બલી સંદર્ભ ઉમેરો

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //મહત્વપૂર્ણ!

using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages[0].Words;
var Barcodes = Result.Barcodes;
// એક વિશાળ, વિગતવાર API શોધવા માટે અહીં અન્વેષણ કરો:
// - પૃષ્ઠો, બ્લોક્સ, પરાફેફ્સ, લાઇન્સ, શબ્દો, અક્ષરો
// - છબી નિકાસ, ફontsન્ટ્સ કોઓર્ડિનેટ્સ, આંકડાકીય માહિતી
}
using IronOcr;
using System.Drawing; //એસેમ્બલી સંદર્ભ ઉમેરો

var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //મહત્વપૂર્ણ!

using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages[0].Words;
var Barcodes = Result.Barcodes;
// એક વિશાળ, વિગતવાર API શોધવા માટે અહીં અન્વેષણ કરો:
// - પૃષ્ઠો, બ્લોક્સ, પરાફેફ્સ, લાઇન્સ, શબ્દો, અક્ષરો
// - છબી નિકાસ, ફontsન્ટ્સ કોઓર્ડિનેટ્સ, આંકડાકીય માહિતી
}
Imports IronOcr
Imports System.Drawing 'એસેમ્બલી સંદર્ભ ઉમેરો

Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Gujarati
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm
Ocr.Configuration.ReadBarCodes = True 'મહત્વપૂર્ણ!

Using Input = New OcrInput("images\sample.tiff")
Dim Result As OcrResult = Ocr.Read(Input)
Dim Pages = Result.Pages
Dim Words = Pages(0).Words
Dim Barcodes = Result.Barcodes
' એક વિશાળ, વિગતવાર API શોધવા માટે અહીં અન્વેષણ કરો:
' - પૃષ્ઠો, બ્લોક્સ, પરાફેફ્સ, લાઇન્સ, શબ્દો, અક્ષરો
' - છબી નિકાસ, ફontsન્ટ્સ કોઓર્ડિનેટ્સ, આંકડાકીય માહિતી
End Using
VB   C#

પ્રદર્શન

આયર્નઓસીઆર, ઇનપુટ છબીઓને પરફેક્ટ ટ્યુન કરવાની જરૂર નથી અથવા ભારે સુધારો કરવાની જરૂર સાથે બ ofક્સની બહાર કામ કરે છે.

ગતિ તેજસ્વી છે: આયર્નઓસી .2020 + 10 ગણી ઝડપી છે અને પાછલા બિલ્ડ્સ કરતા 250% કરતા ઓછી ભૂલો કરે છે.

વધુ શીખો

સી #, વીબી, એફ #, અથવા કોઈ અન્ય. નેટ ભાષામાં ઓસીઆર વિશે વધુ જાણવા માટે, કૃપા કરીને અમારા સમુદાયના ટ્યુટોરિયલ્સ વાંચો , જે આયર્ન ઓસીઆરનો ઉપયોગ કેવી રીતે કરી શકાય છે તેના વાસ્તવિક વિશ્વના ઉદાહરણો આપે છે અને શ્રેષ્ઠમાંથી કેવી રીતે નીકળવું તેની ઘોંઘાટ બતાવી શકે છે. આ પુસ્તકાલય.

. નેટ વિકાસકર્તાઓ માટે સંપૂર્ણ objectબ્જેક્ટ સંદર્ભ પણ ઉપલબ્ધ છે.