સી # અને .નેટ માં ગુજરાતી ઓ.સી.આર.
આ દસ્તાવેજના અન્ય સંસ્કરણો:
આયર્નઓસીઆર એ સી # સ softwareફ્ટવેર ઘટક છે. NET કોડર્સ છબીઓ અને પીડીએફ દસ્તાવેજોમાંથી ટેક્સ્ટને 126 ભાષામાં ગુજરાતી સહિત વાંચવા માટે પરવાનગી આપે છે.
તે ટેસરેક્ટનો એક અદ્યતન કાંટો છે, જે ફક્ત. નેટ વિકાસકર્તાઓ માટે જ બનાવવામાં આવ્યો છે અને નિયમિતપણે ઝડપ અને ચોકસાઈ બંને માટે અન્ય ટેસ્સેરેક્ટ એન્જિનોને આઉટપર્ફોર્મ કરે છે.
IronOcr.Languages.Gujarati ના સમાવિષ્ટો
આ પેકેજમાં નેટ. માટે 120 ઓસીઆર ભાષાઓ શામેલ છે:
- ગુજરાતી
- ગુજરાતીબેસ્ટ
- ગુજરાતીફાસ્ટ
- ગુજરાતીઅલ્ફાબેટ
- ગુજરાતીઅલ્ફાબેટબેસ્ટ
- ગુજરાતીઅલ્ફાબેટ ફાસ્ટ
ડાઉનલોડ કરો
ગુજરાતી ભાષા પ Packક [ગુજરાતી]
* Download as ઝિપ
* Install with as https://www.nuget.org/packages/IronOcr.Languages.Gujarati/'> ન્યુગેટ
સ્થાપન
આપણે જે કરવાનું છે તે પ્રથમ વસ્તુ તમારા. નેટ પ્રોજેક્ટ પર અમારા ગુજરાતી ઓસીઆર પેકેજને ઇન્સ્ટોલ કરવાની છે.
PM> Install-Package IronOCR.Languages.Gujarati
કોડ ઉદાહરણ
આ સી # કોડ ઉદાહરણ છબી અથવા પીડીએફ દસ્તાવેજમાંથી ગુજરાતી લખાણ વાંચે છે.
//PM> Install-Package IronOcr.Languages.Gujarati
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;
using (var Input = new OcrInput(@"images\Gujarati.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
//PM> Install-Package IronOcr.Languages.Gujarati
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;
using (var Input = new OcrInput(@"images\Gujarati.png"))
{
var Result = Ocr.Read(Input);
Var AllText = Result.Text
}
'PM> Install-Package IronOcr.Languages.Gujarati
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Gujarati
Using Input = New OcrInput("images\Gujarati.png")
Dim Result = Ocr.Read(Input)
Dim AllText As Var = Result.Text
End Using
આયર્નઓસીઆર કેમ પસંદ કરો?
આયર્ન ઓસીઆર એ એક સ્થાપિત કરવા માટે સરળ, સંપૂર્ણ અને સારી રીતે દસ્તાવેજીકૃત. નેટ સોફ્ટવેર લાઇબ્રેરી છે.
કોઈપણ બાહ્ય વેબ સેવાઓનો ઉપયોગ કર્યા વિના, ચાલુ ફી અથવા ઇન્ટરનેટ ઉપર ગુપ્ત દસ્તાવેજો મોકલ્યા વિના 99.8% + OCR ચોકસાઈ મેળવવા માટે આયર્નઓસીઆર પસંદ કરો.
સી # ડેવલપર્સ વેનિલા પરીક્ષણ પર આયર્નઓસીઆર કેમ પસંદ કરે છે:
- એકલ DLL અથવા નુગેટ તરીકે સ્થાપિત કરો
- બ ofક્સની બહાર પરીક્ષણ 5, 4 અને 3 એન્જિન્સ માટે શામેલ છે.
- ચોકસાઈ 99.8% નિયમિત પરીક્ષણને નોંધપાત્ર પ્રદર્શન કરે છે.
- બ્લીઝિંગ સ્પીડ અને મલ્ટિ થ્રેડિંગ
- એમવીસી, વેબ એપ, ડેસ્કટ .પ, કન્સોલ અને સર્વર એપ્લિકેશન સુસંગત છે
- સાથે કામ કરવા માટે કોઈ એક્ઝ અથવા સી ++ કોડ નથી
- સંપૂર્ણ પીડીએફ ઓસીઆર સપોર્ટ
- લગભગ કોઈપણ છબી ફાઇલ અથવા પીડીએફને ઓસીઆર કરવા માટે
- સંપૂર્ણ. નેટ કોર, સ્ટાન્ડર્ડ અને ફ્રેમવર્ક સપોર્ટ
- વિંડોઝ, મ ,ક, લિનક્સ, એઝ્યુર, ડોકર, લેમ્બડા, એડબ્લ્યુએસ પર જમાવટ કરો
- બારકોડ અને ક્યૂઆર કોડ વાંચો
- એક્સએચટીએમએલ તરીકે ઓસીઆર નિકાસ કરો
- શોધવા યોગ્ય પીડીએફ દસ્તાવેજો પર ઓસીઆર નિકાસ કરો
- મલ્ટિથ્રિડિંગ સપોર્ટ
- 126 આંતરરાષ્ટ્રીય ભાષાઓ બધી નુગેટ અથવા cક્રેટા ડેટા ફાઇલો દ્વારા સંચાલિત
- છબીઓ, સંકલન, આંકડા અને ફોન્ટ્સ કા Fો. માત્ર લખાણ જ નહીં.
- વેપારી અને માલિકીની એપ્લિકેશંસની અંદર પરીક્ષણ ઓસીઆરને ફરીથી વિતરિત કરવા માટે વાપરી શકાય છે.
વાસ્તવિક વિશ્વની છબીઓ અને ફોટોગ્રાફ્સ જેવા અપૂર્ણ દસ્તાવેજો અથવા ડિજિટલ અવાજ અથવા અપૂર્ણતા હોઈ શકે તેવા નિમ્ન રિઝોલ્યુશનના સ્કેન સાથે કામ કરતી વખતે આયર્ન ઓસીઆર ચમકતો હોય છે.
. નેટ પ્લેટફોર્મ માટે અન્ય નિ: શુલ્ક ઓસીઆર લાઇબ્રેરીઓ જેમ કે અન્ય. નેટ ટેસ્સેરેટ એપીઆઇ અને વેબ સેવાઓ આ વાસ્તવિક વિશ્વના ઉપયોગના કેસો પર એટલું સારું પ્રદર્શન કરતી નથી.
પરીક્ષણ 5 સાથેના ઓસીઆર - સી # માં કોડિંગ પ્રારંભ કરો
નીચે આપેલ કોડ નમૂના બતાવે છે કે સી # અથવા વીબી .NET નો ઉપયોગ કરીને છબીમાંથી ટેક્સ્ટ વાંચવું કેટલું સરળ છે.
વનલાઈનર
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
હેલ્લો વર્લ્ડ રૂપરેખાંકિત
// PM> Install-Package IronOCR.Languages.Gujarati
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... તમે કોઈપણ સંખ્યામાં છબીઓ ઉમેરી શકો છો
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
// PM> Install-Package IronOCR.Languages.Gujarati
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;
using (var Input = new OcrInput()){
Input.AddImage("images/sample.jpeg")
//... તમે કોઈપણ સંખ્યામાં છબીઓ ઉમેરી શકો છો
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
' PM> Install-Package IronOCR.Languages.Gujarati
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Gujarati
Using Input = New OcrInput()
Input.AddImage("images/sample.jpeg") var Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
સી # પીડીએફ ઓસીઆર
કોઈ પણ પીડીએફ દસ્તાવેજમાંથી ટેક્સ્ટ કાractવા માટે સમાન અભિગમનો ઉપયોગ કરી શકાય છે.
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// અમે ઓસીઆર પર વિશિષ્ટ પીડીએફ પૃષ્ઠ નંબરો પણ પસંદ કરી શકીએ છીએ
var Result = Ocr.Read(input);
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// પીડીએફના દરેક પૃષ્ઠ માટે 1 પૃષ્ઠ
}
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// અમે ઓસીઆર પર વિશિષ્ટ પીડીએફ પૃષ્ઠ નંબરો પણ પસંદ કરી શકીએ છીએ
var Result = Ocr.Read(input);
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count()} Pages");
// પીડીએફના દરેક પૃષ્ઠ માટે 1 પૃષ્ઠ
}
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Gujarati
Using input = New OcrInput()
input.AddPdf("example.pdf", "password")
' અમે ઓસીઆર પર વિશિષ્ટ પીડીએફ પૃષ્ઠ નંબરો પણ પસંદ કરી શકીએ છીએ
Dim Result = Ocr.Read(input)
Console.WriteLine(Result.Text)
Console.WriteLine($"{Result.Pages.Count()} Pages")
' પીડીએફના દરેક પૃષ્ઠ માટે 1 પૃષ્ઠ
End Using
મલ્ટિપેજ ટીઆઈએફએફ માટે ઓસીઆર
OCR રીડિંગ TIFF ફાઇલ ફોર્મેટ સહિત અનેક પૃષ્ઠ દસ્તાવેજો. ટીઆઈએફએફને સીધા પીડીએફ ફાઇલમાં પણ શોધી શકાય તેવા ટેક્સ્ટ સાથે રૂપાંતરિત કરી શકાય છે.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("multi - frame.tiff");
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Gujarati
Using Input = New OcrInput()
input.AddMultiFrameTiff("multi - frame.tiff")
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
બારકોડ્સ અને ક્યૂઆર
આયર્ન ઓસીઆરની એક વિશિષ્ટ સુવિધા એ છે કે જ્યારે તે ટેક્સ્ટને સ્કેન કરે છે ત્યારે તે દસ્તાવેજોમાંથી બારકોડ અને ક્યૂઆર કોડ વાંચી શકે છે. OcrResult.OcrBarcode
વર્ગના ઉદાહરણો વિકાસકર્તાને દરેક સ્કેન કરેલા બારકોડ વિશે વિગતવાર માહિતિ આપે છે.
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// પ્રકાર અને સ્થાન ગુણધર્મો પણ ખુલ્લી
}
}
// using IronOcr;
var Ocr = new IronTesseract();
Ocr.Configuration.ReadBarCodes = true;
using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
var Result = Ocr.Read(input);
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// પ્રકાર અને સ્થાન ગુણધર્મો પણ ખુલ્લી
}
}
' using IronOcr;
Dim Ocr = New IronTesseract()
Ocr.Configuration.ReadBarCodes = True
Using input = New OcrInput()
input.AddImage("img/Barcode.png")
Dim Result = Ocr.Read(input)
For Each Barcode In Result.Barcodes
Console.WriteLine(Barcode.Value)
' પ્રકાર અને સ્થાન ગુણધર્મો પણ ખુલ્લી
Next Barcode
End Using
છબીઓના વિશિષ્ટ ક્ષેત્રો પર ઓસીઆર
આયર્ન ઓસીઆરની બધી સ્કેનીંગ અને વાંચવાની પદ્ધતિઓ પૃષ્ઠ અથવા પૃષ્ઠોના કયા ભાગમાંથી આપણે ટેક્સ્ટ વાંચવા માંગીએ છીએ તે ચોક્કસપણે સ્પષ્ટ કરવાની ક્ષમતા પ્રદાન કરે છે. જ્યારે અમે પ્રમાણિત સ્વરૂપો જોઈએ છીએ ત્યારે આ ખૂબ ઉપયોગી છે અને ઘણું સમય બચાવી શકીએ છીએ અને કાર્યક્ષમતામાં સુધારો કરી શકીએ છીએ.
પાકના પ્રદેશોનો ઉપયોગ કરવા માટે, આપણે System.Drawing
માટે સિસ્ટમ સંદર્ભ ઉમેરવાની જરૂર પડશે જેથી આપણે System.Drawing.Rectangle
object System.Drawing.Rectangle
ઉપયોગ કરી શકીએ.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;
using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// પરિમાણો px માં છે
Input.Add("document.png", ContentArea);
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;
using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// પરિમાણો px માં છે
Input.Add("document.png", ContentArea);
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Gujarati
Using Input = New OcrInput()
Dim ContentArea = New System.Drawing.Rectangle() With {
.X = 215,
.Y = 1250,
.Height = 280,
.Width = 1335
}
' પરિમાણો px માં છે
Input.Add("document.png", ContentArea)
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
ઓછી ગુણવત્તાવાળા સ્કેન માટે ઓ.સી.આર.
આયર્ન ઓસીઆર OcrInput
વર્ગ સ્કેનને ઠીક કરી શકે છે જે સામાન્ય OcrInput
વાંચી શકતું નથી.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // ડિજિટલ અવાજ અને નબળા સ્કેનીંગને સુધારે છે
Input.Deskew(); // પરિભ્રમણ અને પરિપ્રેક્ષ્યને સુધારે છે
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // ડિજિટલ અવાજ અને નબળા સ્કેનીંગને સુધારે છે
Input.Deskew(); // પરિભ્રમણ અને પરિપ્રેક્ષ્યને સુધારે છે
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Gujarati
Using Input = New OcrInput("img\Potter.LowQuality.tiff")
Input.DeNoise() ' ડિજિટલ અવાજ અને નબળા સ્કેનીંગને સુધારે છે
Input.Deskew() ' પરિભ્રમણ અને પરિપ્રેક્ષ્યને સુધારે છે
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
શોધના યોગ્ય પીડીએફ તરીકે ઓસીઆર પરિણામોને નિકાસ કરો
નકલ કરવા યોગ્ય ટેક્સ્ટ શબ્દમાળાઓ સાથે પીડીએફ પરની છબી. શોધ એંજીન અને ડેટાબેસેસ દ્વારા અનુક્રમિત કરી શકાય છે.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;
using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");
var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;
using (var Input = new OcrInput()){
input.Title = "Quarterly Report"
input.AddImage("image1.jpeg");
input.AddImage("image2.png");
input.AddImage("image3.gif");
var Result = Ocr.Read(input);
Result.SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Gujarati
Using Input = New OcrInput()
input.Title = "Quarterly Report" input.AddImage("image1.jpeg")
input.AddImage("image2.png")
input.AddImage("image3.gif")
Dim Result = Ocr.Read(input)
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
TIFF પીડીએફ કન્વર્ઝન શોધી શકાય તેવું છે
ટીઆઈએફએફ દસ્તાવેજ (અથવા ઇમેજ ફાઇલોના કોઈપણ જૂથ) ને સીધા શોધી પીડીએફમાં કન્વર્ટ કરો જે ઇન્ટ્રાનેટ, વેબસાઇટ અને ગૂગલ સર્ચ એન્જીન દ્વારા અનુક્રમિત કરી શકાય છે.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;
using (var Input = new OcrInput()){
input.AddMultiFrameTiff("example.tiff")
var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Gujarati
Using Input = New OcrInput()
input.AddMultiFrameTiff("example.tiff") var Result = Ocr.Read(input).SaveAsSearchablePdf("searchable.pdf")
End Using
HTML તરીકે OCR પરિણામો નિકાસ કરો
ઓસીઆર છબીથી એક્સએચટીએમએલ રૂપાંતર.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;
using (var Input = new OcrInput()){
input.Title = "Html Title"
input.AddImage("image1.jpeg");
var Result = Ocr.Read(input);
Result.SaveAsHocrFile("results.html");
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Gujarati
Using Input = New OcrInput()
input.Title = "Html Title" input.AddImage("image1.jpeg")
Dim Result = Ocr.Read(input)
Result.SaveAsHocrFile("results.html")
End Using
OCR છબી વૃદ્ધિ ફિલ્ટર્સ
આયર્નઓસીઆર ઓસીઆર પ્રભાવને સુધારવા માટે OcrInput
for OcrInput
માટે અનન્ય ફિલ્ટર્સ OcrInput
કરે છે.
છબી વૃદ્ધિ કોડ ઉદાહરણ
વધુ, ઝડપી ઓસીઆર પરિણામો ઉત્પન્ન કરવા માટે ઓસીઆર ઇનપુટ છબીઓને ઉચ્ચ ગુણવત્તા બનાવે છે.
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // ડિજિટલ અવાજ અને નબળા સ્કેનીંગને સુધારે છે
Input.Deskew(); // પરિભ્રમણ અને પરિપ્રેક્ષ્યને સુધારે છે
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // ડિજિટલ અવાજ અને નબળા સ્કેનીંગને સુધારે છે
Input.Deskew(); // પરિભ્રમણ અને પરિપ્રેક્ષ્યને સુધારે છે
var Result = Ocr.Read(Input);
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Gujarati
Using Input = New OcrInput("LowQuality.jpeg")
Input.DeNoise() ' ડિજિટલ અવાજ અને નબળા સ્કેનીંગને સુધારે છે
Input.Deskew() ' પરિભ્રમણ અને પરિપ્રેક્ષ્યને સુધારે છે
Dim Result = Ocr.Read(Input)
Console.WriteLine(Result.Text)
End Using
OCR ઇમેજ ફિલ્ટર્સની સૂચિ
આયર્નઓસીઆર માં સમાયેલ ઓસીઆર પ્રભાવને વધારવા માટે ઇનપુટ ફિલ્ટર્સમાં શામેલ છે:
- OcrInput.Rotate (ડબલ ડિગ્રી) - સંખ્યાબંધ ડિગ્રી દ્વારા ઘડિયાળની દિશામાં છબીઓ ફેરવે છે. એન્ટિ-ક્લોકવાઇઝ માટે, નકારાત્મક સંખ્યાઓનો ઉપયોગ કરો.
- OcrInput.Binarize () - આ છબી ફિલ્ટર દરેક પિક્સેલને કાળો અથવા સફેદ કોઈ મધ્યમ ગ્રાઉન્ડ વગર ફેરવે છે. પૃષ્ઠભૂમિમાં ટેક્સ્ટના ખૂબ ઓછા વિરોધાભાસનાં OCR પ્રભાવનાં કેસોમાં સુધારો કરી શકે છે.
- OcrInput.ToGrayScale () - આ ઇમેજ ફિલ્ટર દરેક પિક્સેલને ગ્રેસ્કેલની છાયામાં ફેરવે છે. OCR ચોકસાઈ સુધારવા માટે અસંભવિત છે પરંતુ ઝડપ સુધારી શકે છે
- OcrInput.Contrast () - આપમેળે વિપરીતતામાં વધારો થાય છે. આ ફિલ્ટર ઘણીવાર નીચા વિપરીત સ્કેનમાં OCR ગતિ અને ચોકસાઈમાં સુધારો કરે છે.
- OcrInput.DeNoise () - ડિજિટલ અવાજ દૂર કરે છે. અવાજની અપેક્ષા હોય ત્યાં જ આ ફિલ્ટરનો ઉપયોગ કરવો જોઈએ.
- OcrInput.Invert () - દરેક રંગ .ંધી પાડે છે. દા.ત. સફેદ કાળો થાય છે: કાળો સફેદ થાય છે.
- Cક્રિનપુટ.ડિલેટ () - એડવાન્સ્ડ મોર્ફોલોજી. ડિલેશન ઇમેજમાં પદાર્થોની સીમાઓ પર પિક્સેલ્સ ઉમેરે છે. ઇરોડની વિરુદ્ધ
- OcrInput.Erode () - એડવાન્સ્ડ મોર્ફોલોજી. ઇરોશન objectબ્જેક્ટની સીમાઓ પર પિક્સેલ્સને દૂર કરે છે
- Cક્રિનપુટ.ડેસ્ક્યુ () - એક છબી ફેરવે છે જેથી તે સાચી રીત ઉપર અને ઓર્થોગોનલ છે. આ ઓસીઆર માટે ખૂબ ઉપયોગી છે કારણ કે સ્ક્યુડ સ્કેન માટે ટેસ્સેરેટ સહિષ્ણુતા 5 ડિગ્રી જેટલી ઓછી હોઈ શકે છે.
- Cક્રિનપુટ.દીપક્લિયનબેકગ્રાઉન્ડનોઇસ () - ભારે પૃષ્ઠભૂમિ અવાજ દૂર. આ ફિલ્ટરનો ઉપયોગ ફક્ત આત્યંતિક દસ્તાવેજની પૃષ્ઠભૂમિ અવાજને જાણીતા કિસ્સામાં જ થાય છે, કારણ કે આ ફિલ્ટર પણ સ્વચ્છ દસ્તાવેજોની OCR ચોકસાઈ ઘટાડવાનું જોખમ લેશે, અને તે ખૂબ સીપીયુ છે.
- Cક્રિનપુટ.એન્હceન્સ રિઝોલ્યુશન - નીચી ગુણવત્તાવાળી છબીઓનું રીઝોલ્યુશન વધારે છે. આ ફિલ્ટરને ઘણીવાર આવશ્યકતા હોતી નથી કારણ કે cક્રિનપુટ.મિનિમમડીપીઆઇ અને cક્રિનપુટ.ટાર્ગેટડીપીઆઈ આપમેળે ઓછી રીઝોલ્યુશન ઇનપુટ્સને પકડશે અને તેને હલ કરશે.
ક્લીનબેકગ્રાઉન્ડનોઇસ. આ એક સેટિંગ છે જે કંઈક સમય માંગી લે છે; જો કે, તે લાઇબ્રેરીને ડિજિટલ ઇમેજની અંદર આપમેળે ડિજિટલ અવાજ, કાગળના ભંગાર અને અન્ય અપૂર્ણતાઓને સાફ કરવાની મંજૂરી આપે છે જે અન્ય ઓસીઆર લાઇબ્રેરીઓ દ્વારા વાંચવામાં અસમર્થ બનાવે છે.
એન્હેન્સકોન્ટ્રાસ્ટ એ એક સેટિંગ છે જે આયર્ન ઓસીઆરને છબીની પૃષ્ઠભૂમિ સામે આપમેળે ટેક્સ્ટનો વિરોધાભાસ વધારવા માટેનું કારણ બને છે, ઓસીઆરની ચોકસાઈ વધે છે અને સામાન્ય રીતે પ્રભાવ અને ઓસીઆરની ગતિમાં વધારો થાય છે.
એન્હેન્સરેઝોલ્યુશન એ એક સેટિંગ છે જે આપમેળે લો-રિઝોલ્યુશન છબીઓ (જે 275 ડીપીઆઈ હેઠળ છે) ને શોધી કા andશે અને આપમેળે છબીને અપસ્કલે કરશે અને પછી બધા ટેક્સ્ટને શાર્પ કરશે જેથી તે ઓસીઆર લાઇબ્રેરી દ્વારા સંપૂર્ણ રીતે વાંચી શકાય. જો કે આ કામગીરી પોતે સમય માંગી લેતી હોય છે, તે સામાન્ય રીતે એક છબી પરના ઓસીઆર ઓપરેશન માટેનો એકંદર સમય ઘટાડે છે.
ભાષા આયર્ન ઓસીઆર 22 આંતરરાષ્ટ્રીય ભાષાના પેકને સપોર્ટ કરે છે, અને ભાષા સેટિંગનો ઉપયોગ એક અથવા વધુ બહુવિધ ભાષાઓને ઓસીઆર ઓપરેશન માટે લાગુ કરવા માટે પસંદ કરવા માટે થઈ શકે છે.
સ્ટ્રેટેજી આયર્ન ઓસીઆર બે વ્યૂહરચનાને ટેકો આપે છે. અમે કાં તો દસ્તાવેજના ઝડપી અને ઓછા સચોટ સ્કેન માટે જવાનું પસંદ કરી શકીએ છીએ, અથવા એક વાક્યમાં શબ્દોના આંકડાકીય સંબંધોને જોઈને આપમેળે ઓસીઆર ટેક્સ્ટની ચોકસાઈ સુધારવા માટે કેટલાક કૃત્રિમ ગુપ્તચર મોડેલોનો ઉપયોગ કરીને અદ્યતન વ્યૂહરચનાનો ઉપયોગ કરી શકીએ છીએ. .
કલરસ્પેસ એ એક સેટિંગ છે જેના દ્વારા આપણે ગ્રેસ્કેલ અથવા રંગમાં OCR પસંદ કરી શકીએ છીએ. સામાન્ય રીતે, ગ્રેસ્કેલ એ શ્રેષ્ઠ વિકલ્પ છે. જો કે, કેટલીકવાર જ્યારે સમાન રંગની પાઠો અથવા બેકગ્રાઉન્ડ હોય છે પરંતુ ખૂબ જ ભિન્ન રંગ હોય છે, ત્યારે રંગનું સંપૂર્ણ સ્થાન વધુ સારા પરિણામ પ્રદાન કરશે.
વ્હાઇટટેક્સ્ટઓન ડાર્કબેકગ્રાઉન્ડ્સ શોધો. સામાન્ય રીતે, બધી ઓસીઆર લાઇબ્રેરીઓ સફેદ પૃષ્ઠભૂમિ પર કાળા ટેક્સ્ટ જોવાની અપેક્ષા રાખે છે. આ સેટિંગ આયર્ન ઓસીઆરને સફેદ ટેક્સ્ટવાળા નકારાત્મક અથવા શ્યામ પૃષ્ઠોને આપમેળે શોધી કા themવાની અને તેમને વાંચવાની મંજૂરી આપે છે.
ઇનપુટમેજ ટાઇપ. આ સેટિંગ વિકાસકર્તાને OCR લાઇબ્રેરીને માર્ગદર્શન આપવા માટે પરવાનગી આપે છે કે શું તે કોઈ સંપૂર્ણ દસ્તાવેજ અથવા સ્નિપેટ જોઈ રહ્યો છે, જેમ કે સ્ક્રીનશોટ.
રોટેટએન્ડસ્ટેરાઈન એ એક એડવાન્સ્ડ સેટિંગ છે જે આયર્ન ઓસીઆરને એવા દસ્તાવેજો વાંચવાની અનન્ય ક્ષમતાને મંજૂરી આપે છે જે ફક્ત ફેરવવામાં આવતા નથી, પરંતુ સંભવિત પરિમાણો ધરાવે છે, જેમ કે ટેક્સ્ટ દસ્તાવેજોના ફોટોગ્રાફ્સ.
રીડબાર્કોડ્સ એ એક ઉપયોગી સુવિધા છે જે આયર્ન ઓસીઆરને પૃષ્ઠો પર આપમેળે બારકોડ્સ અને ક્યૂઆર કોડ્સ વાંચવાની મંજૂરી આપે છે કારણ કે તે વધારાના સમયનો મોટો બોજો ઉમેર્યા વિના ટેક્સ્ટ પણ વાંચે છે.
કલરડેપ્થ. આ સેટિંગ નક્કી કરે છે કે રંગની depthંડાઈ નક્કી કરવા માટે, પિક્સેલ દીઠ કેટલા બિટ્સનો ઉપયોગ થશે. Colorંચી રંગની depthંડાઈ OCR ગુણવત્તામાં વધારો કરી શકે છે, પરંતુ OCR કામગીરી પૂર્ણ થવા માટે જરૂરી સમય પણ વધારશે.
126 ભાષા પેક
આયર્ન ઓસીઆર ભાષાના પેક દ્વારા 126 આંતરરાષ્ટ્રીય ભાષાઓને સમર્થન આપે છે જે ડીએલએલ તરીકે વિતરિત કરવામાં આવે છે, જે આ વેબસાઇટથી ડાઉનલોડ કરી શકાય છે, અથવા ન્યુગેટ પેકેજ મેનેજરમાંથી પણ .
ભાષાઓમાં જર્મન, ફ્રેન્ચ, અંગ્રેજી, ચાઇનીઝ, જાપાનીઝ અને વધુ શામેલ છે. પાસપોર્ટ એમઆરઝેડ, એમઆઈસીઆર ચકાસણી, નાણાકીય ડેટા, લાઇસન્સ પ્લેટો અને ઘણા વધુ માટે નિષ્ણાત ભાષાનું પેક છે. તમે કોઈપણ પરીક્ષણ ".ટ્રેઇનડેટા" ફાઇલનો ઉપયોગ કરી શકો છો - જેમાં તમે જાતે બનાવો છો.
ભાષા ઉદાહરણ
અન્ય ઓસીઆર ભાષાઓનો ઉપયોગ કરવો.
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;
using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// જો જરૂરી હોય તો ઇમેજ ફિલ્ટર્સ ઉમેરો
// આ કિસ્સામાં, વિચાર્યું પણ ઇનપુટ ખૂબ જ ઓછી ગુણવત્તાવાળી છે
// આયર્નટ્રેસરેક્ટ વાંચી શકે છે કે પરંપરાગત પરીક્ષણ શું કરી શકતું નથી.
var Result = Ocr.Read(input);
// કન્સોલ વિન્ડોઝ પર અરબી સરળતાથી છાપી શકતું નથી.
// ચાલો તેના બદલે ડિસ્ક પર સંગ્રહિત કરીએ.
Result.SaveAsTextFile("arabic.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.Arabic
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Arabic;
using (var input = new OcrInput())
{
input.AddImage("img/arabic.gif");
// જો જરૂરી હોય તો ઇમેજ ફિલ્ટર્સ ઉમેરો
// આ કિસ્સામાં, વિચાર્યું પણ ઇનપુટ ખૂબ જ ઓછી ગુણવત્તાવાળી છે
// આયર્નટ્રેસરેક્ટ વાંચી શકે છે કે પરંપરાગત પરીક્ષણ શું કરી શકતું નથી.
var Result = Ocr.Read(input);
// કન્સોલ વિન્ડોઝ પર અરબી સરળતાથી છાપી શકતું નથી.
// ચાલો તેના બદલે ડિસ્ક પર સંગ્રહિત કરીએ.
Result.SaveAsTextFile("arabic.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.Arabic
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Arabic
Using input = New OcrInput()
input.AddImage("img/arabic.gif")
' જો જરૂરી હોય તો ઇમેજ ફિલ્ટર્સ ઉમેરો
' આ કિસ્સામાં, વિચાર્યું પણ ઇનપુટ ખૂબ જ ઓછી ગુણવત્તાવાળી છે
' આયર્નટ્રેસરેક્ટ વાંચી શકે છે કે પરંપરાગત પરીક્ષણ શું કરી શકતું નથી.
Dim Result = Ocr.Read(input)
' કન્સોલ વિન્ડોઝ પર અરબી સરળતાથી છાપી શકતું નથી.
' ચાલો તેના બદલે ડિસ્ક પર સંગ્રહિત કરીએ.
Result.SaveAsTextFile("arabic.txt")
End Using
બહુવિધ ભાષા ઉદાહરણ
તે જ સમયે બહુવિધ ભાષાઓનો ઉપયોગ કરીને ઓસીઆર શક્ય છે. આ યુનિકોડ દસ્તાવેજોમાં અંગ્રેજી ભાષાના મેટાડેટા અને યુઆરએલ મેળવવા માટે ખરેખર મદદ કરી શકે છે.
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Gujarati);
// આપણે કોઈપણ સંખ્યાની ભાષાઓ ઉમેરી શકીએ
using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
// using IronOcr;
// PM> Install IronOcr.Languages.ChineseSimplified
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.ChineseSimplified;
Ocr.AddSecondaryLanguage(OcrLanguage.Gujarati);
// આપણે કોઈપણ સંખ્યાની ભાષાઓ ઉમેરી શકીએ
using (var input = new OcrInput())
{
input.Add("multi - language.pdf");
var Result = Ocr.Read(input);
Result.SaveAsTextFile("results.txt");
}
' using IronOcr;
' PM> Install IronOcr.Languages.ChineseSimplified
Dim Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.ChineseSimplified
Ocr.AddSecondaryLanguage(OcrLanguage.Gujarati)
' આપણે કોઈપણ સંખ્યાની ભાષાઓ ઉમેરી શકીએ
Using input = New OcrInput()
input.Add("multi - language.pdf")
Dim Result = Ocr.Read(input)
Result.SaveAsTextFile("results.txt")
End Using
વિગતવાર ઓસીઆર પરિણામો jectsબ્જેક્ટ્સ
આયર્ન ઓસીઆર દરેક ઓસીઆર ઓપરેશન માટે ઓસીઆર પરિણામ resultબ્જેક્ટ પરત કરે છે. સામાન્ય રીતે, વિકાસકર્તાઓ છબીમાંથી ટેક્સ્ટ સ્કેન કરવા માટે ફક્ત આ objectબ્જેક્ટની ટેક્સ્ટ પ્રોપર્ટીનો ઉપયોગ કરે છે. જો કે, OCR પરિણામો DOM આ કરતા વધુ પ્રગત છે.
using IronOcr;
using System.Drawing; //એસેમ્બલી સંદર્ભ ઉમેરો
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //મહત્વપૂર્ણ!
using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages [0].Words;
var Barcodes = Result.Barcodes;
// એક વિશાળ, વિગતવાર API શોધવા માટે અહીં અન્વેષણ કરો:
// - પૃષ્ઠો, બ્લોક્સ, પરાફેફ્સ, લાઇન્સ, શબ્દો, અક્ષરો
// - છબી નિકાસ, ફontsન્ટ્સ કોઓર્ડિનેટ્સ, આંકડાકીય માહિતી
}
using IronOcr;
using System.Drawing; //એસેમ્બલી સંદર્ભ ઉમેરો
var Ocr = new IronTesseract();
Ocr.Language = OcrLanguage.Gujarati;
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm;
Ocr.Configuration.ReadBarCodes = true; //મહત્વપૂર્ણ!
using (var Input = new OcrInput(@"images\sample.tiff"))
{
OcrResult Result = Ocr.Read(Input);
var Pages = Result.Pages;
var Words = Pages [0].Words;
var Barcodes = Result.Barcodes;
// એક વિશાળ, વિગતવાર API શોધવા માટે અહીં અન્વેષણ કરો:
// - પૃષ્ઠો, બ્લોક્સ, પરાફેફ્સ, લાઇન્સ, શબ્દો, અક્ષરો
// - છબી નિકાસ, ફontsન્ટ્સ કોઓર્ડિનેટ્સ, આંકડાકીય માહિતી
}
Imports IronOcr
Imports System.Drawing 'એસેમ્બલી સંદર્ભ ઉમેરો
Private Ocr = New IronTesseract()
Ocr.Language = OcrLanguage.Gujarati
Ocr.Configuration.EngineMode = TesseractEngineMode.TesseractAndLstm
Ocr.Configuration.ReadBarCodes = True 'મહત્વપૂર્ણ!
Using Input = New OcrInput("images\sample.tiff")
Dim Result As OcrResult = Ocr.Read(Input)
Dim Pages = Result.Pages
Dim Words = Pages (0).Words
Dim Barcodes = Result.Barcodes
' એક વિશાળ, વિગતવાર API શોધવા માટે અહીં અન્વેષણ કરો:
' - પૃષ્ઠો, બ્લોક્સ, પરાફેફ્સ, લાઇન્સ, શબ્દો, અક્ષરો
' - છબી નિકાસ, ફontsન્ટ્સ કોઓર્ડિનેટ્સ, આંકડાકીય માહિતી
End Using
પ્રદર્શન
આયર્નઓસીઆર, ઇનપુટ છબીઓને પરફેક્ટ ટ્યુન કરવાની જરૂર નથી અથવા ભારે સુધારો કરવાની જરૂર સાથે બ ofક્સની બહાર કામ કરે છે.
ગતિ તેજસ્વી છે: આયર્નઓસી .2020 + 10 ગણી ઝડપી છે અને પાછલા બિલ્ડ્સ કરતા 250% કરતા ઓછી ભૂલો કરે છે.
વધુ શીખો
સી #, વીબી, એફ #, અથવા કોઈ અન્ય. નેટ ભાષામાં ઓસીઆર વિશે વધુ જાણવા માટે, કૃપા કરીને અમારા સમુદાયના ટ્યુટોરિયલ્સ વાંચો , જે આયર્ન ઓસીઆરનો ઉપયોગ કેવી રીતે કરી શકાય છે તેના વાસ્તવિક વિશ્વના ઉદાહરણો આપે છે અને શ્રેષ્ઠમાંથી કેવી રીતે નીકળવું તેની ઘોંઘાટ બતાવી શકે છે. આ પુસ્તકાલય.
. નેટ વિકાસકર્તાઓ માટે સંપૂર્ણ objectબ્જેક્ટ સંદર્ભ પણ ઉપલબ્ધ છે.