ქართული OCR C#და .NET- ში
ამ დოკუმენტის სხვა ვერსიები:
IronOCR არის C# პროგრამული უზრუნველყოფის კომპონენტი, რომელიც საშუალებას აძლევს .NET კოდირებს წაიკითხონ ტექსტები სურათებიდან და PDF დოკუმენტებიდან 126 ენაზე, მათ შორის ქართულად.
ეს არის Tesseract-ის მოწინავე ჩანგალი, რომელიც შექმნილია მხოლოდ .NET დეველოპერებისთვის და რეგულარულად აღემატება Tesseract-ის სხვა ძრავებს როგორც სიჩქარით, ასევე სიზუსტით.
IronOcr. ენების შინაარსი. ქართული
ეს პაკეტი შეიცავს 176 OCR ენას .NET–ისთვის:
- GeorgianAlphabet
- GeorgianAlphabetBest
- GeorgianAlphabetFast
- ქართველი
- GeorgianBest
- GeorgianFast
- GeorgianOld
- GeorgianOldBest
- GeorgianOldFast
გადმოწერა
ქართული ენის პაკეტი [ქართული]
ინსტალაცია
პირველი, რაც უნდა გავაკეთოთ, არის დააყენოთ ჩვენი Georgian OCR პაკეტი თქვენი .NET პროექტი.
Install-Package IronOCR.Languages.Georgian
კოდის მაგალითი
C# კოდის ეს მაგალითი კითხულობს ქართულ ტექსტს Image ან PDF დოკუმენტიდან.
// Install the Georgian language package for IronOCR
// PM> Install-Package IronOCR.Languages.Georgian
using IronOcr;
var Ocr = new IronTesseract();
// Set the OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Load an input image for OCR
using (var Input = new OcrInput(@"images\Georgian.png"))
{
// Perform OCR reading on the input image
var Result = Ocr.Read(Input);
// Retrieve the recognized text
var AllText = Result.Text;
}
// Install the Georgian language package for IronOCR
// PM> Install-Package IronOCR.Languages.Georgian
using IronOcr;
var Ocr = new IronTesseract();
// Set the OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Load an input image for OCR
using (var Input = new OcrInput(@"images\Georgian.png"))
{
// Perform OCR reading on the input image
var Result = Ocr.Read(Input);
// Retrieve the recognized text
var AllText = Result.Text;
}
' Install the Georgian language package for IronOCR
' PM> Install-Package IronOCR.Languages.Georgian
Imports IronOcr
Private Ocr = New IronTesseract()
' Set the OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian
' Load an input image for OCR
Using Input = New OcrInput("images\Georgian.png")
' Perform OCR reading on the input image
Dim Result = Ocr.Read(Input)
' Retrieve the recognized text
Dim AllText = Result.Text
End Using
რატომ უნდა აირჩიოთ IronOCR?
IronOCR არის მარტივი ინსტალაცია, სრული და კარგად დოკუმენტირებული .NET პროგრამული უზრუნველყოფის ბიბლიოთეკა.
შეარჩიეთ IronOCR 99.8% + OCR სიზუსტის მისაღწევად, ყოველგვარი გარე ვებ-სერვისების, მიმდინარე გადასახადების ან ინტერნეტით კონფიდენციალური დოკუმენტების გაგზავნის გარეშე.
რატომ ირჩევენ C#დეველოპერები IronOCR–ს ვიდრე Vanilla Tesseract–ს:
- დააინსტალირეთ როგორც ერთი DLL ან NuGet
- მოყვება Tesseract 5, 4 და 3 ძრავები ყუთში.
- სიზუსტე 99.8% მნიშვნელოვნად აღემატება რეგულარულ Tesseract-ს.
- Blazing სიჩქარე და MultiThreading
- MVC, WebApp, Desktop, Console & Server Application თავსებადია
- Exes ან C ++ კოდი არ მუშაობს
- სრული PDF OCR მხარდაჭერა
- OCR–ს შესასრულებლად თითქმის ნებისმიერი გამოსახულების ფაილი ან PDF
- სრული .NET Core, Standard და Framework მხარდაჭერა
- განათავსეთ Windows, Mac, Linux, Azure, Docker, Lambda, AWS
- წაიკითხეთ შტრიხ-კოდები და QR კოდები
- ექსპორტი OCR როგორც XHTML
- ექსპორტი OCR საძიებო PDF დოკუმენტებზე
- მრავალრიცხოვანი მხარდაჭერა
- 126 საერთაშორისო ენა მართულია NuGet ან OcrData ფაილების საშუალებით
- ამოიღეთ სურათები, კოორდინატები, სტატისტიკა და შრიფტები. არა მხოლოდ ტექსტი.
- შეიძლება გამოყენებულ იქნას Tesseract OCR- ის გადანაწილება კომერციული და საკუთრების პროგრამებში.
რკინის OCR ანათებს რეალურ სამყაროს სურათებთან და არასრულყოფილ დოკუმენტებთან მუშაობისას, როგორიცაა ფოტოსურათები, ან დაბალი რეზოლუციის სკანირება, რომლებსაც შეიძლება ჰქონდეთ ციფრული ხმაური ან არასრულყოფილება.
სხვა უფასო OCR ბიბლიოთეკები .NET პლატფორმისთვის, როგორიცაა სხვა .net tesseract API და ვებ-სერვისები არც ისე კარგად მუშაობს ამ რეალურ სამყაროში გამოყენების შემთხვევებში.
OCR Tesseract 5 – ით - დაიწყეთ კოდირება C #– ით
ქვემოთ მოცემული კოდის ნიმუში გვიჩვენებს, თუ რამდენად ადვილია ტექსტის წაკითხვა სურათზე C#ან VB.NET გამოყენებით.
OneLiner
// A simple example of reading text using IronTesseract
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
// A simple example of reading text using IronTesseract
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
' A simple example of reading text using IronTesseract
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
კონფიგურირებადი Hello World
// PM> Install-Package IronOCR.Languages.Georgian
using IronOcr;
var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Create a new input for OCR
using (var Input = new OcrInput())
{
// Add an image for OCR processing
Input.AddImage("images/sample.jpeg");
//... You can add as many images as needed
// Read the image using OCR
var Result = Ocr.Read(Input);
// Output the OCR result
Console.WriteLine(Result.Text);
}
// PM> Install-Package IronOCR.Languages.Georgian
using IronOcr;
var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Create a new input for OCR
using (var Input = new OcrInput())
{
// Add an image for OCR processing
Input.AddImage("images/sample.jpeg");
//... You can add as many images as needed
// Read the image using OCR
var Result = Ocr.Read(Input);
// Output the OCR result
Console.WriteLine(Result.Text);
}
' PM> Install-Package IronOCR.Languages.Georgian
Imports IronOcr
Private Ocr = New IronTesseract()
' Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian
' Create a new input for OCR
Using Input = New OcrInput()
' Add an image for OCR processing
Input.AddImage("images/sample.jpeg")
'... You can add as many images as needed
' Read the image using OCR
Dim Result = Ocr.Read(Input)
' Output the OCR result
Console.WriteLine(Result.Text)
End Using
C#PDF OCR
ესე მიდგომა შეიძლება გამოყენებულ იქნას ნებისმიერი PDF დოკუმენტიდან ტექსტის ამოსაღებად.
using IronOcr;
var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Load and process a PDF file with OCR
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// Optional: specify page numbers for OCR if needed
// Perform OCR
var Result = Ocr.Read(input);
// Print results
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count} Pages");
// Outputs the number of pages processed
}
using IronOcr;
var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Load and process a PDF file with OCR
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// Optional: specify page numbers for OCR if needed
// Perform OCR
var Result = Ocr.Read(input);
// Print results
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count} Pages");
// Outputs the number of pages processed
}
Imports IronOcr
Private Ocr = New IronTesseract()
' Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian
' Load and process a PDF file with OCR
Using input = New OcrInput()
input.AddPdf("example.pdf", "password")
' Optional: specify page numbers for OCR if needed
' Perform OCR
Dim Result = Ocr.Read(input)
' Print results
Console.WriteLine(Result.Text)
Console.WriteLine($"{Result.Pages.Count} Pages")
' Outputs the number of pages processed
End Using
OCR MultiPage TIFF-ებისთვის
OCR კითხულობს TIFF ფაილის ფორმატს, მრავალჯერადი გვერდის დოკუმენტების ჩათვლით. TIFF ასევე შეიძლება გადაკეთდეს პირდაპირ PDF ფაილში, საძიებო ტექსტით.
using IronOcr;
var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Process multi-frame TIFF with OCR
using (var Input = new OcrInput())
{
Input.AddMultiFrameTiff("multi-frame.tiff");
// Perform OCR
var Result = Ocr.Read(Input);
// Output the result
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Process multi-frame TIFF with OCR
using (var Input = new OcrInput())
{
Input.AddMultiFrameTiff("multi-frame.tiff");
// Perform OCR
var Result = Ocr.Read(Input);
// Output the result
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
' Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian
' Process multi-frame TIFF with OCR
Using Input = New OcrInput()
Input.AddMultiFrameTiff("multi-frame.tiff")
' Perform OCR
Dim Result = Ocr.Read(Input)
' Output the result
Console.WriteLine(Result.Text)
End Using
შტრიხკოდები და QR
რკინის OCR–ის უნიკალური მახასიათებელია ის, რომ მას შეუძლია წაიკითხოს შტრიხ – კოდები და QR კოდები დოკუმენტებიდან, როდესაც იგი სკანირებს ტექსტს. OcrResult.OcrBarcode
კლასის შემთხვევები დეველოპერს აძლევს დეტალურ ინფორმაციას თითოეული დასკანირებული შტრიხ- კოდის შესახებ.
using IronOcr;
var Ocr = new IronTesseract();
// Enable barcode reading
Ocr.Configuration.ReadBarCodes = true;
// Create OCR input for scanning
using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
// Perform OCR
var Result = Ocr.Read(input);
// Loop through the barcodes
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// Additionally, type and location properties are exposed
}
}
using IronOcr;
var Ocr = new IronTesseract();
// Enable barcode reading
Ocr.Configuration.ReadBarCodes = true;
// Create OCR input for scanning
using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
// Perform OCR
var Result = Ocr.Read(input);
// Loop through the barcodes
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// Additionally, type and location properties are exposed
}
}
Imports IronOcr
Private Ocr = New IronTesseract()
' Enable barcode reading
Ocr.Configuration.ReadBarCodes = True
' Create OCR input for scanning
Using input = New OcrInput()
input.AddImage("img/Barcode.png")
' Perform OCR
Dim Result = Ocr.Read(input)
' Loop through the barcodes
For Each Barcode In Result.Barcodes
Console.WriteLine(Barcode.Value)
' Additionally, type and location properties are exposed
Next Barcode
End Using
OCR სურათების კონკრეტულ ადგილებში
რკინის OCR- ის სკანირებისა და კითხვის ყველა მეთოდი საშუალებას გაძლევთ ზუსტად განსაზღვროთ გვერდის რომელი გვერდის ან გვერდების ტექსტი. ეს ძალიან სასარგებლოა, როდესაც სტანდარტიზებულ ფორმებს ვუყურებთ და საშინელი დროის დაზოგვა და ეფექტურობის გაუმჯობესება შეგვიძლია.
მოსავლის რეგიონების გამოსაყენებლად, ჩვენ უნდა დავამატოთ სისტემის მითითება System.Drawing
რათა გამოვიყენოთ System.Drawing.Rectangle
ობიექტი.
using IronOcr;
var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Define and process a specific content area
using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// Dimensions are in pixels
Input.Add("document.png", ContentArea);
// Perform OCR
var Result = Ocr.Read(Input);
// Output the result
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Define and process a specific content area
using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// Dimensions are in pixels
Input.Add("document.png", ContentArea);
// Perform OCR
var Result = Ocr.Read(Input);
// Output the result
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
' Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian
' Define and process a specific content area
Using Input = New OcrInput()
Dim ContentArea = New System.Drawing.Rectangle() With {
.X = 215,
.Y = 1250,
.Height = 280,
.Width = 1335
}
' Dimensions are in pixels
Input.Add("document.png", ContentArea)
' Perform OCR
Dim Result = Ocr.Read(Input)
' Output the result
Console.WriteLine(Result.Text)
End Using
OCR დაბალი ხარისხის სკანირებისთვის
IronOCR OcrInput
კლასს შეუძლია დააფიქსიროს სკანირება, რომლის წაკითხვაც შეუძლებელია ნორმალურ Tesseract-ს.
using IronOcr;
var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Process low-quality scanned image
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // Removes digital noise from the image
Input.Deskew(); // Corrects rotation and perspective
// Perform OCR
var Result = Ocr.Read(Input);
// Output the result
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Process low-quality scanned image
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // Removes digital noise from the image
Input.Deskew(); // Corrects rotation and perspective
// Perform OCR
var Result = Ocr.Read(Input);
// Output the result
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
' Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian
' Process low-quality scanned image
Using Input = New OcrInput("img\Potter.LowQuality.tiff")
Input.DeNoise() ' Removes digital noise from the image
Input.Deskew() ' Corrects rotation and perspective
' Perform OCR
Dim Result = Ocr.Read(Input)
' Output the result
Console.WriteLine(Result.Text)
End Using
ექსპორტის OCR შედეგები, როგორც საძიებო PDF
სურათი PDF- ში, ტექსტური ტექსტების დასაწერად. ინდექსირება შესაძლებელია საძიებო სისტემებისა და მონაცემთა ბაზების მიერ.
using IronOcr;
var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Create input for PDF export
using (var Input = new OcrInput())
{
Input.Title = "Quarterly Report";
Input.AddImage("image1.jpeg");
Input.AddImage("image2.png");
Input.AddImage("image3.gif");
// Perform OCR and save as PDF
var Result = Ocr.Read(Input);
Result.SaveAsSearchablePdf("searchable.pdf");
}
using IronOcr;
var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Create input for PDF export
using (var Input = new OcrInput())
{
Input.Title = "Quarterly Report";
Input.AddImage("image1.jpeg");
Input.AddImage("image2.png");
Input.AddImage("image3.gif");
// Perform OCR and save as PDF
var Result = Ocr.Read(Input);
Result.SaveAsSearchablePdf("searchable.pdf");
}
Imports IronOcr
Private Ocr = New IronTesseract()
' Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian
' Create input for PDF export
Using Input = New OcrInput()
Input.Title = "Quarterly Report"
Input.AddImage("image1.jpeg")
Input.AddImage("image2.png")
Input.AddImage("image3.gif")
' Perform OCR and save as PDF
Dim Result = Ocr.Read(Input)
Result.SaveAsSearchablePdf("searchable.pdf")
End Using
TIFF საძიებო PDF კონვერტაციისთვის
ჩართეთ TIFF დოკუმენტი (ან გამოსახულების ფაილების ნებისმიერი ჯგუფი) პირდაპირ საძიებო PDF ფორმატში, რომლის ინდექსაცია შესაძლებელია ინტრანეტის, ვებსაიტებისა და Google საძიებო სისტემების მიერ.
using IronOcr;
var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Convert TIFF to searchable PDF
using (var Input = new OcrInput())
{
Input.AddMultiFrameTiff("example.tiff");
var Result = Ocr.Read(Input).SaveAsSearchablePdf("searchable.pdf");
}
using IronOcr;
var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Convert TIFF to searchable PDF
using (var Input = new OcrInput())
{
Input.AddMultiFrameTiff("example.tiff");
var Result = Ocr.Read(Input).SaveAsSearchablePdf("searchable.pdf");
}
Imports IronOcr
Private Ocr = New IronTesseract()
' Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian
' Convert TIFF to searchable PDF
Using Input = New OcrInput()
Input.AddMultiFrameTiff("example.tiff")
Dim Result = Ocr.Read(Input).SaveAsSearchablePdf("searchable.pdf")
End Using
ექსპორტის OCR შედეგები HTML- ით
OCR გამოსახულების XHTML გარდაქმნა.
using IronOcr;
var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Create OCR input for HTML export
using (var Input = new OcrInput())
{
Input.Title = "Html Title";
Input.AddImage("image1.jpeg");
// Perform OCR and save as XHTML
var Result = Ocr.Read(Input);
Result.SaveAsHocrFile("results.html");
}
using IronOcr;
var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Create OCR input for HTML export
using (var Input = new OcrInput())
{
Input.Title = "Html Title";
Input.AddImage("image1.jpeg");
// Perform OCR and save as XHTML
var Result = Ocr.Read(Input);
Result.SaveAsHocrFile("results.html");
}
Imports IronOcr
Private Ocr = New IronTesseract()
' Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian
' Create OCR input for HTML export
Using Input = New OcrInput()
Input.Title = "Html Title"
Input.AddImage("image1.jpeg")
' Perform OCR and save as XHTML
Dim Result = Ocr.Read(Input)
Result.SaveAsHocrFile("results.html")
End Using
OCR გამოსახულების გამაძლიერებელი ფილტრები
IronOCR გთავაზობთ უნიკალურ ფილტრებს OcrInput
ობიექტებისთვის, OCR–ის მუშაობის გასაუმჯობესებლად.
სურათის გაუმჯობესების კოდის მაგალითი
OCR შეყვანის სურათებს უფრო მაღალ ხარისხს უკეთებს, უფრო სწრაფად OCR შედეგებს.
using IronOcr;
var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Load and process low-quality image
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // Removes digital noise from the image
Input.Deskew(); // Corrects rotation and perspective
// Perform OCR
var Result = Ocr.Read(Input);
// Output the result
Console.WriteLine(Result.Text);
}
using IronOcr;
var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Load and process low-quality image
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // Removes digital noise from the image
Input.Deskew(); // Corrects rotation and perspective
// Perform OCR
var Result = Ocr.Read(Input);
// Output the result
Console.WriteLine(Result.Text);
}
Imports IronOcr
Private Ocr = New IronTesseract()
' Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian
' Load and process low-quality image
Using Input = New OcrInput("LowQuality.jpeg")
Input.DeNoise() ' Removes digital noise from the image
Input.Deskew() ' Corrects rotation and perspective
' Perform OCR
Dim Result = Ocr.Read(Input)
' Output the result
Console.WriteLine(Result.Text)
End Using