ქართული OCR C#და .NET- ში
ამ დოკუმენტის სხვა ვერსიები:
IronOCR არის C# პროგრამული უზრუნველყოფის კომპონენტი, რომელიც საშუალებას აძლევს .NET კოდირებს წაიკითხონ ტექსტები სურათებიდან და PDF დოკუმენტებიდან 126 ენაზე, მათ შორის ქართულად.
ეს არის Tesseract-ის მოწინავე ჩანგალი, რომელიც შექმნილია მხოლოდ .NET დეველოპერებისთვის და რეგულარულად აღემატება Tesseract-ის სხვა ძრავებს როგორც სიჩქარით, ასევე სიზუსტით.
IronOcr. ენების შინაარსი. ქართული
ეს პაკეტი შეიცავს 176 OCR ენას .NET–ისთვის:
- GeorgianAlphabet
- GeorgianAlphabetBest
- GeorgianAlphabetFast
- ქართველი
- GeorgianBest
- GeorgianFast
- GeorgianOld
- GeorgianOldBest
- GeorgianOldFast
გადმოწერა
ქართული ენის პაკეტი [ქართული]
ინსტალაცია
პირველი, რაც უნდა გავაკეთოთ, არის დააყენოთ ჩვენი Georgian OCR პაკეტი თქვენი .NET პროექტი.
Install-Package IronOCR.Languages.Georgian
კოდის მაგალითი
C# კოდის ეს მაგალითი კითხულობს ქართულ ტექსტს Image ან PDF დოკუმენტიდან.
// Install the Georgian language package for IronOCR
// PM> Install-Package IronOCR.Languages.Georgian
using IronOcr;
var Ocr = new IronTesseract();
// Set the OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Load an input image for OCR
using (var Input = new OcrInput(@"images\Georgian.png"))
{
// Perform OCR reading on the input image
var Result = Ocr.Read(Input);
// Retrieve the recognized text
var AllText = Result.Text;
}// Install the Georgian language package for IronOCR
// PM> Install-Package IronOCR.Languages.Georgian
using IronOcr;
var Ocr = new IronTesseract();
// Set the OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Load an input image for OCR
using (var Input = new OcrInput(@"images\Georgian.png"))
{
// Perform OCR reading on the input image
var Result = Ocr.Read(Input);
// Retrieve the recognized text
var AllText = Result.Text;
}რატომ უნდა აირჩიოთ IronOCR?
IronOCR არის მარტივი ინსტალაცია, სრული და კარგად დოკუმენტირებული .NET პროგრამული უზრუნველყოფის ბიბლიოთეკა.
შეარჩიეთ IronOCR 99.8% + OCR სიზუსტის მისაღწევად, ყოველგვარი გარე ვებ-სერვისების, მიმდინარე გადასახადების ან ინტერნეტით კონფიდენციალური დოკუმენტების გაგზავნის გარეშე.
რატომ ირჩევენ C#დეველოპერები IronOCR–ს ვიდრე Vanilla Tesseract–ს:
- დააინსტალირეთ როგორც ერთი DLL ან NuGet
- მოყვება Tesseract 5, 4 და 3 ძრავები ყუთში.
- სიზუსტე 99.8% მნიშვნელოვნად აღემატება რეგულარულ Tesseract-ს.
- Blazing სიჩქარე და MultiThreading
- MVC, WebApp, Desktop, Console & Server Application თავსებადია
- Exes ან C ++ კოდი არ მუშაობს
- სრული PDF OCR მხარდაჭერა
- OCR–ს შესასრულებლად თითქმის ნებისმიერი გამოსახულების ფაილი ან PDF
- სრული .NET Core, Standard და Framework მხარდაჭერა
- განათავსეთ Windows, Mac, Linux, Azure, Docker, Lambda, AWS
- წაიკითხეთ შტრიხ-კოდები და QR კოდები
- ექსპორტი OCR როგორც XHTML
- ექსპორტი OCR საძიებო PDF დოკუმენტებზე
- მრავალრიცხოვანი მხარდაჭერა
- 126 საერთაშორისო ენა მართულია NuGet ან OcrData ფაილების საშუალებით
- ამოიღეთ სურათები, კოორდინატები, სტატისტიკა და შრიფტები. არა მხოლოდ ტექსტი.
- შეიძლება გამოყენებულ იქნას Tesseract OCR- ის გადანაწილება კომერციული და საკუთრების პროგრამებში.
რკინის OCR ანათებს რეალურ სამყაროს სურათებთან და არასრულყოფილ დოკუმენტებთან მუშაობისას, როგორიცაა ფოტოსურათები, ან დაბალი რეზოლუციის სკანირება, რომლებსაც შეიძლება ჰქონდეთ ციფრული ხმაური ან არასრულყოფილება.
სხვა უფასო OCR ბიბლიოთეკები .NET პლატფორმისთვის, როგორიცაა სხვა .net tesseract API და ვებ-სერვისები არც ისე კარგად მუშაობს ამ რეალურ სამყაროში გამოყენების შემთხვევებში.
OCR Tesseract 5 – ით - დაიწყეთ კოდირება C #– ით
ქვემოთ მოცემული კოდის ნიმუში გვიჩვენებს, თუ რამდენად ადვილია ტექსტის წაკითხვა სურათზე C#ან VB.NET გამოყენებით.
OneLiner
// A simple example of reading text using IronTesseract
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;// A simple example of reading text using IronTesseract
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;კონფიგურირებადი Hello World
// PM> Install-Package IronOCR.Languages.Georgian
using IronOcr;
var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Create a new input for OCR
using (var Input = new OcrInput())
{
// Add an image for OCR processing
Input.AddImage("images/sample.jpeg");
//... You can add as many images as needed
// Read the image using OCR
var Result = Ocr.Read(Input);
// Output the OCR result
Console.WriteLine(Result.Text);
}// PM> Install-Package IronOCR.Languages.Georgian
using IronOcr;
var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Create a new input for OCR
using (var Input = new OcrInput())
{
// Add an image for OCR processing
Input.AddImage("images/sample.jpeg");
//... You can add as many images as needed
// Read the image using OCR
var Result = Ocr.Read(Input);
// Output the OCR result
Console.WriteLine(Result.Text);
}C#PDF OCR
ესე მიდგომა შეიძლება გამოყენებულ იქნას ნებისმიერი PDF დოკუმენტიდან ტექსტის ამოსაღებად.
using IronOcr;
var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Load and process a PDF file with OCR
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// Optional: specify page numbers for OCR if needed
// Perform OCR
var Result = Ocr.Read(input);
// Print results
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count} Pages");
// Outputs the number of pages processed
}using IronOcr;
var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Load and process a PDF file with OCR
using (var input = new OcrInput())
{
input.AddPdf("example.pdf", "password");
// Optional: specify page numbers for OCR if needed
// Perform OCR
var Result = Ocr.Read(input);
// Print results
Console.WriteLine(Result.Text);
Console.WriteLine($"{Result.Pages.Count} Pages");
// Outputs the number of pages processed
}OCR MultiPage TIFF-ებისთვის
OCR კითხულობს TIFF ფაილის ფორმატს, მრავალჯერადი გვერდის დოკუმენტების ჩათვლით. TIFF ასევე შეიძლება გადაკეთდეს პირდაპირ PDF ფაილში, საძიებო ტექსტით.
using IronOcr;
var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Process multi-frame TIFF with OCR
using (var Input = new OcrInput())
{
Input.AddMultiFrameTiff("multi-frame.tiff");
// Perform OCR
var Result = Ocr.Read(Input);
// Output the result
Console.WriteLine(Result.Text);
}using IronOcr;
var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Process multi-frame TIFF with OCR
using (var Input = new OcrInput())
{
Input.AddMultiFrameTiff("multi-frame.tiff");
// Perform OCR
var Result = Ocr.Read(Input);
// Output the result
Console.WriteLine(Result.Text);
}შტრიხკოდები და QR
რკინის OCR–ის უნიკალური მახასიათებელია ის, რომ მას შეუძლია წაიკითხოს შტრიხ – კოდები და QR კოდები დოკუმენტებიდან, როდესაც იგი სკანირებს ტექსტს. OcrResult.OcrBarcode კლასის შემთხვევები დეველოპერს აძლევს დეტალურ ინფორმაციას თითოეული დასკანირებული შტრიხ- კოდის შესახებ.
using IronOcr;
var Ocr = new IronTesseract();
// Enable barcode reading
Ocr.Configuration.ReadBarCodes = true;
// Create OCR input for scanning
using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
// Perform OCR
var Result = Ocr.Read(input);
// Loop through the barcodes
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// Additionally, type and location properties are exposed
}
}using IronOcr;
var Ocr = new IronTesseract();
// Enable barcode reading
Ocr.Configuration.ReadBarCodes = true;
// Create OCR input for scanning
using (var input = new OcrInput())
{
input.AddImage("img/Barcode.png");
// Perform OCR
var Result = Ocr.Read(input);
// Loop through the barcodes
foreach (var Barcode in Result.Barcodes)
{
Console.WriteLine(Barcode.Value);
// Additionally, type and location properties are exposed
}
}OCR სურათების კონკრეტულ ადგილებში
რკინის OCR- ის სკანირებისა და კითხვის ყველა მეთოდი საშუალებას გაძლევთ ზუსტად განსაზღვროთ გვერდის რომელი გვერდის ან გვერდების ტექსტი. ეს ძალიან სასარგებლოა, როდესაც სტანდარტიზებულ ფორმებს ვუყურებთ და საშინელი დროის დაზოგვა და ეფექტურობის გაუმჯობესება შეგვიძლია.
მოსავლის რეგიონების გამოსაყენებლად, ჩვენ უნდა დავამატოთ სისტემის მითითება System.Drawing რათა გამოვიყენოთ System.Drawing.Rectangle ობიექტი.
using IronOcr;
var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Define and process a specific content area
using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// Dimensions are in pixels
Input.Add("document.png", ContentArea);
// Perform OCR
var Result = Ocr.Read(Input);
// Output the result
Console.WriteLine(Result.Text);
}using IronOcr;
var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Define and process a specific content area
using (var Input = new OcrInput())
{
var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
// Dimensions are in pixels
Input.Add("document.png", ContentArea);
// Perform OCR
var Result = Ocr.Read(Input);
// Output the result
Console.WriteLine(Result.Text);
}OCR დაბალი ხარისხის სკანირებისთვის
IronOCR OcrInput კლასს შეუძლია დააფიქსიროს სკანირება, რომლის წაკითხვაც შეუძლებელია ნორმალურ Tesseract-ს.
using IronOcr;
var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Process low-quality scanned image
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // Removes digital noise from the image
Input.Deskew(); // Corrects rotation and perspective
// Perform OCR
var Result = Ocr.Read(Input);
// Output the result
Console.WriteLine(Result.Text);
}using IronOcr;
var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Process low-quality scanned image
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
Input.DeNoise(); // Removes digital noise from the image
Input.Deskew(); // Corrects rotation and perspective
// Perform OCR
var Result = Ocr.Read(Input);
// Output the result
Console.WriteLine(Result.Text);
}ექსპორტის OCR შედეგები, როგორც საძიებო PDF
სურათი PDF- ში, ტექსტური ტექსტების დასაწერად. ინდექსირება შესაძლებელია საძიებო სისტემებისა და მონაცემთა ბაზების მიერ.
using IronOcr;
var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Create input for PDF export
using (var Input = new OcrInput())
{
Input.Title = "Quarterly Report";
Input.AddImage("image1.jpeg");
Input.AddImage("image2.png");
Input.AddImage("image3.gif");
// Perform OCR and save as PDF
var Result = Ocr.Read(Input);
Result.SaveAsSearchablePdf("searchable.pdf");
}using IronOcr;
var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Create input for PDF export
using (var Input = new OcrInput())
{
Input.Title = "Quarterly Report";
Input.AddImage("image1.jpeg");
Input.AddImage("image2.png");
Input.AddImage("image3.gif");
// Perform OCR and save as PDF
var Result = Ocr.Read(Input);
Result.SaveAsSearchablePdf("searchable.pdf");
}TIFF საძიებო PDF კონვერტაციისთვის
ჩართეთ TIFF დოკუმენტი (ან გამოსახულების ფაილების ნებისმიერი ჯგუფი) პირდაპირ საძიებო PDF ფორმატში, რომლის ინდექსაცია შესაძლებელია ინტრანეტის, ვებსაიტებისა და Google საძიებო სისტემების მიერ.
using IronOcr;
var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Convert TIFF to searchable PDF
using (var Input = new OcrInput())
{
Input.AddMultiFrameTiff("example.tiff");
var Result = Ocr.Read(Input).SaveAsSearchablePdf("searchable.pdf");
}using IronOcr;
var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Convert TIFF to searchable PDF
using (var Input = new OcrInput())
{
Input.AddMultiFrameTiff("example.tiff");
var Result = Ocr.Read(Input).SaveAsSearchablePdf("searchable.pdf");
}ექსპორტის OCR შედეგები HTML- ით
OCR გამოსახულების XHTML გარდაქმნა.
using IronOcr;
var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Create OCR input for HTML export
using (var Input = new OcrInput())
{
Input.Title = "Html Title";
Input.AddImage("image1.jpeg");
// Perform OCR and save as XHTML
var Result = Ocr.Read(Input);
Result.SaveAsHocrFile("results.html");
}using IronOcr;
var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Create OCR input for HTML export
using (var Input = new OcrInput())
{
Input.Title = "Html Title";
Input.AddImage("image1.jpeg");
// Perform OCR and save as XHTML
var Result = Ocr.Read(Input);
Result.SaveAsHocrFile("results.html");
}OCR გამოსახულების გამაძლიერებელი ფილტრები
IronOCR გთავაზობთ უნიკალურ ფილტრებს OcrInput ობიექტებისთვის, OCR–ის მუშაობის გასაუმჯობესებლად.
სურათის გაუმჯობესების კოდის მაგალითი
OCR შეყვანის სურათებს უფრო მაღალ ხარისხს უკეთებს, უფრო სწრაფად OCR შედეგებს.
using IronOcr;
var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Load and process low-quality image
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // Removes digital noise from the image
Input.Deskew(); // Corrects rotation and perspective
// Perform OCR
var Result = Ocr.Read(Input);
// Output the result
Console.WriteLine(Result.Text);
}using IronOcr;
var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;
// Load and process low-quality image
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
Input.DeNoise(); // Removes digital noise from the image
Input.Deskew(); // Corrects rotation and perspective
// Perform OCR
var Result = Ocr.Read(Input);
// Output the result
Console.WriteLine(Result.Text);
}




