ქართული OCR C#და .NET- ში

ამ დოკუმენტის სხვა ვერსიები:

IronOCR არის C# პროგრამული უზრუნველყოფის კომპონენტი, რომელიც საშუალებას აძლევს .NET კოდირებს წაიკითხონ ტექსტები სურათებიდან და PDF დოკუმენტებიდან 126 ენაზე, მათ შორის ქართულად.

ეს არის Tesseract-ის მოწინავე ჩანგალი, რომელიც შექმნილია მხოლოდ .NET დეველოპერებისთვის და რეგულარულად აღემატება Tesseract-ის სხვა ძრავებს როგორც სიჩქარით, ასევე სიზუსტით.

IronOcr. ენების შინაარსი. ქართული

ეს პაკეტი შეიცავს 176 OCR ენას .NET–ისთვის:

  • GeorgianAlphabet
  • GeorgianAlphabetBest
  • GeorgianAlphabetFast
  • ქართველი
  • GeorgianBest
  • GeorgianFast
  • GeorgianOld
  • GeorgianOldBest
  • GeorgianOldFast

გადმოწერა

ქართული ენის პაკეტი [ქართული]

ინსტალაცია

პირველი, რაც უნდა გავაკეთოთ, არის დააყენოთ ჩვენი Georgian OCR პაკეტი თქვენი .NET პროექტი.

Install-Package IronOCR.Languages.Georgian

კოდის მაგალითი

C# კოდის ეს მაგალითი კითხულობს ქართულ ტექსტს Image ან PDF დოკუმენტიდან.

// Install the Georgian language package for IronOCR
// PM> Install-Package IronOCR.Languages.Georgian

using IronOcr;

var Ocr = new IronTesseract();
// Set the OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;

// Load an input image for OCR
using (var Input = new OcrInput(@"images\Georgian.png"))
{
    // Perform OCR reading on the input image
    var Result = Ocr.Read(Input);
    // Retrieve the recognized text
    var AllText = Result.Text;
}
// Install the Georgian language package for IronOCR
// PM> Install-Package IronOCR.Languages.Georgian

using IronOcr;

var Ocr = new IronTesseract();
// Set the OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;

// Load an input image for OCR
using (var Input = new OcrInput(@"images\Georgian.png"))
{
    // Perform OCR reading on the input image
    var Result = Ocr.Read(Input);
    // Retrieve the recognized text
    var AllText = Result.Text;
}
' Install the Georgian language package for IronOCR
' PM> Install-Package IronOCR.Languages.Georgian

Imports IronOcr

Private Ocr = New IronTesseract()
' Set the OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian

' Load an input image for OCR
Using Input = New OcrInput("images\Georgian.png")
	' Perform OCR reading on the input image
	Dim Result = Ocr.Read(Input)
	' Retrieve the recognized text
	Dim AllText = Result.Text
End Using
$vbLabelText   $csharpLabel

რატომ უნდა აირჩიოთ IronOCR?

IronOCR არის მარტივი ინსტალაცია, სრული და კარგად დოკუმენტირებული .NET პროგრამული უზრუნველყოფის ბიბლიოთეკა.

შეარჩიეთ IronOCR 99.8% + OCR სიზუსტის მისაღწევად, ყოველგვარი გარე ვებ-სერვისების, მიმდინარე გადასახადების ან ინტერნეტით კონფიდენციალური დოკუმენტების გაგზავნის გარეშე.

რატომ ირჩევენ C#დეველოპერები IronOCR–ს ვიდრე Vanilla Tesseract–ს:

  • დააინსტალირეთ როგორც ერთი DLL ან NuGet
  • მოყვება Tesseract 5, 4 და 3 ძრავები ყუთში.
  • სიზუსტე 99.8% მნიშვნელოვნად აღემატება რეგულარულ Tesseract-ს.
  • Blazing სიჩქარე და MultiThreading
  • MVC, WebApp, Desktop, Console & Server Application თავსებადია
  • Exes ან C ++ კოდი არ მუშაობს
  • სრული PDF OCR მხარდაჭერა
  • OCR–ს შესასრულებლად თითქმის ნებისმიერი გამოსახულების ფაილი ან PDF
  • სრული .NET Core, Standard და Framework მხარდაჭერა
  • განათავსეთ Windows, Mac, Linux, Azure, Docker, Lambda, AWS
  • წაიკითხეთ შტრიხ-კოდები და QR კოდები
  • ექსპორტი OCR როგორც XHTML
  • ექსპორტი OCR საძიებო PDF დოკუმენტებზე
  • მრავალრიცხოვანი მხარდაჭერა
  • 126 საერთაშორისო ენა მართულია NuGet ან OcrData ფაილების საშუალებით
  • ამოიღეთ სურათები, კოორდინატები, სტატისტიკა და შრიფტები. არა მხოლოდ ტექსტი.
  • შეიძლება გამოყენებულ იქნას Tesseract OCR- ის გადანაწილება კომერციული და საკუთრების პროგრამებში.

რკინის OCR ანათებს რეალურ სამყაროს სურათებთან და არასრულყოფილ დოკუმენტებთან მუშაობისას, როგორიცაა ფოტოსურათები, ან დაბალი რეზოლუციის სკანირება, რომლებსაც შეიძლება ჰქონდეთ ციფრული ხმაური ან არასრულყოფილება.

სხვა უფასო OCR ბიბლიოთეკები .NET პლატფორმისთვის, როგორიცაა სხვა .net tesseract API და ვებ-სერვისები არც ისე კარგად მუშაობს ამ რეალურ სამყაროში გამოყენების შემთხვევებში.

OCR Tesseract 5 – ით - დაიწყეთ კოდირება C #– ით

ქვემოთ მოცემული კოდის ნიმუში გვიჩვენებს, თუ რამდენად ადვილია ტექსტის წაკითხვა სურათზე C#ან VB.NET გამოყენებით.

OneLiner

// A simple example of reading text using IronTesseract
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
// A simple example of reading text using IronTesseract
string Text = new IronTesseract().Read(@"img\Screenshot.png").Text;
' A simple example of reading text using IronTesseract
Dim Text As String = (New IronTesseract()).Read("img\Screenshot.png").Text
$vbLabelText   $csharpLabel

კონფიგურირებადი Hello World

// PM> Install-Package IronOCR.Languages.Georgian

using IronOcr;

var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;

// Create a new input for OCR
using (var Input = new OcrInput())
{
    // Add an image for OCR processing
    Input.AddImage("images/sample.jpeg");
    //... You can add as many images as needed

    // Read the image using OCR
    var Result = Ocr.Read(Input);

    // Output the OCR result
    Console.WriteLine(Result.Text);
}
// PM> Install-Package IronOCR.Languages.Georgian

using IronOcr;

var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;

// Create a new input for OCR
using (var Input = new OcrInput())
{
    // Add an image for OCR processing
    Input.AddImage("images/sample.jpeg");
    //... You can add as many images as needed

    // Read the image using OCR
    var Result = Ocr.Read(Input);

    // Output the OCR result
    Console.WriteLine(Result.Text);
}
' PM> Install-Package IronOCR.Languages.Georgian

Imports IronOcr

Private Ocr = New IronTesseract()
' Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian

' Create a new input for OCR
Using Input = New OcrInput()
	' Add an image for OCR processing
	Input.AddImage("images/sample.jpeg")
	'... You can add as many images as needed

	' Read the image using OCR
	Dim Result = Ocr.Read(Input)

	' Output the OCR result
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

C#PDF OCR

ესე მიდგომა შეიძლება გამოყენებულ იქნას ნებისმიერი PDF დოკუმენტიდან ტექსტის ამოსაღებად.

using IronOcr;

var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;

// Load and process a PDF file with OCR
using (var input = new OcrInput())
{
    input.AddPdf("example.pdf", "password");
    // Optional: specify page numbers for OCR if needed

    // Perform OCR
    var Result = Ocr.Read(input);

    // Print results
    Console.WriteLine(Result.Text);
    Console.WriteLine($"{Result.Pages.Count} Pages");
    // Outputs the number of pages processed
}
using IronOcr;

var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;

// Load and process a PDF file with OCR
using (var input = new OcrInput())
{
    input.AddPdf("example.pdf", "password");
    // Optional: specify page numbers for OCR if needed

    // Perform OCR
    var Result = Ocr.Read(input);

    // Print results
    Console.WriteLine(Result.Text);
    Console.WriteLine($"{Result.Pages.Count} Pages");
    // Outputs the number of pages processed
}
Imports IronOcr

Private Ocr = New IronTesseract()
' Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian

' Load and process a PDF file with OCR
Using input = New OcrInput()
	input.AddPdf("example.pdf", "password")
	' Optional: specify page numbers for OCR if needed

	' Perform OCR
	Dim Result = Ocr.Read(input)

	' Print results
	Console.WriteLine(Result.Text)
	Console.WriteLine($"{Result.Pages.Count} Pages")
	' Outputs the number of pages processed
End Using
$vbLabelText   $csharpLabel

OCR MultiPage TIFF-ებისთვის

OCR კითხულობს TIFF ფაილის ფორმატს, მრავალჯერადი გვერდის დოკუმენტების ჩათვლით. TIFF ასევე შეიძლება გადაკეთდეს პირდაპირ PDF ფაილში, საძიებო ტექსტით.

using IronOcr;

var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;

// Process multi-frame TIFF with OCR
using (var Input = new OcrInput())
{
    Input.AddMultiFrameTiff("multi-frame.tiff");

    // Perform OCR
    var Result = Ocr.Read(Input);

    // Output the result
    Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;

// Process multi-frame TIFF with OCR
using (var Input = new OcrInput())
{
    Input.AddMultiFrameTiff("multi-frame.tiff");

    // Perform OCR
    var Result = Ocr.Read(Input);

    // Output the result
    Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
' Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian

' Process multi-frame TIFF with OCR
Using Input = New OcrInput()
	Input.AddMultiFrameTiff("multi-frame.tiff")

	' Perform OCR
	Dim Result = Ocr.Read(Input)

	' Output the result
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

შტრიხკოდები და QR

რკინის OCR–ის უნიკალური მახასიათებელია ის, რომ მას შეუძლია წაიკითხოს შტრიხ – კოდები და QR კოდები დოკუმენტებიდან, როდესაც იგი სკანირებს ტექსტს. OcrResult.OcrBarcode კლასის შემთხვევები დეველოპერს აძლევს დეტალურ ინფორმაციას თითოეული დასკანირებული შტრიხ- კოდის შესახებ.

using IronOcr;

var Ocr = new IronTesseract();
// Enable barcode reading
Ocr.Configuration.ReadBarCodes = true;

// Create OCR input for scanning
using (var input = new OcrInput())
{
    input.AddImage("img/Barcode.png");

    // Perform OCR
    var Result = Ocr.Read(input);

    // Loop through the barcodes
    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
        // Additionally, type and location properties are exposed
    }
}
using IronOcr;

var Ocr = new IronTesseract();
// Enable barcode reading
Ocr.Configuration.ReadBarCodes = true;

// Create OCR input for scanning
using (var input = new OcrInput())
{
    input.AddImage("img/Barcode.png");

    // Perform OCR
    var Result = Ocr.Read(input);

    // Loop through the barcodes
    foreach (var Barcode in Result.Barcodes)
    {
        Console.WriteLine(Barcode.Value);
        // Additionally, type and location properties are exposed
    }
}
Imports IronOcr

Private Ocr = New IronTesseract()
' Enable barcode reading
Ocr.Configuration.ReadBarCodes = True

' Create OCR input for scanning
Using input = New OcrInput()
	input.AddImage("img/Barcode.png")

	' Perform OCR
	Dim Result = Ocr.Read(input)

	' Loop through the barcodes
	For Each Barcode In Result.Barcodes
		Console.WriteLine(Barcode.Value)
		' Additionally, type and location properties are exposed
	Next Barcode
End Using
$vbLabelText   $csharpLabel

OCR სურათების კონკრეტულ ადგილებში

რკინის OCR- ის სკანირებისა და კითხვის ყველა მეთოდი საშუალებას გაძლევთ ზუსტად განსაზღვროთ გვერდის რომელი გვერდის ან გვერდების ტექსტი. ეს ძალიან სასარგებლოა, როდესაც სტანდარტიზებულ ფორმებს ვუყურებთ და საშინელი დროის დაზოგვა და ეფექტურობის გაუმჯობესება შეგვიძლია.

მოსავლის რეგიონების გამოსაყენებლად, ჩვენ უნდა დავამატოთ სისტემის მითითება System.Drawing რათა გამოვიყენოთ System.Drawing.Rectangle ობიექტი.

using IronOcr;

var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;

// Define and process a specific content area
using (var Input = new OcrInput())
{
    var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
    // Dimensions are in pixels

    Input.Add("document.png", ContentArea);

    // Perform OCR
    var Result = Ocr.Read(Input);

    // Output the result
    Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;

// Define and process a specific content area
using (var Input = new OcrInput())
{
    var ContentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 };
    // Dimensions are in pixels

    Input.Add("document.png", ContentArea);

    // Perform OCR
    var Result = Ocr.Read(Input);

    // Output the result
    Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
' Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian

' Define and process a specific content area
Using Input = New OcrInput()
	Dim ContentArea = New System.Drawing.Rectangle() With {
		.X = 215,
		.Y = 1250,
		.Height = 280,
		.Width = 1335
	}
	' Dimensions are in pixels

	Input.Add("document.png", ContentArea)

	' Perform OCR
	Dim Result = Ocr.Read(Input)

	' Output the result
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

OCR დაბალი ხარისხის სკანირებისთვის

IronOCR OcrInput კლასს შეუძლია დააფიქსიროს სკანირება, რომლის წაკითხვაც შეუძლებელია ნორმალურ Tesseract-ს.

using IronOcr;

var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;

// Process low-quality scanned image
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
    Input.DeNoise(); // Removes digital noise from the image
    Input.Deskew();  // Corrects rotation and perspective

    // Perform OCR
    var Result = Ocr.Read(Input);

    // Output the result
    Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;

// Process low-quality scanned image
using (var Input = new OcrInput(@"img\Potter.LowQuality.tiff"))
{
    Input.DeNoise(); // Removes digital noise from the image
    Input.Deskew();  // Corrects rotation and perspective

    // Perform OCR
    var Result = Ocr.Read(Input);

    // Output the result
    Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
' Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian

' Process low-quality scanned image
Using Input = New OcrInput("img\Potter.LowQuality.tiff")
	Input.DeNoise() ' Removes digital noise from the image
	Input.Deskew() ' Corrects rotation and perspective

	' Perform OCR
	Dim Result = Ocr.Read(Input)

	' Output the result
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel

ექსპორტის OCR შედეგები, როგორც საძიებო PDF

სურათი PDF- ში, ტექსტური ტექსტების დასაწერად. ინდექსირება შესაძლებელია საძიებო სისტემებისა და მონაცემთა ბაზების მიერ.

using IronOcr;

var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;

// Create input for PDF export
using (var Input = new OcrInput())
{
    Input.Title = "Quarterly Report";
    Input.AddImage("image1.jpeg");
    Input.AddImage("image2.png");
    Input.AddImage("image3.gif");

    // Perform OCR and save as PDF
    var Result = Ocr.Read(Input);
    Result.SaveAsSearchablePdf("searchable.pdf");
}
using IronOcr;

var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;

// Create input for PDF export
using (var Input = new OcrInput())
{
    Input.Title = "Quarterly Report";
    Input.AddImage("image1.jpeg");
    Input.AddImage("image2.png");
    Input.AddImage("image3.gif");

    // Perform OCR and save as PDF
    var Result = Ocr.Read(Input);
    Result.SaveAsSearchablePdf("searchable.pdf");
}
Imports IronOcr

Private Ocr = New IronTesseract()
' Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian

' Create input for PDF export
Using Input = New OcrInput()
	Input.Title = "Quarterly Report"
	Input.AddImage("image1.jpeg")
	Input.AddImage("image2.png")
	Input.AddImage("image3.gif")

	' Perform OCR and save as PDF
	Dim Result = Ocr.Read(Input)
	Result.SaveAsSearchablePdf("searchable.pdf")
End Using
$vbLabelText   $csharpLabel

TIFF საძიებო PDF კონვერტაციისთვის

ჩართეთ TIFF დოკუმენტი (ან გამოსახულების ფაილების ნებისმიერი ჯგუფი) პირდაპირ საძიებო PDF ფორმატში, რომლის ინდექსაცია შესაძლებელია ინტრანეტის, ვებსაიტებისა და Google საძიებო სისტემების მიერ.

using IronOcr;

var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;

// Convert TIFF to searchable PDF
using (var Input = new OcrInput())
{
    Input.AddMultiFrameTiff("example.tiff");

    var Result = Ocr.Read(Input).SaveAsSearchablePdf("searchable.pdf");
}
using IronOcr;

var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;

// Convert TIFF to searchable PDF
using (var Input = new OcrInput())
{
    Input.AddMultiFrameTiff("example.tiff");

    var Result = Ocr.Read(Input).SaveAsSearchablePdf("searchable.pdf");
}
Imports IronOcr

Private Ocr = New IronTesseract()
' Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian

' Convert TIFF to searchable PDF
Using Input = New OcrInput()
	Input.AddMultiFrameTiff("example.tiff")

	Dim Result = Ocr.Read(Input).SaveAsSearchablePdf("searchable.pdf")
End Using
$vbLabelText   $csharpLabel

ექსპორტის OCR შედეგები HTML- ით

OCR გამოსახულების XHTML გარდაქმნა.

using IronOcr;

var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;

// Create OCR input for HTML export
using (var Input = new OcrInput())
{
    Input.Title = "Html Title";
    Input.AddImage("image1.jpeg");

    // Perform OCR and save as XHTML
    var Result = Ocr.Read(Input);
    Result.SaveAsHocrFile("results.html");
}
using IronOcr;

var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;

// Create OCR input for HTML export
using (var Input = new OcrInput())
{
    Input.Title = "Html Title";
    Input.AddImage("image1.jpeg");

    // Perform OCR and save as XHTML
    var Result = Ocr.Read(Input);
    Result.SaveAsHocrFile("results.html");
}
Imports IronOcr

Private Ocr = New IronTesseract()
' Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian

' Create OCR input for HTML export
Using Input = New OcrInput()
	Input.Title = "Html Title"
	Input.AddImage("image1.jpeg")

	' Perform OCR and save as XHTML
	Dim Result = Ocr.Read(Input)
	Result.SaveAsHocrFile("results.html")
End Using
$vbLabelText   $csharpLabel

OCR გამოსახულების გამაძლიერებელი ფილტრები

IronOCR გთავაზობთ უნიკალურ ფილტრებს OcrInput ობიექტებისთვის, OCR–ის მუშაობის გასაუმჯობესებლად.

სურათის გაუმჯობესების კოდის მაგალითი

OCR შეყვანის სურათებს უფრო მაღალ ხარისხს უკეთებს, უფრო სწრაფად OCR შედეგებს.

using IronOcr;

var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;

// Load and process low-quality image
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
    Input.DeNoise(); // Removes digital noise from the image
    Input.Deskew();  // Corrects rotation and perspective

    // Perform OCR
    var Result = Ocr.Read(Input);

    // Output the result
    Console.WriteLine(Result.Text);
}
using IronOcr;

var Ocr = new IronTesseract();
// Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian;

// Load and process low-quality image
using (var Input = new OcrInput(@"LowQuality.jpeg"))
{
    Input.DeNoise(); // Removes digital noise from the image
    Input.Deskew();  // Corrects rotation and perspective

    // Perform OCR
    var Result = Ocr.Read(Input);

    // Output the result
    Console.WriteLine(Result.Text);
}
Imports IronOcr

Private Ocr = New IronTesseract()
' Set OCR language to Georgian
Ocr.Language = OcrLanguage.Georgian

' Load and process low-quality image
Using Input = New OcrInput("LowQuality.jpeg")
	Input.DeNoise() ' Removes digital noise from the image
	Input.Deskew() ' Corrects rotation and perspective

	' Perform OCR
	Dim Result = Ocr.Read(Input)

	' Output the result
	Console.WriteLine(Result.Text)
End Using
$vbLabelText   $csharpLabel