Sanskrit OCR in C# and .NET
IronOCR은 .NET 개발자가 산스크리트어를 포함한 126개 언어로 된 이미지와 PDF 문서에서 텍스트를 읽을 수 있도록 해주는 C# 소프트웨어 구성 요소입니다.
이는 .NET 개발자 전용으로 개발된 Tesseract의 고급 포크 버전으로, 속도와 정확도 면에서 다른 Tesseract 엔진보다 뛰어난 성능을 보여줍니다.
IronOcr의 내용.언어.산스크리트어
이 패키지에는 .NET용 OCR 언어 49개가 포함되어 있습니다.
- 산스크리트어
- 산스크리트어 최고
- 산스크리트어패스트
다운로드
산스크리트어 언어 팩 [ससकतम]
설치
첫 번째 단계는 산스크리트어 OCR 패키지를 .NET 프로젝트에 설치하는 것입니다.
Install-Package IronOcr.Languages.Sanskrit
코드 예제
이 C# 코드 예제는 이미지 또는 PDF 문서에서 산스크리트어 텍스트를 읽습니다.
// Import the IronOcr namespace
using IronOcr;
class Program
{
static void Main()
{
// Create an instance of IronTesseract for OCR operations
var Ocr = new IronTesseract
{
// Set the OCR language to Sanskrit
Language = OcrLanguage.Sanskrit
};
// Define the input image or PDF file containing Sanskrit text
using (var Input = new OcrInput(@"images\Sanskrit.png"))
{
// Perform OCR to read the text from the Input
var Result = Ocr.Read(Input);
// Capture the extracted text
var AllText = Result.Text;
// Print the extracted text to the console
System.Console.WriteLine(AllText);
}
}
}
// Import the IronOcr namespace
using IronOcr;
class Program
{
static void Main()
{
// Create an instance of IronTesseract for OCR operations
var Ocr = new IronTesseract
{
// Set the OCR language to Sanskrit
Language = OcrLanguage.Sanskrit
};
// Define the input image or PDF file containing Sanskrit text
using (var Input = new OcrInput(@"images\Sanskrit.png"))
{
// Perform OCR to read the text from the Input
var Result = Ocr.Read(Input);
// Capture the extracted text
var AllText = Result.Text;
// Print the extracted text to the console
System.Console.WriteLine(AllText);
}
}
}
' Import the IronOcr namespace
Imports IronOcr
Friend Class Program
Shared Sub Main()
' Create an instance of IronTesseract for OCR operations
Dim Ocr = New IronTesseract With {.Language = OcrLanguage.Sanskrit}
' Define the input image or PDF file containing Sanskrit text
Using Input = New OcrInput("images\Sanskrit.png")
' Perform OCR to read the text from the Input
Dim Result = Ocr.Read(Input)
' Capture the extracted text
Dim AllText = Result.Text
' Print the extracted text to the console
System.Console.WriteLine(AllText)
End Using
End Sub
End Class
- 이 예시는 IronTesseract를 사용하여 산스크리트어 이미지 또는 PDF 파일에 대해 OCR을 수행하도록 구성하는 방법을 보여줍니다.
Ocr.Read()메서드는 입력을 처리하고Result.Text속성을 통해 접근할 수 있는 텍스트 내용을 추출합니다.

