Name: IronOCR
Brand: Iron Software
Availability: InStock
Rating: 4.86 (101 reviews)

Azure용 OCR 시작하기

국제어

using IronOcr;
using System;

var ocrTesseract = new IronTesseract();

ocrTesseract.Language = OcrLanguage.Arabic;

using (var ocrInput = new OcrInput())
{
    ocrInput.LoadImage(@"images\arabic.gif");
    var ocrResult = ocrTesseract.Read(ocrInput);
    Console.WriteLine(ocrResult.Text);
}

// Example with a Custom Trained Font Being used:

var ocrTesseractCustomerLang = new IronTesseract();
ocrTesseractCustomerLang.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata");
ocrTesseractCustomerLang.AddSecondaryLanguage(OcrLanguage.EnglishBest);

using (var ocrInput = new OcrInput())
{
    ocrInput.LoadPdf(@"images\mixed-lang.pdf");
    var ocrResult = ocrTesseractCustomerLang.Read(ocrInput);
    Console.WriteLine(ocrResult.Text);
}

Imports IronOcr
Imports System

Private ocrTesseract = New IronTesseract()

ocrTesseract.Language = OcrLanguage.Arabic

Using ocrInput As New OcrInput()
	ocrInput.LoadImage("images\arabic.gif")
	Dim ocrResult = ocrTesseract.Read(ocrInput)
	Console.WriteLine(ocrResult.Text)
End Using

' Example with a Custom Trained Font Being used:

Dim ocrTesseractCustomerLang = New IronTesseract()
ocrTesseractCustomerLang.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata")
ocrTesseractCustomerLang.AddSecondaryLanguage(OcrLanguage.EnglishBest)

Using ocrInput As New OcrInput()
	ocrInput.LoadPdf("images\mixed-lang.pdf")
	Dim ocrResult = ocrTesseractCustomerLang.Read(ocrInput)
	Console.WriteLine(ocrResult.Text)
End Using

Install-Package IronOcr

IronOCR 언어 지원

IronOCR 125개 국제 언어를 지원합니다. 기본적으로 설치되는 영어 외에도 NuGet 통해 .NET 프로젝트에 추가 언어 팩을 추가하거나 언어 페이지 에서 다운로드할 수 있습니다.

대부분의 언어는 빠른 화질, 표준 화질(권장), 최고 화질로 제공됩니다. 최상급 품질 옵션은 더 정확한 결과를 제공할 수 있지만 처리 시간이 더 오래 걸립니다.

IronOCR 통해 다양한 언어로 OCR 기능을 살펴보세요.

결과 객체

using IronOcr;
using IronSoftware.Drawing;

// We can delve deep into OCR results as an object model of
// Pages, Barcodes, Paragraphs, Lines, Words and Characters
// This allows us to explore, export and draw OCR content using other APIs/
var ocrTesseract = new IronTesseract();

ocrTesseract.Configuration.ReadBarCodes = true;

using var ocrInput = new OcrInput();
var pages = new int[] { 1, 2 };
ocrInput.LoadImageFrames("example.tiff", pages);

OcrResult ocrResult = ocrTesseract.Read(ocrInput);
foreach (var page in ocrResult.Pages)
{
    // Page object
    int PageNumber = page.PageNumber;
    string PageText = page.Text;
    int PageWordCount = page.WordCount;
    // null if we dont set Ocr.Configuration.ReadBarCodes = true;
    OcrResult.Barcode[] Barcodes = page.Barcodes;
    AnyBitmap PageImage = page.ToBitmap(ocrInput);
    double PageWidth = page.Width;
    double PageHeight = page.Height;
    double PageRotation = page.Rotation; // angular correction in degrees from OcrInput.Deskew()

    foreach (var paragraph in page.Paragraphs)
    {
        // Pages -> Paragraphs
        int ParagraphNumber = paragraph.ParagraphNumber;
        string ParagraphText = paragraph.Text;
        AnyBitmap ParagraphImage = paragraph.ToBitmap(ocrInput);
        int ParagraphX_location = paragraph.X;
        int ParagraphY_location = paragraph.Y;
        int ParagraphWidth = paragraph.Width;
        int ParagraphHeight = paragraph.Height;
        double ParagraphOcrAccuracy = paragraph.Confidence;
        OcrResult.TextFlow paragrapthText_direction = paragraph.TextDirection;
        foreach (var line in paragraph.Lines)
        {
            // Pages -> Paragraphs -> Lines
            int LineNumber = line.LineNumber;
            string LineText = line.Text;
            AnyBitmap LineImage = line.ToBitmap(ocrInput);
            int LineX_location = line.X;
            int LineY_location = line.Y;
            int LineWidth = line.Width;
            int LineHeight = line.Height;
            double LineOcrAccuracy = line.Confidence;
            double LineSkew = line.BaselineAngle;
            double LineOffset = line.BaselineOffset;
            foreach (var word in line.Words)
            {
                // Pages -> Paragraphs -> Lines -> Words
                int WordNumber = word.WordNumber;
                string WordText = word.Text;
                AnyBitmap WordImage = word.ToBitmap(ocrInput);
                int WordX_location = word.X;
                int WordY_location = word.Y;
                int WordWidth = word.Width;
                int WordHeight = word.Height;
                double WordOcrAccuracy = word.Confidence;
                foreach (var character in word.Characters)
                {
                    // Pages -> Paragraphs -> Lines -> Words -> Characters
                    int CharacterNumber = character.CharacterNumber;
                    string CharacterText = character.Text;
                    AnyBitmap CharacterImage = character.ToBitmap(ocrInput);
                    int CharacterX_location = character.X;
                    int CharacterY_location = character.Y;
                    int CharacterWidth = character.Width;
                    int CharacterHeight = character.Height;
                    double CharacterOcrAccuracy = character.Confidence;
                    // Output alternative symbols choices and their probability.
                    // Very useful for spellchecking
                    OcrResult.Choice[] Choices = character.Choices;
                }
            }
        }
    }
}

Imports IronOcr
Imports IronSoftware.Drawing

' We can delve deep into OCR results as an object model of
' Pages, Barcodes, Paragraphs, Lines, Words and Characters
' This allows us to explore, export and draw OCR content using other APIs/
Private ocrTesseract = New IronTesseract()

ocrTesseract.Configuration.ReadBarCodes = True

Dim ocrInput As New OcrInput()
Dim pages = New Integer() { 1, 2 }
ocrInput.LoadImageFrames("example.tiff", pages)

Dim ocrResult As OcrResult = ocrTesseract.Read(ocrInput)
For Each page In ocrResult.Pages
	' Page object
	Dim PageNumber As Integer = page.PageNumber
	Dim PageText As String = page.Text
	Dim PageWordCount As Integer = page.WordCount
	' null if we dont set Ocr.Configuration.ReadBarCodes = true;
	Dim Barcodes() As OcrResult.Barcode = page.Barcodes
	Dim PageImage As AnyBitmap = page.ToBitmap(ocrInput)
	Dim PageWidth As Double = page.Width
	Dim PageHeight As Double = page.Height
	Dim PageRotation As Double = page.Rotation ' angular correction in degrees from OcrInput.Deskew()

	For Each paragraph In page.Paragraphs
		' Pages -> Paragraphs
		Dim ParagraphNumber As Integer = paragraph.ParagraphNumber
		Dim ParagraphText As String = paragraph.Text
		Dim ParagraphImage As AnyBitmap = paragraph.ToBitmap(ocrInput)
		Dim ParagraphX_location As Integer = paragraph.X
		Dim ParagraphY_location As Integer = paragraph.Y
		Dim ParagraphWidth As Integer = paragraph.Width
		Dim ParagraphHeight As Integer = paragraph.Height
		Dim ParagraphOcrAccuracy As Double = paragraph.Confidence
		Dim paragrapthText_direction As OcrResult.TextFlow = paragraph.TextDirection
		For Each line In paragraph.Lines
			' Pages -> Paragraphs -> Lines
			Dim LineNumber As Integer = line.LineNumber
			Dim LineText As String = line.Text
			Dim LineImage As AnyBitmap = line.ToBitmap(ocrInput)
			Dim LineX_location As Integer = line.X
			Dim LineY_location As Integer = line.Y
			Dim LineWidth As Integer = line.Width
			Dim LineHeight As Integer = line.Height
			Dim LineOcrAccuracy As Double = line.Confidence
			Dim LineSkew As Double = line.BaselineAngle
			Dim LineOffset As Double = line.BaselineOffset
			For Each word In line.Words
				' Pages -> Paragraphs -> Lines -> Words
				Dim WordNumber As Integer = word.WordNumber
				Dim WordText As String = word.Text
				Dim WordImage As AnyBitmap = word.ToBitmap(ocrInput)
				Dim WordX_location As Integer = word.X
				Dim WordY_location As Integer = word.Y
				Dim WordWidth As Integer = word.Width
				Dim WordHeight As Integer = word.Height
				Dim WordOcrAccuracy As Double = word.Confidence
				For Each character In word.Characters
					' Pages -> Paragraphs -> Lines -> Words -> Characters
					Dim CharacterNumber As Integer = character.CharacterNumber
					Dim CharacterText As String = character.Text
					Dim CharacterImage As AnyBitmap = character.ToBitmap(ocrInput)
					Dim CharacterX_location As Integer = character.X
					Dim CharacterY_location As Integer = character.Y
					Dim CharacterWidth As Integer = character.Width
					Dim CharacterHeight As Integer = character.Height
					Dim CharacterOcrAccuracy As Double = character.Confidence
					' Output alternative symbols choices and their probability.
					' Very useful for spellchecking
					Dim Choices() As OcrResult.Choice = character.Choices
				Next character
			Next word
		Next line
	Next paragraph
Next page

Install-Package IronOcr

IronOCR는 Tesseract 5를 사용하여 스캔한 각 페이지에 대한 고급 결과 객체를 반환합니다. 이는 위치 데이터, 이미지, 텍스트, 통계적 신뢰도, 대체 기호 선택, 폰트 이름, 폰트 크기 장식, 폰트 굵기 및 위치를 각각 포함합니다:

Page
Paragraph
텍스트의 줄
Word
개별 문자
Barcode

IronOCR로 OCR 결과를 읽는 방법을 탐색하십시오

개발팀에서 직접 제공하는 인적 지원

제품, 통합 또는 라이선스 관련 문의 사항이 있으시면 Iron 제품 개발팀이 언제든지 지원해 드립니다. 지금 바로 Iron에 연락하여 프로젝트에 Iron 라이브러리를 최대한 활용하는 방법을 알아보세요.

질문하기

.NET 기반 Azure용 OCR 읽기 엔진

불완전한 이미지 처리를 위한 최고의 Microsoft Azure OCR 솔루션

여권 페이지, 청구서, 은행 명세서, 우편물, 명함, 영수증 등 무엇이든 간에, 광학 문자 인식(OCR)은 패턴 인식, 컴퓨터 비전 및 기계 학습을 기반으로 하는 연구 분야입니다. 기업들은 회계 및 재무 시스템, 비즈니스 디지털화, 기업 콘텐츠 관리 및 데이터 보고 시스템에서 텍스트를 추출하기 위해 부서 간 협업을 통해 OCR을 활용합니다.

IronOCR은 다른 성공 사례들을 구축하는 것 외에도 네이티브 C# OCR 라이브러리인 IronOCR을 통해 Google Tesseract 및 Microsoft 2021 Azure Cognitive Services에 가치를 더합니다.

실제 이미지를 99% 정확도로 변환하고 싶다면, IronOCR을 사용하여 효율적이고 정확하며 확장 가능하고 거의 사람 수준의 광학 문자 인식 애플리케이션을 구축하는 방법을 알아보세요.

IronOCR은 시장 경쟁력과 시장 선도성을 가르는 광학 문자 인식 기술의 차이를 만들어냅니다.

광학 문자 인식(OCR)은 다양한 API들이 높은 수준의 보안성을 보장한다고 주장하기 때문에 이미 해결된 문제로 여겨집니다. 그러나 이러한 제품들은 종종 경직되고 정확도가 떨어져 실제 응용 분야에서 제대로 작동하지 못하는 경우가 많습니다. 테서랙트 OCR은 기계로 인쇄된 고해상도의 완벽한 텍스트에서도 작동합니다.

괜찮으시겠어요?

하지만 현실 세계는 항상 완벽하게 인쇄되거나 고해상도로 필기된 텍스트로만 존재하는 것은 아닙니다. IronOCR은 회전, 기울어짐, 낮은 DPI, 배경 노이즈 등 디지털 이미지의 모든 불완전한 요소들을 해결하며, 이미지 파일에서 필기체 텍스트를 추출하는 기능까지 제공합니다. 99.8~100%의 정확도로 검색 가능한 문서를 생성하며, Windows, Linux, macOS, Microsoft Azure, AWS, Docker 등 다양한 플랫폼을 지원합니다. C# 개발자들이 (기본적인) Tesseract OCR 대신 IronOCR을 선택하는 데에는 이유가 있습니다. 바로 가치를 더하기 때문입니다.

최고의 장비로 무장하세요!

위에서 언급한 내용 외에도 IronOCR은 이미지 문서를 신속하게 처리할 수 있도록 지원합니다. 이뿐만 아니라 IronOCR API의 기능은 다음과 같습니다.

OCR을 사용하여 거의 모든 파일, 이미지 또는 PDF에서 인쇄된 텍스트를 탁월한 정확도와 초고속으로 추출하세요.
PDF 파일과 이미지에서 텍스트를 추출하여 완벽한 시각적 및 공간적 표현으로 검색 가능한 문서로 변환합니다.
실행 파일이나 C++ 코드가 필요하지 않습니다.
PDF OCR 완벽 지원
MVC, 웹 애플리케이션, 데스크톱, 콘솔 및 서버 애플리케이션과 호환됩니다.
.NET Core, Standard 및 Framework를 완벽하게 지원합니다.
C# 및 VB .NET을 사용하여 읽기
OCR 결과를 XHTML로 내보내기
멀티스레딩을 지원합니다.
125개 국제 언어를 지원하며, 바로 사용할 수 있는 언어 팩과 사용자 지정 빌드를 제공합니다.
이미지, 좌표, 통계, 글꼴 등을 추출합니다.
상용 및 독점 애플리케이션 내에서 Tesseract OCR을 재배포합니다.
로컬에서 실행되며 SaaS가 필요하지 않습니다.
Microsoft Cognitive Services의 OCR 서비스에 대한 훌륭한 대안입니다.

사실상 무제한적인 기능 - IronOCR은 디지털 작업 공간을 위한 최고의 광학 문자 인식(OCR) 도구입니다.

네이티브 .dll 또는 .exe 설치 방식에서 단일 소스로 전환하여, 간단한 C# API를 지원하는 단일 네이티브 .NET 컴포넌트 라이브러리를 사용하여 개발하세요.

.NET Framework 4.5 이상
.NET Standard 2.0 이상 (3.x 및 .NET 5 베타 포함)
.NET Core 2.0 이상 (3.x 및 .NET 5 베타 포함)
.NET 5
macOS용 Xamarin

IronOCR API의 장점은 여기서 끝나지 않습니다. 더욱 다양한 기술적 기능을 탐색해 보실 수 있습니다. IronOCR은 문서 처리 애플리케이션을 간소화하고 업계 최고 수준의 기능을 제공하여 비즈니스 수익을 극대화하는 안정적인 솔루션을 개발함으로써 비즈니스 복잡성을 단계적으로 줄여나갑니다.

순수 .NET OCR API 기능
로컬 OCR 작업, 클라우드 미사용으로 보안 강화
최적화된 저품질, 노이즈 및 왜곡된 스캔 리소스를 생성합니다.
PDF 파일과 여러 페이지로 구성된 TIFF 파일을 읽습니다.
OCR 스캔 샘플을 사용자가 검색할 수 있는 PDF 문서 또는 XHTML 파일로 저장할 수 있습니다.
일반 텍스트, 바코드 데이터 및 단락, 줄, 단어, 문자를 포함하는 OCR 결과 클래스

IronOCR API Edge: 컴퓨터 비전의 요구를 충족할 수 있을까?

IronOCR의 광학 문자 인식(OCR) 프로세스는 자동 이미지 전처리로 시작하여 이미지 파일을 개선하고 추출 응답률을 향상시킵니다. IronOCR은 사용자가 예제 기본 이미지 파일을 최적의 버전으로 추출할 수 있도록 지원함으로써 작업에 가치를 더합니다. IronOCR은 모든 경우를 포괄합니다.

해상도 향상

IronOCR 서비스는 300DPI(인치당 도트 수) 이미지 파일에서 최적의 성능을 발휘하므로, 200~300DPI 범위를 크게 벗어난 이미지는 목표 범위에 맞도록 재샘플링됩니다.

이는 600 DPI 이미지를 300 DPI로 다운샘플링하거나 100 DPI 이미지를 200 DPI로 업샘플링할 때 99%의 신뢰도를 보장합니다.

이진화

IronOCR의 인지 서비스는 흑백 이미지에서 작동하도록 설계되었으므로, 모든 컬러 또는 회색조 이미지는 적응형 이진화 알고리즘을 사용하여 흑백 이미지로 변환됩니다.

이 알고리즘은 영역 내 픽셀 밀도를 비교하여 픽셀을 흑백으로 변환하는 데 사용할 임계값을 결정합니다.

자동 회전 및 기울기 보정

IronOCR은 텍스트 줄과 문자 패턴을 분석하여 입력 이미지 리소스를 원하는 방향으로 자동으로 기울이고 회전시킵니다.

적응형 노이즈 제거

IronOCR은 이미지 파일에서 노이즈의 존재 여부와 양을 자동으로 분석합니다. 노이즈는 스캔된 이미지에서 발견되는 작은 점들을 말합니다. IronOCR의 적응형 알고리즘은 노이즈 입자의 크기에 따라 노이즈를 제거합니다.

샘플 이미지 파일의 전처리가 완료되면 IronOCR은 입력 이미지 파일을 여러 처리 영역으로 나눕니다.

지대 설정

사전 준비 단계 중 하나는 참조 이미지를 여러 논리적 영역으로 나누는 것입니다. IronOCR은 먼저 공백과 패턴을 이용하여 이미지 내에서 텍스트와 그림을 찾아냅니다. 그런 다음 텍스트 영역을 이미지 영역에서 분리합니다.

그런 다음 텍스트는 단락, 열, 텍스트 블록과 같은 영역으로 분할됩니다. 이미지와 나머지 텍스트가 아닌 픽셀은 텍스트 인식 과정에서 제외되고 스마트 출력에 포함되도록 식별됩니다. IronOCR은 격자선과 텍스트 블록을 이용하여 텍스트 영역을 표로 표시합니다.

텍스트 인식 기능

픽셀 덩어리를 사용자가 검색할 수 있는 단일 행 텍스트로 변환하는 여러 상호 연결된 단계를 수행합니다. 여기에는 문자 분할, 적응형 분류, 사전 참조 및 최적의 추출 텍스트를 생성하는 데 기여하는 기타 관련 프로세스가 포함됩니다.

검증된 다중 매개변수

IronOCR API 서비스를 이용하여 단어 수준, 기호 정확도, Microsoft Office 형식의 레이아웃 유지 등 다양한 언어의 여러 데이터 파일 예제를 통해 도구를 테스트했습니다. 일부 매개변수는 자동으로 테스트되지만, 다른 매개변수는 시각적 검사를 통해 확인합니다.

IronOCR과 연결하세요 - 이상적인 OCR 인지 서비스 솔루션

IronOCR을 사용하면 검색 가능한 일반 텍스트 문자열에 다양한 입력 형식을 지원하는 크로스 플랫폼 OCR 기능을 추가할 수 있습니다. IronOCR을 통해 생산성을 향상시키려면 IronOCR 사용 방법을 안내하는 무료 튜토리얼 문서를 참조하세요. 지금 바로 NuGet Install-Package 프로그램을 다운로드하고 무료 평가판 키로 사용해 보거나 연중무휴 24시간 지원을 받으세요. 팀 규모에 관계없이 평생 라이선스를 통해 필요에 따라 확장할 수 있습니다.

~와 협력합니다 .NET, VB.NET, C#

라이선스 보기