푸터 콘텐츠로 바로가기

.NET OCR 샘플로 시작해 보세요

C# + VB.NET: AutoOcr AutoOcr
using IronOcr;

string imageText = new IronTesseract().Read(@"images\image.png").Text;
Install-Package IronOcr

IronOCR는 불완전하게 스캔된 이미지와 PDF 문서에서 텍스트를 자동으로 감지하고 읽어내는 독특한 기능을 가지고 있습니다. IronTesseract 클래스는 가장 간단한 API를 제공합니다.

다른 코드 샘플을 시도하여 C# OCR 작업에 대한 세밀한 제어를 얻으세요.

IronOCR는 향상된 속도, 정확성, 네이티브 DLL 및 API를 통해 모든 플랫폼에서 사용 가능한 Tesseract의 가장 진보된 빌드를 제공합니다.

.NET Framework, Standard, Core, Xamarin 및 Mono에 대해 Tesseract 3, ​​Tesseract 4 및 Tesseract 5를 지원합니다.

Explore the IronTesseract C# OCR How-To Guide

C# + VB.NET: 국제어 국제어
using IronOcr;
using System;

var ocrTesseract = new IronTesseract();

ocrTesseract.Language = OcrLanguage.Arabic;

using (var ocrInput = new OcrInput())
{
    ocrInput.LoadImage(@"images\arabic.gif");
    var ocrResult = ocrTesseract.Read(ocrInput);
    Console.WriteLine(ocrResult.Text);
}

// Example with a Custom Trained Font Being used:

var ocrTesseractCustomerLang = new IronTesseract();
ocrTesseractCustomerLang.UseCustomTesseractLanguageFile("custom_tesseract_files/custom.traineddata");
ocrTesseractCustomerLang.AddSecondaryLanguage(OcrLanguage.EnglishBest);

using (var ocrInput = new OcrInput())
{
    ocrInput.LoadPdf(@"images\mixed-lang.pdf");
    var ocrResult = ocrTesseractCustomerLang.Read(ocrInput);
    Console.WriteLine(ocrResult.Text);
}
Install-Package IronOcr

IronOCR 언어 지원

IronOCR 125개 국제 언어를 지원합니다. 기본적으로 설치되는 영어 외에도 NuGet 통해 .NET 프로젝트에 추가 언어 팩을 추가하거나 언어 페이지 에서 다운로드할 수 있습니다.

대부분의 언어는 빠른 화질, 표준 화질(권장), 최고 화질로 제공됩니다. 최상급 품질 옵션은 더 정확한 결과를 제공할 수 있지만 처리 시간이 더 오래 걸립니다.

IronOCR 통해 다양한 언어로 OCR 기능을 살펴보세요.

C# + VB.NET: 결과 객체 결과 객체
using IronOcr;
using IronSoftware.Drawing;

// We can delve deep into OCR results as an object model of
// Pages, Barcodes, Paragraphs, Lines, Words and Characters
// This allows us to explore, export and draw OCR content using other APIs/
var ocrTesseract = new IronTesseract();

ocrTesseract.Configuration.ReadBarCodes = true;

using var ocrInput = new OcrInput();
var pages = new int[] { 1, 2 };
ocrInput.LoadImageFrames("example.tiff", pages);

OcrResult ocrResult = ocrTesseract.Read(ocrInput);
foreach (var page in ocrResult.Pages)
{
    // Page object
    int PageNumber = page.PageNumber;
    string PageText = page.Text;
    int PageWordCount = page.WordCount;
    // null if we dont set Ocr.Configuration.ReadBarCodes = true;
    OcrResult.Barcode[] Barcodes = page.Barcodes;
    AnyBitmap PageImage = page.ToBitmap(ocrInput);
    double PageWidth = page.Width;
    double PageHeight = page.Height;
    double PageRotation = page.Rotation; // angular correction in degrees from OcrInput.Deskew()

    foreach (var paragraph in page.Paragraphs)
    {
        // Pages -> Paragraphs
        int ParagraphNumber = paragraph.ParagraphNumber;
        string ParagraphText = paragraph.Text;
        AnyBitmap ParagraphImage = paragraph.ToBitmap(ocrInput);
        int ParagraphX_location = paragraph.X;
        int ParagraphY_location = paragraph.Y;
        int ParagraphWidth = paragraph.Width;
        int ParagraphHeight = paragraph.Height;
        double ParagraphOcrAccuracy = paragraph.Confidence;
        OcrResult.TextFlow paragrapthText_direction = paragraph.TextDirection;
        foreach (var line in paragraph.Lines)
        {
            // Pages -> Paragraphs -> Lines
            int LineNumber = line.LineNumber;
            string LineText = line.Text;
            AnyBitmap LineImage = line.ToBitmap(ocrInput);
            int LineX_location = line.X;
            int LineY_location = line.Y;
            int LineWidth = line.Width;
            int LineHeight = line.Height;
            double LineOcrAccuracy = line.Confidence;
            double LineSkew = line.BaselineAngle;
            double LineOffset = line.BaselineOffset;
            foreach (var word in line.Words)
            {
                // Pages -> Paragraphs -> Lines -> Words
                int WordNumber = word.WordNumber;
                string WordText = word.Text;
                AnyBitmap WordImage = word.ToBitmap(ocrInput);
                int WordX_location = word.X;
                int WordY_location = word.Y;
                int WordWidth = word.Width;
                int WordHeight = word.Height;
                double WordOcrAccuracy = word.Confidence;
                foreach (var character in word.Characters)
                {
                    // Pages -> Paragraphs -> Lines -> Words -> Characters
                    int CharacterNumber = character.CharacterNumber;
                    string CharacterText = character.Text;
                    AnyBitmap CharacterImage = character.ToBitmap(ocrInput);
                    int CharacterX_location = character.X;
                    int CharacterY_location = character.Y;
                    int CharacterWidth = character.Width;
                    int CharacterHeight = character.Height;
                    double CharacterOcrAccuracy = character.Confidence;
                    // Output alternative symbols choices and their probability.
                    // Very useful for spellchecking
                    OcrResult.Choice[] Choices = character.Choices;
                }
            }
        }
    }
}
Install-Package IronOcr

IronOCR는 Tesseract 5를 사용하여 스캔한 각 페이지에 대한 고급 결과 객체를 반환합니다. 이는 위치 데이터, 이미지, 텍스트, 통계적 신뢰도, 대체 기호 선택, 폰트 이름, 폰트 크기 장식, 폰트 굵기 및 위치를 각각 포함합니다:

  • Page
  • Paragraph
  • 텍스트의 줄
  • Word
  • 개별 문자
  • Barcode

IronOCR로 OCR 결과를 읽는 방법을 탐색하십시오

Human Support related to .NET Core에서의 OCR

개발팀에서 직접 제공하는 인적 지원

제품, 통합 또는 라이선스 관련 문의 사항이 있으시면 Iron 제품 개발팀이 언제든지 지원해 드립니다. 지금 바로 Iron에 연락하여 프로젝트에 Iron 라이브러리를 최대한 활용하는 방법을 알아보세요.

질문하기
Image To Text related to .NET Core에서의 OCR

광학 문자 인식(OCR) 판독 엔진 - OCR .NET SDK를 사용한 이미지-텍스트 변환

IronOCR(광학 문자 인식) 라이브러리는 개발자가 이미지를 텍스트로 변환할 때 빠르고 효율적인 결과를 얻을 수 있도록 지원합니다. IronOCR은 .NET, VB .NET 및 C#과 호환됩니다. IronOCR은 개발자 여러분의 프로젝트에서 최적의 성능을 달성할 수 있도록 특별히 설계된 최고의 .NET 애플리케이션들을 제공합니다.

OCR은 텍스트 파일, 바코드, QR 코드 등을 인식합니다. 뿐만 아니라 IronOCR은 JPG, PNG, GIF, TIFF, BMP, JPEG, PDF 등 사실상 무제한의 이미지 형식과 파일을 지원하여 웹, Windows 데스크톱 또는 콘솔 .NET 프로젝트에 이미지에서 OCR을 읽어 텍스트를 추출하는 기능을 추가할 수 있는 다양한 방법을 제공합니다.

내부 작동 방식 - IronOCR은 완벽한 결과를 제공합니다

이미지 출력에서 일반 텍스트, 문자, 줄, 단락을 인식하는 결과가 직관적이지 않아 보일 수 있지만, IronOCR의 내부 작동 방식은 생각보다 훨씬 간단합니다. IronOCR은 이미지 정렬을 검사하고, 노이즈 제거 및 필터를 적용하여 품질과 해상도를 확인합니다. 이미지 속성을 분석하고 OCR 엔진을 최적화한 후, 학습된 인공지능 네트워크를 사용하여 사람만큼 정확하게 이미지에서 텍스트를 인식합니다.

OCR은 컴퓨터에게도 간단한 과정이 아닙니다. 하지만 IronOCR은 검색 가능한 문서를 생성하는 전체 과정을 더욱 빠르고 간편하게 만들어주며, 100% 정확도와 최소한의 코드만으로 작업을 완료할 수 있도록 지원합니다.

~와 협력합니다 .NET, VB.NET, C#

튜토리얼을 읽어보세요
Support For Languages related to .NET Core에서의 OCR

다양한 국제 언어와 함께 작업합니다.

소프트웨어는 지리적 경계에 국한되지 않습니다. 기업들은 국경을 넘어 사업을 운영하고 여러 언어를 활용하여 목표를 달성합니다. 마찬가지로, 단일 언어로만 문서 인식을 수행하는 광학 문자 인식(OCR) 도구는 모든 면에서 절대적으로 부적합합니다!

다국어 OCR 지원은 여러분에게 어떤 의미가 있습니까?

다양한 OCR 기능을 제공하는 다국어 OCR 라이브러리를 활용하면 스캔한 PDF 파일이나 이미지를 프랑스어부터 중국어까지 여러 언어로 검색 가능한 PDF 문서로 변환할 수 있습니다. 동적이고 단어 검색이 가능한 PDF 문서를 생성하여 시간과 노력을 절약하고, 본인, 고객 또는 소속 기관에서 제한 없이 활용하고 재사용할 수 있습니다.

IronOCR 라이브러리는 사용자, 비즈니스 및 OCR 요구 사항에 중점을 두고 내장 또는 요청 시 다양한 언어를 지원합니다. 이제 다음 .NET 프로젝트에서 언어 호환성 걱정 없이 작업할 수 있습니다!

아랍어, 스페인어, 프랑스어, 독일어, 히브리어, 이탈리아어, 일본어, 중국어 간체, 중국어 번체(만다린), 덴마크어, 영어, 핀란드어, 포르투갈어, 러시아어, 스페인어, 스웨덴어 등 원하는 언어를 말씀만 하시면 제공해 드립니다! 원하는 언어 팩을 다운로드하시거나 연중무휴 24시간 고객 지원팀에 문의하여 더 많은 언어를 지원받으실 수 있습니다.

첫 번째 단계는 Windows Visual Studio용 NuGet Install-Package 프로그램을 사용하는 것입니다.

언어 팩 다운로드
Advanced Image related to .NET Core에서의 OCR

불완전한 스캔 이미지를 정확하게 판독하기 위한 이미지 처리

IronOCR은 경쟁 제품과 어떻게 다를까요? IronOCR은 OCR 기능을 손쉽게 추가하고, 텍스트를 추출하고, 회전된 이미지를 스캔할 수 있을 뿐만 아니라, 스캔 상태가 완벽하지 않은 이미지에서도 OCR을 수행할 수 있습니다! 반면, 현재 시중에 나와 있는 많은 기성 제품들은 대부분 기계로 인쇄된 고해상도의 완벽하게 정렬된 텍스트에만 적용되기 때문에 실제 개인 및 기업 환경에서는 정확도가 떨어지고 제대로 작동하지 못하는 경우가 많습니다.

IronOCR은 강력한 IronTesseract DLL을 통해 Google Tesseract의 기능을 확장합니다. IronTesseract DLL은 무료 Tesseract 라이브러리보다 안정성이 향상되고 정확도가 높은 네이티브 C# OCR 라이브러리입니다.

걱정하지 마세요 - IronOCR이 도와드리겠습니다!

최고의 도구를 사용하면 스캔 이미지의 품질이 완벽하지 않거나 저장 폴더에 저장된 이미지가 있더라도 IronOCR의 이미지 처리 라이브러리 변환 기능을 통해 노이즈를 제거하고, 회전하고, 왜곡 및 기울어진 정렬을 줄이고, 해상도와 대비를 향상시킬 수 있습니다. 고급 광학 문자 인식(OCR) 설정은 코더인 여러분에게 최상의 검색 결과를 매번 생성할 수 있는 도구와 코드를 제공합니다.

원하는 단어를 검색해 보세요. 99.8~100%의 정확도와 PDF 문서, 멀티프레임 TIFF 파일, JPEG 및 JPEG2000, GIF, PNG, BMP, WBMP, System.Drawing.Image, System.Drawing.Bitmap, System.IO.Streams 이미지, 바이너리 이미지 데이터(byte[]) 등 모든 파일 형식을 무제한으로 지원하여 절대 실망하지 않으실 겁니다!

테서랙트의 대안
Fast And Polite Behavior related to .NET Core에서의 OCR

빠르고 정확하게 - 스캔한 PDF부터 회전된 스캔 이미지까지

.NET Framework의 다른 .NET 애플리케이션과 달리, IronOCR의 패키지 관리자 콘솔과 인식된 텍스트 콘솔에 내장된 고급 광학 문자 인식(OCR) 기능은 사용자가 Times New Roman부터 다양한 글꼴(예: 복잡하거나 이해하기 어려운 글꼴), 굵기, 스타일을 지원하여 전체 이미지 또는 스캔한 이미지에서 정확한 텍스트 인식을 가능하게 합니다. 이미지의 특정 영역을 선택하는 기능은 속도와 정확도를 향상시키는 데 도움이 됩니다. 몇 줄에서 몇 단락에 이르기까지 멀티스레딩을 지원하여 OCR 엔진 속도를 높이고 멀티코어 컴퓨터에서 여러 문서를 동시에 읽을 수 있습니다.

처음부터 끝까지 뛰어난 성능으로 뒷받침됩니다.

IronOCR은 문자 인식 과정에만 국한되지 않고, 설치 단계부터 속도와 정확성을 향상시킵니다. IronOCR의 .NET OCR 엔진은 설치가 간편하고, 모든 기능을 갖추고 있으며, 문서화가 잘 되어 있는 .NET 소프트웨어 라이브러리입니다. Visual Studio용 NuGet 패키지 관리자를 통한 단일 설치만 지원하며, MVC, 웹 애플리케이션, 데스크톱, 콘솔 및 서버 애플리케이션과 멀티스레딩을 지원합니다.

IronOCR을 사용하면 외부 웹 서비스, 지속적인 비용 부담, 또는 기밀 문서를 인터넷으로 전송할 필요 없이 99.8~100%의 OCR 정확도를 달성할 수 있습니다. 복잡한 C++ 코딩 없이도 IronOCR은 여러 문자, 단어, 줄, 단락, 텍스트 및 문서에 대한 완벽한 PDF OCR 지원이 필요한 경우 최적의 선택입니다.

IronOCR은 별도의 성능 최적화나 입력 이미지 수정 없이 바로 사용할 수 있어, 코딩 실력 향상을 원하는 개발자에게 최적의 솔루션을 제공합니다. 최신 IronOCR 버전은 이전 버전보다 최대 10배 빠른 속도를 자랑하며, 오류 발생률은 250% 이상 감소했습니다. 저희는 OCR에 최적화된 플랫폼을 제공하여 여러분의 목표 달성을 지원하기 위해 지속적으로 제품을 업그레이드하고 있습니다!

전체 기능 목록을 참조하십시오.
Output Content related to .NET Core에서의 OCR

OCR 결과 데이터를 애플리케이션으로 바로 내보내기

모바일 기기를 사용하더라도 IronOCR의 완벽한 .NET OCR 라이브러리를 사용하면 개발자는 '걱정 없이' 코딩할 수 있습니다. IronOCR은 단순하고 복잡한 텍스트, 기계어 인코딩 텍스트, 바코드 데이터 또는 구조화된 객체 모델 데이터 등 다양한 형식으로 콘텐츠를 내보낼 수 있도록 지원합니다. 콘텐츠 단락, 줄, 단어, 문자 및 이미지 문자열 결과를 분할하여 .NET 앱에서 바로 사용할 수 있습니다.

XHTML, 검색 가능한 문서, HOCR 및 HTML 등 원하는 애플리케이션 및 형식으로 편리하게 내보내세요.

소스 코드부터 최종 결과까지, 생성된 데이터를 애플리케이션으로 내보낼 수 없다면 아무 소용이 없습니다. IronOCR은 이러한 점을 이해하고 OCR 결과를 XHTML 형식으로 내보낼 수 있도록 지원합니다. 이를 통해 더욱 다양한 애플리케이션에서 사용 가능하고 복잡한 웹사이트에도 쉽게 통합할 수 있으며, 로딩 속도 또한 향상됩니다!

하지만 지원은 여기서 끝나지 않습니다. OCR로 변환된 문서를 검색 가능한 PDF 파일로 내보낼 수 있어, 여러분과 고객, 그리고 소속 기관 모두 필요할 때 언제든지 PDF 문서를 쉽게 저장하고 검색할 수 있습니다! 특히 30페이지 분량의 계약서를 키워드 몇 개만으로 데이터베이스에서 검색할 때 매우 유용하며, 시각 장애인에게 검색 가능한 PDF 문서가 도움이 된다는 점을 고려할 때, 기업의 규정 준수 이미지를 강화하는 데에도 효과적입니다.

위 내용 외에도, OCR 출력, 레이아웃 정보, 스타일 정보를 포함하고 관련 정보를 표준 HTML에 삽입하는 OCR 형식으로 결과를 내보낼 수 있습니다.

더 알아보기
지원 항목:
  • .NET Framework 4.0 이상은 C#, VB, F#을 지원합니다.
  • 마이크로소프트 Visual Studio. .NET 개발 IDE 아이콘
  • Visual Studio용 NuGet 설치 프로그램 지원
  • JetBrains ReSharper C# 언어 도우미와 호환됩니다.
  • Microsoft Azure C# .NET 호스팅 플랫폼과 호환됩니다.

라이선스 및 가격

커뮤니티 개발 라이선스는 무료입니다 . 상업용 라이선스는 749달러부터 시작합니다.

프로젝트 C# + VB.NET 라이브러리 라이선스

프로젝트

C# 및 VB.NET 라이브러리 라이선스 개발자

개발자

조직 C# + VB.NET 라이브러리 라이선스

조직

에이전시 C# + VB.NET 라이브러리 라이선싱

대행사

SaaS C# + VB.NET 라이브러리 라이선싱

SaaS

OEM C# + VB.NET 라이브러리 라이선스

OEM

전체 라이선스 옵션 보기  

.NET 커뮤니티에서 제공하는 OCR 튜토리얼

.NET 테서랙트 OCR | IronOCR

C# 테서랙트 OCR

짐 베이커는 Iron에서 OCR 제품 개발을 담당하는 개발 엔지니어입니다.

.NET 환경에서 IronOCR과 Tesseract 비교

짐은 IronOCR 개발에 있어 핵심적인 역할을 해왔습니다. 그는 OCR을 위한 이미지 처리 알고리즘과 판독 방법을 설계하고 구축합니다.

비교표를 참조하세요
.NET에서 텍스트를 이미지로 변환하는 방법 | 튜토리얼

C# OCR ASP.NET

젬마 베크포드 - 마이크로소프트 솔루션 엔지니어

.NET용 이미지에서 가져온 텍스트

젬마의 팀이 이미지 아카이빙 소프트웨어에서 텍스트를 추출하기 위해 IronOCR을 어떻게 사용하는지 알아보세요. 젬마가 직접 작성한 코드 샘플도 확인할 수 있습니다.

이미지를 텍스트로 변환하는 .NET 튜토리얼
수천 명의 개발자가 IronOcr을 사용하여...

회계 및 재무 시스템

  • # 영수증
  • # 보고
  • # 송장 인쇄
ASP.NET 회계 및 재무 시스템에 PDF 지원 기능을 추가하세요

비즈니스 디지털화

  • # 선적 서류 비치
  • # 주문 및 라벨링
  • # 종이 교체
C# 비즈니스 디지털화 활용 사례

기업 콘텐츠 관리

  • # 콘텐츠 제작
  • # 문서 관리
  • # 콘텐츠 배포
.NET CMS PDF 지원

데이터 및 보고 애플리케이션

  • # 성과 추적
  • # 추세 지도
  • # 보고서
C# PDF 보고서
Iron Software Enterprise .NET 컴포넌트 개발자

수많은 기업, 정부 기관, 중소기업 및 개발자들이 Iron 소프트웨어 제품을 신뢰하고 있습니다.

Iron Software의 팀은 .NET 소프트웨어 구성 요소 시장에서 10년 이상의 경험을 보유하고 있습니다.

폴리
놀라운 일
메드코드
에퀴노르
네후두스
ANZ
GE
비렉

Iron Support Team

We're online 24 hours, 5 days a week.
Chat
Email
Call Me