다른 구성 요소와 비교 IronOCR 과 Dynamsoft OCR 비교 칸나팟 우돈판트 업데이트됨:1월 18, 2026 다운로드 IronOCR NuGet 다운로드 DLL 다운로드 윈도우 설치 프로그램 무료 체험 시작하기 LLM용 사본 LLM용 사본 LLM용 마크다운 형식으로 페이지를 복사하세요 ChatGPT에서 열기 ChatGPT에 이 페이지에 대해 문의하세요 제미니에서 열기 제미니에게 이 페이지에 대해 문의하세요 Grok에서 열기 Grok에게 이 페이지에 대해 문의하세요 혼란 속에서 열기 Perplexity에게 이 페이지에 대해 문의하세요 공유하다 페이스북에 공유하기 트위터에 공유하기 LinkedIn에 공유하기 URL 복사 이메일로 기사 보내기 광학 문자 인식, 또는 OCR, 는 텍스트의 인식과 디지털화를 포함하는 데이터 입력 프로세스입니다. 이는 인쇄된 텍스트의 디지털 사진을 분석하여 다른 프로그램에서 사용할 수 있는 문자와 숫자로 변환하는 컴퓨터 기술의 한 유형입니다. 텍스트가 문자 코드로 변환되어 컴퓨터에서 검색하고 변경할 수 있게 합니다. 과거에는 모든 문서가 물리적이고 미래에는 모든 문서가 디지털일 수 있지만, 현재는 변화 중입니다. 물리적 및 디지털 문서는 이 전환 상태에서 공존합니다. 따라서 OCR과 같은 기술은 상호 변환에 필수적입니다. 문서 복구, 데이터 입력, 접근성은 OCR의 몇 가지 적용 사례일 뿐입니다. OCR의 대다수 응용은 스캔된 문서에서 비롯되지만, 사진도 가끔 사용됩니다. OCR은 종종 유일한 다른 옵션인 자료를 다시 타이핑하지 않아도 되므로 시간을 절약해 줍니다. 다음은 OCR 사용 예입니다: 스캔된 문서에서 편집 가능한 텍스트 파일을 복구할 수 있습니다. 팩스를 포함하여. 책 스캔을 사용하여 검색 가능하고 편집 가능한 전자책을 만듭니다. 스크린샷 사진을 사용하여 텍스트를 검색하고 변경합니다. 텍스트 읽기 기술을 사용하여 시각 장애인이 책을 읽을 수 있게 합니다. 이것들은 OCR의 몇 가지 응용일 뿐이지만, 다양한 산업에서 기술의 다재다능함을 보여줍니다. 거의 모든 회사의 거의 모든 직원이 일상적으로 문서에 크게 의존하기 때문에, 비즈니스 사용은 OCR 시스템 개발의 주요 고려 사항입니다. 이 기사에서는 가장 강력한 두 가지 OCR 리더를 비교합니다: IronOCR Dynamsoft OCR IronOCR와 Dynamsoft OCR는 스캔 이미지를 변환하고 PDF 문서의 OCR 처리를 지원하는 두 개의 .NET OCR 라이브러리입니다. 몇 줄의 코드만으로 이미지를 검색 가능한 텍스트로 변환할 수 있습니다. 또한 개별 단어, 글자, 문단을 검색할 수 있습니다. IronOCR — 뛰어난 기능들 IronOCR는 정확하게 스캔되지 않은 사진 및 PDF 문서에서 텍스트를 감지, 읽고 해석할 수 있는 고유한 기능을 제공합니다. IronOCR는 문서 및 사진에서 텍스트를 추출하는 가장 간단한 접근 방식을 제공합니다. 항상 가장 빠른 것은 아니지만, 저품질 스캔을 자동으로 강화하고 수정하여 왜곡, 배경 소음 및 시점 문제를 줄이면서 해상도와 대비를 개선합니다. IronOCR는 개발자가 단일 또는 여러 페이지의 스캔 이미지를 보낼 수 있으며, 모든 텍스트, 바코드 및 QR 정보를 반환합니다. OCR 라이브러리에 있는 클래스 집합은 웹 기반, 데스크톱, 또는 콘솔 애플리케이션에 OCR 기능을 추가합니다. Tesseract OCR C#, 네트 앱 JPG, PNG, TIFF, PDF, GIF, BMP는 입력에 사용할 수 있는 형식 중 일부입니다. IronOCR의 광학 문자 인식 (OCR) 엔진은 일반적인 여러 글꼴, 이탤릭체, 굵기 및 밑줄을 사용하여 준비된 텍스트를 읽을 수 있습니다. 크로핑 클래스는 OCR이 신속하고 정확하게 작동할 수 있게 합니다. IronOCR의 멀티스레드 엔진은 다중 페이지 문서를 작업할 때 OCR 속도를 높입니다. IronOCR 기능들 Tesseract 관리를 위해 IronOCR를 사용하는 이유는 다음과 같은 고유한 이유 때문입니다: 순수 .NET에서 바로 작동 Tesseract를 컴퓨터에 설치할 필요 없음 최신 엔진인 Tesseract 5 (Tesseract 4 및 3도 포함)를 실행 모든 .NET 프로젝트에 사용할 수 있음: .NET Framework 4.5 이상, .NET Standard 2 이상 및 .NET Core 2, 3 및 .NET 5 전통적인 Tesseract에 비해 향상된 정확도와 속도를 자랑 Xamarin, Mono, Azure 및 Docker를 지원 NuGet 패키지를 사용하여 복잡한 Tesseract 사전 시스템 관리 PDFS, 멀티 프레임 Tiffs 및 모든 주요 이미지 형식을 구성 없이 지원 저품질 및 왜곡 스캔을 교정하여 Tesseract에서 최고의 결과를 얻을 수 있음. Dynamsoft OCR — 기능들 Dynamsoft.NET OCR 라이브러리는 빠르고 신뢰할 수 있는 광학 문자 인식을 제공하는 .NET 컴포넌트입니다. C# 또는 VB.NET으로 .NET 데스크톱 애플리케이션을 생성하는 데 사용됩니다. 기본 OCR API를 사용해 PDF 또는 사진의 쓸모없는 텍스트를 변환하여 편집, 검색, 아카이빙 등을 위한 디지털 텍스트로 쉽게 변환하는 코드를 생성할 수 있습니다. 다음과 같은 방법으로 스캐너 및 기타 TWAIN 호환 장치에서 이미지를 획득할 수 있습니다: 네이티브, 버퍼드 메모리 및 디스크 파일 이미지 전송 메커니즘을 모두 지원합니다. 자동 급지 장치(ADF)를 통해 대량 스캔이 가능합니다. TWAIN 속성을 사용하여 일반적인 장치 기능을 수정할 수 있습니다. IfAutoFeed, IfAutoScan, 해상도, 비트 심도, 밝기, 대비, 단위, 양면 인쇄 및 기타 기능을 변경할 수 있습니다. 빈 페이지 탐지가 지원됩니다. 스캐너 프로필을 변경하고 저장할 수 있습니다. UVC 및 WIA 호환 웹캠에서 이미지 캡처: 선택한 웹캠에서 사진을 캡처할 때 실시간 비디오 피드를 표시합니다. 카메라 설정을 사용자 정의: 밝기, 대비, 색조, 채도, 선명도, 감마, 화이트 밸런스, 역광 보상, 게인, 컬러 활성화, 줌, 초점, 노출, 조리개, 팬, 틸트, 롤. 강력한 이미지 로딩/보기 BMP, JPEG, PNG, TIFF 및 다중 페이지 TIFF 형식의 이미지를 로드할 수 있습니다. 사진 확대 및 축소를 지원합니다. 로컬 드라이브, FTP 서버, HTTP 서버 또는 데이터베이스에서 이미지를 가져올 수 있습니다. 가장 포괄적인 .NET 이미지 구성 요소 세트를 사용하여 BMP, JPEG, PNG 및 TIFF 이미지 디코딩 저장 및 업로드/다운로드 파일 스트림을 통해 사진을 읽고 쓸 수 있습니다. 캡처한 사진을 로컬 드라이브, 웹 서버 또는 데이터베이스에 BMP, JPEG, PNG, TIFF 또는 다중 페이지 TIFF로 저장할 수 있습니다. RLE, G3/G4, LZW, PackBits 및 TIFF 압축을 모두 지원합니다. HTTPS 업로드 및 다운로드를 지원합니다. BMP, JPEG, PNG 및 TIFF 이미지 인코딩을 지원하는 가장 광범위한 .NET 이미지 구성 요소 세트 중 하나입니다. 새로 얻은 사진을 기존 TIFF 파일에 첨부할 수 있습니다. ASP.NET에서 스캔한 PDF 또는 기타 이미지에서 텍스트 읽기 (광학 문자 인식) 고객들은 오늘날 빠르게 변화하는 세상에서 작업이 신속하게 완료되기를 원합니다. 긴급한 프로젝트를 가진 고객들이 자주 저희에게 연락합니다. 저희 기술은 이미지가 포함된 문서를 스캔하는 프로젝트가 있는 경우 이미지의 내용을 인식하고 텍스트로 변환할 수 있습니다. 광학 문자 인식(OCR)은 데이터 입력 오류를 줄이면서 회사의 시간과 비용을 절약합니다. IronOCR 사용하기 IronOCR는 IronOcr.IronTesseract 클래스를 사용하여 OCR 변환을 수행합니다. 이 기본 예제에서 IronOcr.IronTesseract 클래스를 사용하여 이미지에서 텍스트를 읽고 자동으로 문자열로 결과를 반환합니다. // PM> Install-Package IronOcr using IronOcr; class Program { static void Main(string[] args) { // Create a new instance of the IronTesseract class var ironOcr = new IronTesseract(); // Read the text from the image var result = ironOcr.Read(@"img\Screenshot.png"); // Output the text to the console Console.WriteLine(result.Text); } } // PM> Install-Package IronOcr using IronOcr; class Program { static void Main(string[] args) { // Create a new instance of the IronTesseract class var ironOcr = new IronTesseract(); // Read the text from the image var result = ironOcr.Read(@"img\Screenshot.png"); // Output the text to the console Console.WriteLine(result.Text); } } $vbLabelText $csharpLabel 그 결과, 다음 문단은 100% 정확합니다: IronOCR 간단한 예제 이 간단한 예제에서 우리는 PNG에서 텍스트를 읽기 위한 우리의 C# OCR 라이브러리의 정확성을 테스트할 것입니다 이미지. 이것은 매우 기본적인 테스트이지만, 튜토리얼이 계속됨에 따라 더 복잡해질 것입니다. 빠른 갈색 여우가 게으른 개 위로 뛰어넘습니다 겉으로 보기에는 간단해 보이지만, 표면 아래에서는 정렬, 품질 및 해상도를 위한 이미지 스캔, 속성 조회, OCR 엔진 최적화 및 마지막으로 텍스트를 사람이 읽는 것처럼 읽는 등의 고급 동작이 이루어지고 있습니다. OCR은 기계가 수행하기 어려운 작업이며, 읽기 속도는 사람의 속도와 비슷할 수 있습니다. 다시 말해, OCR은 빠른 절차가 아닙니다. 하지만 이 경우에는 절대적으로 정확합니다. 대부분의 실제 시나리오에서 개발자들은 프로젝트가 가능한 한 빨리 실행되길 원합니다. 이 경우 IronOCR 애드온 네임스페이스의 OcrInput 및 IronTesseract 클래스를 대신 사용하는 것을 제안합니다. OcrInput을 사용하여 OCR 작업의 구체적인 기능을 설정할 수 있습니다. 예를 들어: JPEG, TIFF, GIF, BMP 및 PNG와 같은 다양한 이미지 형식을 사용할 수 있습니다 전체 또는 일부 PDF 문서를 가져오기 이미지의 대비, 해상도 및 크기 향상 회전, 스캔 노이즈, 디지털 노이즈, 왜곡 및 역상 보정 IronTesseract 수백 개의 사전 패키징된 언어와 방언 중에서 선택 Tesseract 5, 4 또는 3 OCR 엔진을 바로 사용 스크린샷, 스니펫 또는 전체 문서를 확인하는 경우, 문서 유형 지정 바코드 인식 검색 가능한 PDF, Hocr HTML, DOM, 문자열은 모두 OCR 결과의 옵션입니다 using IronOcr; class Program { static void Main(string[] args) { // Create an instance of IronTesseract var ocr = new IronTesseract(); // Use the OcrInput class to read from an image file using (var input = new OcrInput(@"img\Potter.tiff")) { // Perform the OCR operation var result = ocr.Read(input); // Output the recognized text to the console Console.WriteLine(result.Text); } } } using IronOcr; class Program { static void Main(string[] args) { // Create an instance of IronTesseract var ocr = new IronTesseract(); // Use the OcrInput class to read from an image file using (var input = new OcrInput(@"img\Potter.tiff")) { // Perform the OCR operation var result = ocr.Read(input); // Output the recognized text to the console Console.WriteLine(result.Text); } } } $vbLabelText $csharpLabel 중간 품질의 스캔에서도 100% 정확도로 사용할 수 있습니다. 보시다시피 TIFF와 같은 스캔한 이미지에서 텍스트(원하는 경우 바코드도)를 읽는 것이 매우 쉬웠습니다. 이 OCR 작업의 정확도는 100%입니다. 다음으로, 같은 페이지의 훨씬 낮은 품질의 스캔을 낮은 DPI와 많은 왜곡 및 디지털 노이즈, 원본 종이의 손상과 함께 시도해 보겠습니다. 이는 IronOCR가 Tesseract와 같은 다른 OCR 라이브러리와 비교할 때 진정으로 빛을 발하는 곳이며, 다른 OCR 프로젝트는 100% OCR 정확도를 달성하기 위해 디지털로 생성된 비현실적인 '완벽한' 테스트 케이스 대신 실제 스캔 이미지를 사용하는 것에 대해 논의하지 않는 경우가 많습니다. using IronOcr; class Program { static void Main(string[] args) { // Create an instance of IronTesseract var ocr = new IronTesseract(); // Use the OcrInput class to read from a low-quality image file using (var input = new OcrInput(@"img\Potter.LowQuality.tiff")) { // Deskew the image to improve accuracy input.Deskew(); // Perform the OCR operation var result = ocr.Read(input); // Output the recognized text to the console Console.WriteLine(result.Text); } } } using IronOcr; class Program { static void Main(string[] args) { // Create an instance of IronTesseract var ocr = new IronTesseract(); // Use the OcrInput class to read from a low-quality image file using (var input = new OcrInput(@"img\Potter.LowQuality.tiff")) { // Deskew the image to improve accuracy input.Deskew(); // Perform the OCR operation var result = ocr.Read(input); // Output the recognized text to the console Console.WriteLine(result.Text); } } } $vbLabelText $csharpLabel 이미지를 바로 잡기 위해 Input.Deskew()를 추가하지 않고서는 52.5%의 정확도를 얻습니다. 이는 충분하지 않습니다. Input.Deskew()를 추가하면 99.8%의 정확도로 높아져, 고품질 스캔의 OCR과 거의 동일한 정확도를 제공합니다. Dynamsoft OCR 사용하기 Dynamic Web TWAIN을 사용하여 JavaScript에서 TWAIN 스캔 및 클라이언트 측 OCR을 수행하기 위한 코드 스니펫을 제시하겠습니다. 이미지 스캔 Simple APIs를 사용하여 Dynamic Web TWAIN의 스캔 설정을 변경하고 TWAIN 스캐너에서 사진을 획득할 수 있습니다. function acquireImage() { // Select an available TWAIN scanner DWObject.SelectSourceByIndex(document.getElementById("source").selectedIndex); // Set scanning settings like pixel type, resolution, ADF, etc. DWObject.IfShowUI = false; // Do not show the user interface of the scanner DWObject.PixelType = 1; // Scan in grayscale DWObject.Resolution = 300; DWObject.IfFeederEnabled = true; // Scan from auto feeder DWObject.IfDuplexEnabled = false; DWObject.IfDisableSourceAfterAcquire = true; // Acquire images from scanners DWObject.AcquireImage(); } function acquireImage() { // Select an available TWAIN scanner DWObject.SelectSourceByIndex(document.getElementById("source").selectedIndex); // Set scanning settings like pixel type, resolution, ADF, etc. DWObject.IfShowUI = false; // Do not show the user interface of the scanner DWObject.PixelType = 1; // Scan in grayscale DWObject.Resolution = 300; DWObject.IfFeederEnabled = true; // Scan from auto feeder DWObject.IfDuplexEnabled = false; DWObject.IfDisableSourceAfterAcquire = true; // Acquire images from scanners DWObject.AcquireImage(); } JAVASCRIPT OCR Professional Module 다운로드 클라이언트 측 OCR을 위한 OCR Professional 모듈을 사용하려면, 머리말에 ocrpro.js을 포함하고 OCR Pro DLL을 다운로드해야 합니다. <script type="text/javascript" src="Resources/addon/dynamsoft.webtwain.addon.ocrpro.js"></script> <script type="text/javascript" src="Resources/addon/dynamsoft.webtwain.addon.ocrpro.js"></script> HTML .js 파일을 수정하십시오: // Define base path var CurrentPathName = unescape(location.pathname); var CurrentPath = CurrentPathName.substring(0, CurrentPathName.lastIndexOf("/") + 1); // Download the OCR Pro add-on DWObject.Addon.OCRPro.Download(CurrentPath + "Resources/addon/OCRPro.zip", OnSuccess, OnFailure); // Define base path var CurrentPathName = unescape(location.pathname); var CurrentPath = CurrentPathName.substring(0, CurrentPathName.lastIndexOf("/") + 1); // Download the OCR Pro add-on DWObject.Addon.OCRPro.Download(CurrentPath + "Resources/addon/OCRPro.zip", OnSuccess, OnFailure); JAVASCRIPT OCR을 사용하여 텍스트 인식 JS OCR 인식 API를 사용하여 스캔한 이미지에서 텍스트를 추출하는 것은 아래 코드를 삽입하는 것만큼 간단합니다. // Recognize text from the image at index 0 DWObject.Addon.OCRPro.Recognize(0, GetOCRProInfo, GetErrorInfo); // 0 is the index of the image // Recognize text from the image at index 0 DWObject.Addon.OCRPro.Recognize(0, GetOCRProInfo, GetErrorInfo); // 0 is the index of the image JAVASCRIPT 이미지의 잘린 영역 읽기 두 소프트웨어 모두 OCR을 위해 이미지를 자르는 솔루션을 제공합니다. IronOCR을 사용한 잘린 영역 읽기 Iron's Tesseract OCR에서 이미지의 특정 영역을 읽는 데 능숙함을 다음 코드 샘플에서 보여줍니다. 이미지의 정확한 영역을 픽셀 단위로 설명하기 위해 System.Drawing.Rectangle를 사용합니다. 표준 양식이 채워지고, 케이스마다 내용의 일부만 변경되는 경우 정말 유용할 수 있습니다. 페이지의 한 영역 스캔: 문서에서 읽을 영역을 지정하기 위해 System.Drawing.Rectangle를 사용하여 속도와 정확성을 향상시킵니다. using IronOcr; using System.Drawing; class Program { static void Main(string[] args) { // Create an instance of IronTesseract var ocr = new IronTesseract(); using (var input = new OcrInput()) { // Define content area of interest var contentArea = new Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 }; // Add the specific region to the input input.AddImage("img/ComSci.png", contentArea); // Perform OCR operation var result = ocr.Read(input); // Output recognized text to console Console.WriteLine(result.Text); } } } using IronOcr; using System.Drawing; class Program { static void Main(string[] args) { // Create an instance of IronTesseract var ocr = new IronTesseract(); using (var input = new OcrInput()) { // Define content area of interest var contentArea = new Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 }; // Add the specific region to the input input.AddImage("img/ComSci.png", contentArea); // Perform OCR operation var result = ocr.Read(input); // Output recognized text to console Console.WriteLine(result.Text); } } } $vbLabelText $csharpLabel 이는 속도가 41% 증가하며, 또한 더 구체적일 수 있게 해줍니다. 이는 .NET OCR 애플리케이션에서 비교 가능하고 일관된 문서에 매우 유용한데, 송장, 영수증, 수표, 양식, 경비 청구서 등과 같은 경우입니다. PDF를 읽을 때 ContentAreas(OCR 자르기)도 지원됩니다. Dynamsoft OCR을 사용한 잘린 영역 읽기 시작하려면 Visual Studio를 실행하고 새로운 C# Windows Forms Application을 빌드하거나 기존 애플리케이션을 엽니다. DynamicDotNetTWAIN.dll, DynamicOCR.dll 및 적절한 언어 패키지를 포함해야 합니다. 도구로 이동 -> 도구상자 항목 선택, .NET Framework 구성 요소 탭으로 이동한 다음, 찾아보기 버튼을 클릭하고 DynamicDotNetTWAIN.dll을 찾습니다. 솔루션 탐색기에서 프로젝트 파일을 마우스 오른쪽 버튼으로 클릭하고 '추가하기 -> 기존 항목...'을 선택합니다. 그런 다음 OCR 리소스 디렉터리에서 필요한 항목을 추가합니다. LoadImage 버튼을 클릭하기 위한 코드입니다: private void button1_Click(object sender, EventArgs e) { OpenFileDialog filedlg = new OpenFileDialog(); if (filedlg.ShowDialog() == DialogResult.OK) { dynamicDotNetTwain1.LoadImage(filedlg.FileName); // Choose an image from your local disk and load it into Dynamic .NET TWAIN } } private void dynamicDotNetTwain1_OnImageAreaSelected(short sImageIndex, int left, int top, int right, int bottom) { dynamicDotNetTwain1.OCRTessDataPath = "../../"; dynamicDotNetTwain1.OCRLanguage = "eng"; OcrResultFormat ocrResultFormat = Dynamsoft.DotNet.TWAIN.OCR.ResultFormat.Text; byte [] sbytes = dynamicDotNetTwain1.OCR(dynamicDotNetTwain1.CurrentImageIndexInBuffer, left, top, right, bottom); // OCR the selected area of the image if (sbytes != null) { SaveFileDialog filedlg = new SaveFileDialog(); filedlg.Filter = "Text File(*.txt)| *.txt"; if (filedlg.ShowDialog() == DialogResult.OK) { FileStream fs = File.OpenWrite(filedlg.FileName); fs.Write(sbytes, 0, sbytes.Length); // Save the OCR result as a text file fs.Close(); } MessageBox.Show("OCR successful"); } else { MessageBox.Show(dynamicDotNetTwain1.ErrorString); } } private void button1_Click(object sender, EventArgs e) { OpenFileDialog filedlg = new OpenFileDialog(); if (filedlg.ShowDialog() == DialogResult.OK) { dynamicDotNetTwain1.LoadImage(filedlg.FileName); // Choose an image from your local disk and load it into Dynamic .NET TWAIN } } private void dynamicDotNetTwain1_OnImageAreaSelected(short sImageIndex, int left, int top, int right, int bottom) { dynamicDotNetTwain1.OCRTessDataPath = "../../"; dynamicDotNetTwain1.OCRLanguage = "eng"; OcrResultFormat ocrResultFormat = Dynamsoft.DotNet.TWAIN.OCR.ResultFormat.Text; byte [] sbytes = dynamicDotNetTwain1.OCR(dynamicDotNetTwain1.CurrentImageIndexInBuffer, left, top, right, bottom); // OCR the selected area of the image if (sbytes != null) { SaveFileDialog filedlg = new SaveFileDialog(); filedlg.Filter = "Text File(*.txt)| *.txt"; if (filedlg.ShowDialog() == DialogResult.OK) { FileStream fs = File.OpenWrite(filedlg.FileName); fs.Write(sbytes, 0, sbytes.Length); // Save the OCR result as a text file fs.Close(); } MessageBox.Show("OCR successful"); } else { MessageBox.Show(dynamicDotNetTwain1.ErrorString); } } $vbLabelText $csharpLabel 애플리케이션의 모습은 다음과 같습니다: 이미지 성능 조정 입력 이미지의 품질은 OCR 작업의 속도에 있어 가장 중요한 결정 요인입니다. 배경 노이즈는 낮고 DPI는 높을수록, 약 200 DPI의 훌륭한 목표 값이며, OCR 출력은 더 빠르고 정확해집니다. Dynamsoft OCR을 위한 이미지 처리 기술 신용카드 번호를 휴대폰으로 스캔하거나 종이 문서에서 텍스트를 추출하는 등 다양한 상황에서 OCR을 사용해야 합니다. Dynamsoft Label Recognition (DLR)과 Dynamic Web TWAIN (DWT)에는 OCR 기능이 포함되어 있습니다. 일반적으로 훌륭한 작업을 할 수 있지만, 다양한 이미지 처리 기술을 사용하여 결과를 개선할 수 있습니다. 그림자 밝거나 제거하기 불충분한 조명은 OCR 결과에 영향을 미칠 수 있습니다. 결과를 개선하기 위해 우리는 이미지의 그림자를 하얗게 하거나 제거할 수 있습니다. 반전 OCR 엔진은 종종 어두운 색의 텍스트에 훈련되기 때문에, 밝은 색의 텍스트는 발견하고 인식하기 더 어려울 수 있습니다. 텍스트 색깔을 반전시키면 더 쉽게 인식할 수 있습니다. 반전을 수행하기 위해 DLR의 GrayscaleTransformationModes 매개변수를 사용할 수 있습니다. 여기 JSON 설정이 있습니다: "GrayscaleTransformationModes": [ { "Mode": "DLR_GTM_INVERTED" } ] DLR .net의 읽기 결과: 크기 조정 글자의 높이가 너무 낮으면, OCR 엔진이 좋은 결과를 내지 못할 수 있습니다. 일반적으로 이미지는 최소한 300 DPI를 가져야 합니다. DLR 1.1에는 글자를 확대할 수 있는 ScaleUpModes 매개변수가 있습니다. 물론, 우리는 이미지를 직접 확대할 수 있습니다. 이미지를 직접 읽으면 잘못된 결과를 초래합니다: 이미지를 2배로 확대한 후 결과는 정확합니다: 기울기 보정 텍스트가 약간 왜곡되어도 문제 없습니다. 그러나 지나치게 기울어져 있으면 결과가 부정적으로 변화합니다. 결과를 개선하려면 이미지를 자를 필요가 있습니다. 이를 달성하기 위해 OpenCV와 Python에서 허프 선 변환을 사용할 수 있습니다. 위의 이미지를 기울기 보정하기 위한 코드입니다: import cv2 import numpy as np import math from PIL import Image def deskew(): src = cv2.imread("neg.jpg", cv2.IMREAD_COLOR) gray = cv2.cvtColor(src, cv2.COLOR_BGR2GRAY) kernel = np.ones((5,5), np.uint8) erode_img = cv2.erode(gray, kernel) eroDil = cv2.dilate(erode_img, kernel) show_and_wait_key("eroDil", eroDil) canny = cv2.Canny(eroDil, 50, 150) show_and_wait_key("canny", canny) lines = cv2.HoughLinesP(canny, 0.8, np.pi / 180, 90, minLineLength=100, maxLineGap=10) drawing = np.zeros(src.shape[:], dtype=np.uint8) maxY = 0 degree_of_bottomline = 0 index = 0 for line in lines: x1, y1, x2, y2 = line[0] cv2.line(drawing, (x1, y1), (x2, y2), (0, 255, 0), 1, lineType=cv2.LINE_AA) k = float(y1-y2)/(x1-x2) degree = np.degrees(math.atan(k)) if index == 0: maxY = y1 degree_of_bottomline = degree else: if y1 > maxY: maxY = y1 degree_of_bottomline = degree index += 1 show_and_wait_key("houghP", drawing) img = 이미지.fromarray(src) rotate_img = img.rotate(degree_of_bottomline) rotate_img_cv = np.array(rotate_img) cv2.imshow("rotateImg", rotate_img_cv) cv2.imwrite("deskewed.jpg", rotate_img_cv) cv2.waitKey() def show_and_wait_key(win_name, img): cv2.imshow(win_name, img) cv2.waitKey() if __name__ == "__main__": deskew() import cv2 import numpy as np import math from PIL import Image def deskew(): src = cv2.imread("neg.jpg", cv2.IMREAD_COLOR) gray = cv2.cvtColor(src, cv2.COLOR_BGR2GRAY) kernel = np.ones((5,5), np.uint8) erode_img = cv2.erode(gray, kernel) eroDil = cv2.dilate(erode_img, kernel) show_and_wait_key("eroDil", eroDil) canny = cv2.Canny(eroDil, 50, 150) show_and_wait_key("canny", canny) lines = cv2.HoughLinesP(canny, 0.8, np.pi / 180, 90, minLineLength=100, maxLineGap=10) drawing = np.zeros(src.shape[:], dtype=np.uint8) maxY = 0 degree_of_bottomline = 0 index = 0 for line in lines: x1, y1, x2, y2 = line[0] cv2.line(drawing, (x1, y1), (x2, y2), (0, 255, 0), 1, lineType=cv2.LINE_AA) k = float(y1-y2)/(x1-x2) degree = np.degrees(math.atan(k)) if index == 0: maxY = y1 degree_of_bottomline = degree else: if y1 > maxY: maxY = y1 degree_of_bottomline = degree index += 1 show_and_wait_key("houghP", drawing) img = 이미지.fromarray(src) rotate_img = img.rotate(degree_of_bottomline) rotate_img_cv = np.array(rotate_img) cv2.imshow("rotateImg", rotate_img_cv) cv2.imwrite("deskewed.jpg", rotate_img_cv) cv2.waitKey() def show_and_wait_key(win_name, img): cv2.imshow(win_name, img) cv2.waitKey() if __name__ == "__main__": deskew() PYTHON 감지된 선: 기울기 보정됨: IronOCR용 이미지 처리 기법 입력 이미지의 품질은 여기서 중요하지 않습니다, 왜냐하면 IronOCR는 결함이 있는 문서를 복구하는 데 뛰어나기 때문입니다 (비록 이것이 시간이 걸리고 OCR 작업에 더 많은 CPU 사이클을 사용하게 할 것입니다). TIFF 또는 PNG와 같이 디지털 노이즈가 적은 입력 이미지 형식을 선택하면 JPEG와 같은 손실 이미지 형식보다 더 빠른 결과를 얻을 수 있습니다. 아래 나열된 이미지 필터는 성능을 크게 향상시킬 수 있습니다: OcrInput.Rotate(double degrees) — 이미지를 지정된 정도만큼 시계 방향으로 회전시킵니다. 반시계 방향 회전에는 음의 정수를 사용합니다. OcrInput.Binarize() — 이 이미지 필터는 모든 픽셀을 흑백으로 변환하며, 중간색은 없습니다. 텍스트와 배경 간의 대비가 매우 낮은 경우 OCR 성능을 향상시킬 수 있습니다. OcrInput.ToGrayScale() — 이 이미지 필터는 모든 픽셀을 회색 음영으로 변환합니다. OCR 정확도를 높이지는 않지만, 속도를 향상시킬 수 있습니다. OcrInput.Contrast() — 대비를 자동으로 증가시킵니다. 이 필터는 저대비 스캔에서 OCR 속도와 정확성을 자주 향상시킵니다. OcrInput.DeNoise() — 잡음이 예상될 때만 이 필터를 사용해야 합니다. OcrInput.Invert() — 모든 색상을 반전시킵니다. 예를 들어, 흰색은 검은색이 되고, 검은색은 흰색이 됩니다. OcrInput.Dilate() — 고급 변형. 팽창은 이미지의 객체 가장자리에 픽셀을 추가하는 과정입니다. (Inverse of Erode) OcrInput.Erode() — 고급 변형 기능. 침식은 객체 가장자리의 픽셀을 제거하는 과정입니다. (Inverse of Dilate) OcrInput.Deskew() — 이미지를 직교 형태로 회전시켜 올바르게 보이도록 합니다. Tesseract의 기울어진 스캔에 대한 허용 오차가 5도까지 낮을 수 있기 때문에 OCR에 매우 유용합니다. DeepCleanBackgroundNoise() — 많은 배경 잡음을 제거합니다. 문서에 많은 배경 잡음이 있음을 아는 경우에만 이 필터를 사용하세요. 그렇지 않으면 명확한 문서의 OCR 정확도를 낮출 수 있으며 CPU 자원을 많이 소모합니다. OcrInput.EnhanceResolution — 저해상도 사진의 해상도를 개선합니다. OcrInput로 인해 이 필터는 거의 사용되지 않습니다. OcrInput은 저해상도를 자동으로 감지하고 해결합니다. 우리는 고품질 스캔에서 OCR을 빠르게 하기 위해 IronTesseract를 사용하고 싶을 수 있습니다. 속도를 원한다면 여기서 시작하여 적절한 균형이 이루어질 때까지 기능을 다시 켤 수 있습니다. using IronOcr; class Program { static void Main(string[] args) { var ocr = new IronTesseract(); // Configuration for speed tuning ocr.Configuration.BlackListCharacters = "~`$#^*_}{][|\\"; ocr.Configuration.PageSegmentationMode = TesseractPageSegmentationMode.Auto; ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5; ocr.Configuration.EngineMode = TesseractEngineMode.LstmOnly; ocr.Language = OcrLanguage.EnglishFast; using (var input = new OcrInput(@"img\Potter.tiff")) { var result = ocr.Read(input); Console.WriteLine(result.Text); } } } using IronOcr; class Program { static void Main(string[] args) { var ocr = new IronTesseract(); // Configuration for speed tuning ocr.Configuration.BlackListCharacters = "~`$#^*_}{][|\\"; ocr.Configuration.PageSegmentationMode = TesseractPageSegmentationMode.Auto; ocr.Configuration.TesseractVersion = TesseractVersion.Tesseract5; ocr.Configuration.EngineMode = TesseractEngineMode.LstmOnly; ocr.Language = OcrLanguage.EnglishFast; using (var input = new OcrInput(@"img\Potter.tiff")) { var result = ocr.Read(input); Console.WriteLine(result.Text); } } } $vbLabelText $csharpLabel 이 결과는 기준치인 100%와 비교했을 때 99.8%의 정확도를 가지지만 35% 더 빠릅니다. 라이선스 및 가격 Dynamsoft 라이선스 및 가격 연간 라이선스. 모든 요금에는 1년의 유지 관리가 포함되며, 이는 무료 소프트웨어 업그레이드 및 프리미엄 지원을 포함합니다. Dynamsoft는 두 가지 유형의 라이선스를 제공합니다: 클라이언트 장치별 라이선스 "하나의 클라이언트 장치 라이선스"는 동일한 출처 애플리케이션(동일한 프로토콜, 동일한 호스트 및 동일한 포트)에 액세스하여 단일 클라이언트 장치에서 소프트웨어의 기능을 사용하는 것을 허용합니다. 비활성화된 클라이언트 장치는 90일 연속 소프트웨어 기능에 액세스하지 않은 장치입니다. 비활성 클라이언트 장치의 라이선스 좌석은 즉시 해제되어 다른 활성 클라이언트 장치에서 사용할 수 있게 됩니다. 허용된 최대 라이선스 좌석 수에 도달하면, Dynamsoft는 비상 사용을 위해 클라이언트 장치 할당량의 추가 10%를 제공합니다. 추가 클라이언트 장치 할당량이 소진되면, 사용할 수 있는 라이선스 좌석이 다시 나타날 때까지 새로운 클라이언트 장치는 소프트웨어에 접근하고 사용할 수 없습니다. 클라이언트 장치 할당량을 초과하는 것은 이미 라이선스를 받은 클라이언트 장치에 영향을 미치지 않는다는 것을 잊지 마세요. 서버별 라이선스 애플리케이션을 단일 서버에 배포하려면 "하나의 서버 라이선스"가 필요합니다. 서버는 물리적 서버와 가상 서버를 모두 지칭하며, 생산 서버, 장애 복구 서버, 테스트에 사용되는 개발 서버, 품질 보증 서버, 테스트 서버 및 스테이징 서버를 포함하되 이에 국한되지 않으며, 모든 서버는 라이선스가 필요합니다. 지속적 통합 서버(빌드 서버)나 로컬 호스트 개발 서버에는 추가 라이선스가 필요하지 않습니다. 서버별 라이선스는 온프레미스 서버 설치에만 유효하며, 클라우드 배포에는 유효하지 않습니다. Dynamsoft OCR의 가격은 연간 1,249달러부터 시작합니다. IronOCR 라이선스 및 가격 개발자로서 우리는 모두 가능한 적은 돈과 자원으로 프로젝트를 완료하고 싶어합니다 — 예산 계획은 필수적입니다. 표를 검토하여 귀하의 요구 사항과 예산에 가장 적합한 라이선스를 결정하십시오. IronOCR는 개발자 수, 프로젝트 및 위치 수를 맞춤화할 수 있는 라이선스를 제공하여 프로젝트의 요구를 충족하면서 필요한 범위만 지불할 수 있게 합니다. IronOCR 라이선스 키는 제품을 워터마크 없이 게시할 수 있게 해줍니다. 라이선스는 $799부터 시작하며 1년 간의 지원 및 업그레이드를 포함합니다. 체험판 라이선스 키를 사용하여 IronOCR를 무료로 시도할 수도 있습니다. 결론 Mac, Windows, Linux, Azure OCR 및 Docker에서 IronOCR for C#을 사용할 수 있습니다. .NET Framework 4.0 이상 필요하며, .NET Standard 2.0+, .NET Core 2.0+, .NET 5, macOS 및 Linux용 Mono, macOS용 Xamarin은 모두 크로스 플랫폼 개발의 예입니다. IronOCR는 최신 Tesseract 5 엔진을 사용하여 모든 주요 이미지 및 PDF 형식에서 텍스트, 바코드 및 QR 코드를 읽습니다. 몇 분 안에 이 라이브러리는 귀하의 데스크탑, 콘솔 또는 웹 앱에 OCR 기능을 추가합니다! OCR은 또한 PDF를 읽을 수 있으며, 다중페이지 TIFF를 검색 가능한 PDF 문서 또는 OCR 스캔에서 XHTML로 저장할 수 있습니다. 플레인 텍스트, 바코드 데이터 및 단락, 줄, 단어 및 문자를 아우르는 OCR 결과 클래스가 데이터 출력 옵션에 포함됩니다. 아랍어, 중국어, 영어, 핀란드어, 프랑스어, 독일어, 히브리어, 이탈리아어, 일본어, 한국어, 포르투갈어, 러시아어 및 스페인어를 포함하여 125개 언어로 제공되지만, 맞춤형 언어 팩도 생성할 수 있습니다. Dynamic .NET TWAIN OCR 애드온은 C# 또는 VB .NET으로 작성된 WinForms 및 WPF 애플리케이션에서 사용할 수 있는 빠르고 안정적인 .NET 구성 요소입니다. Dynamic .NET TWAIN의 이미지 캡처 모듈을 사용하여 문서를 스캔하거나 웹캠에서 사진을 캡처한 후 이미지를 OCR로 처리하여 이미지의 텍스트를 텍스트, 검색 가능한 PDF 파일 또는 문자열로 변환할 수 있습니다. 영어 외에도 여러 아시아 언어와 아랍어가 제공됩니다. IronOCR는 Dynamsoft OCR보다 더 나은 라이선스를 제공합니다; IronOcr는 1년 무료로 $799부터 시작하며, Dynamsoft는 무료 체험판과 함께 $1249부터 시작합니다. IronOCR도 여러 사용자를 위한 라이선스를 제공하지만, Dynamsoft에서는 한 사용자당 하나의 라이선스만 제공됩니다. 두 소프트웨어 모두 바코드, 이미지 - 텍스트 해독에서 최고의 성능을 제공하기 위해 노력하고 있지만, IronOCR는 상태가 좋지 않은 이미지에서조차도 빛을 발휘하는 점에서 돋보입니다. 세련된 조정 방식을 자동으로 도입하여 최상의 OCR 결과를 제공합니다. IronOCR도 Tesseract를 사용하여 오류가 거의 없는 최적의 결과를 제공합니다. Iron Software는 또한 고객과 사용자에게 두 번의 클릭으로 전체 소프트웨어 세트를 가져갈 수 있는 선택권을 제공합니다. 이는 Iron Software 세트의 두 구성 요소 가격으로 현재 모든 다섯 구성 요소와 중단 없는 지원을 받을 수 있다는 것을 의미합니다. 참고해 주세요Dynamsoft OCR는 그 소유자의 등록 상표입니다. 이 사이트는 Dynamsoft OCR와 관련되지 않고, Dynamsoft OCR의 승인이나 후원을 받지 않았습니다. 모든 제품명, 로고 및 브랜드는 해당 소유자의 자산입니다. 비교는 정보 제공 목적으로만 사용되며, 작성 시점에 공개적으로 이용 가능한 정보를 반영합니다. 자주 묻는 질문 C#을 사용하여 텍스트 이미지를 디지털 형식으로 변환하려면 어떻게 해야 할까요? IronOCR C#에서 사용하면 텍스트 이미지를 디지털 형식으로 변환할 수 있습니다. IronOCR 저품질 스캔 이미지를 자동으로 선명하게 하고 보정하는 기능을 제공하므로 다양한 이미지 형식을 텍스트로 변환하는 데 이상적입니다. IronOCR 저품질 스캔 파일을 처리하는 데 어떤 이점을 제공합니까? IronOCR 기울기, 왜곡 및 배경 노이즈를 줄이고 해상도와 대비를 개선하여 품질이 낮은 스캔 이미지를 자동으로 향상시켜 텍스트 인식 정확도를 높입니다. 크로스 플랫폼 애플리케이션에 더 적합한 OCR 라이브러리는 무엇일까요? IronOCR Xamarin 및 Azure와 같은 환경을 지원하므로 다양한 플랫폼에서 작업하는 개발자에게 유연성을 제공하여 크로스 플랫폼 애플리케이션에 적합합니다. IronOCR 어떤 이미지 형식을 지원하나요? IronOCR 다양한 이미지 형식을 지원하여 여러 OCR 응용 분야에서 다용도로 활용할 수 있습니다. 이미지와 PDF 문서를 처리할 수 있어 다양한 입력 소스를 유연하게 처리할 수 있습니다. OCR 기술이 기업의 문서 관리에 도움이 될 수 있을까요? 네, OCR 기술은 실물 문서를 디지털화하여 검색 및 편집이 가능하게 함으로써 문서 관리를 크게 향상시킬 수 있습니다. 이를 통해 수동 데이터 입력이 줄어들고 오류가 최소화되며 접근성이 향상됩니다. Dynamsoft OCR은 기기에서 이미지를 어떻게 획득하나요? Dynamsoft OCR은 TWAIN 호환 장치 및 웹캠에서 이미지를 획득할 수 있도록 지원하며, 일괄 스캔 및 스캐너 속성 수정을 통해 효율적인 이미지 처리를 가능하게 합니다. IronOCR 의 가격 옵션은 다른 라이브러리와 비교했을 때 어떤가요? IronOCR 개발자 수, 프로젝트 수, 위치 등에 따라 맞춤 설정할 수 있는 라이선스를 제공하여 다른 라이브러리에 비해 더욱 유연하고 비용 효율적인 옵션을 제공합니다. OCR 기술을 사용할 때 흔히 발생하는 문제점은 무엇인가요? OCR 기술의 일반적인 문제점으로는 저해상도 이미지 처리, 이미지 왜곡, 다양한 글꼴 등이 있습니다. 하지만 IronOCR 과 같은 라이브러리는 이러한 문제점을 해결하고 OCR 정확도를 향상시키는 기능을 내장하고 있습니다. 칸나팟 우돈판트 지금 바로 엔지니어링 팀과 채팅하세요 소프트웨어 엔지니어 카나팟은 소프트웨어 엔지니어가 되기 전 일본 홋카이도 대학교에서 환경 자원학 박사 학위를 취득했습니다. 학위 과정 중에는 생물생산공학과 소속 차량 로봇 연구실에서 활동하기도 했습니다. 2022년에는 C# 기술을 활용하여 Iron Software의 엔지니어링 팀에 합류했고, 현재 IronPDF 개발에 집중하고 있습니다. 카나팟은 IronPDF에 사용되는 대부분의 코드를 직접 작성하는 개발자로부터 배울 수 있다는 점에 만족하며, 동료들과의 소통을 통해 배우는 것 외에도 Iron Software에서 일하는 즐거움을 누리고 있습니다. 코딩이나 문서 작업을 하지 않을 때는 주로 PS5로 게임을 하거나 The Last of Us를 다시 시청하는 것을 즐깁니다. 관련 기사 게시됨 3월 8, 2026 어떤 Tesseract OCR 라이브러리를 선택해야 할까요? 상위 세 가지 옵션에 대한 개발자의 비교 C# 프로젝트에 적합한 Tesseract OCR 엔진을 찾아보세요. 언어 지원, 출력 형식 및 생산 준비 상태를 다루는 세 가지 라이브러리를 공정하게 비교합니다. 더 읽어보기 게시됨 3월 8, 2026 MODI OCR C# vs. IronOCR: C#에서 올바른 광학 문자 인식 라이브러리 선택하기 MODI OCR C#과 IronOCR for .NET을 비교하세요. 코드 예제, 기능 테이블 및 마이크로소프트 오피스 도큐멘트 이미징에서 현대적인 OCR 라이브러리로의 전환 단계가 포함되어 있습니다. 더 읽어보기 업데이트됨 3월 1, 2026 OCR API를 사용하는 Microsoft Azure Vision과 IronOCR 중 어느 것이 문서 이미지 처리를 더 잘할까요? Microsoft의 OCR API(Azure Vision)와 IronOCR for .NET 비교해 보세요. 문서 텍스트 추출을 위한 코드 예제, 가격, 데이터 개인정보 보호 및 기능 분석을 나란히 비교해 드립니다. 더 읽어보기 IronOCR 과 Tesseract .NET 비교IronOCR 과 Abbyy Finereader 비교
게시됨 3월 8, 2026 어떤 Tesseract OCR 라이브러리를 선택해야 할까요? 상위 세 가지 옵션에 대한 개발자의 비교 C# 프로젝트에 적합한 Tesseract OCR 엔진을 찾아보세요. 언어 지원, 출력 형식 및 생산 준비 상태를 다루는 세 가지 라이브러리를 공정하게 비교합니다. 더 읽어보기
게시됨 3월 8, 2026 MODI OCR C# vs. IronOCR: C#에서 올바른 광학 문자 인식 라이브러리 선택하기 MODI OCR C#과 IronOCR for .NET을 비교하세요. 코드 예제, 기능 테이블 및 마이크로소프트 오피스 도큐멘트 이미징에서 현대적인 OCR 라이브러리로의 전환 단계가 포함되어 있습니다. 더 읽어보기
업데이트됨 3월 1, 2026 OCR API를 사용하는 Microsoft Azure Vision과 IronOCR 중 어느 것이 문서 이미지 처리를 더 잘할까요? Microsoft의 OCR API(Azure Vision)와 IronOCR for .NET 비교해 보세요. 문서 텍스트 추출을 위한 코드 예제, 가격, 데이터 개인정보 보호 및 기능 분석을 나란히 비교해 드립니다. 더 읽어보기