IronOCR 시작하기 Get Started with OCR in C# and VB.NET 커티스 차우 업데이트됨:1월 31, 2026 다운로드 IronOCR NuGet 다운로드 DLL 다운로드 윈도우 설치 프로그램 무료 체험 시작하기 LLM용 사본 LLM용 사본 LLM용 마크다운 형식으로 페이지를 복사하세요 ChatGPT에서 열기 ChatGPT에 이 페이지에 대해 문의하세요 제미니에서 열기 제미니에게 이 페이지에 대해 문의하세요 Grok에서 열기 Grok에게 이 페이지에 대해 문의하세요 혼란 속에서 열기 Perplexity에게 이 페이지에 대해 문의하세요 공유하다 페이스북에 공유하기 트위터에 공유하기 LinkedIn에 공유하기 URL 복사 이메일로 기사 보내기 This article was translated from English: Does it need improvement? Translated View the article in English IronOCR은 .NET 플랫폼 소프트웨어 개발자가 이미지와 PDF 문서에서 텍스트를 인식하고 읽을 수 있도록 해주는 C# 소프트웨어 라이브러리입니다. 이 라이브러리는 현존하는 가장 진보된 Tesseract 엔진을 사용하는 순수 .NET 기반 OCR 라이브러리입니다. 설치 NuGet 패키지 관리자를 사용하여 설치하세요. Visual Studio 또는 명령줄에서 NuGet 패키지 관리자를 사용하여 IronOcr을 설치하세요. Visual Studio에서 다음 명령어를 사용하여 콘솔로 이동합니다. 도구 -> NuGet 패키지 관리자 -> 패키지 관리자 콘솔 Install-Package IronOcr 버전 업데이트 및 설치에 대한 자세한 내용은 NuGet에서 IronOcr을 확인하세요. 다른 플랫폼에서 사용할 수 있는 IronOCR NuGet 패키지 도 있습니다. 윈도우:https://www.nuget.org/packages/IronOcr 리눅스:https://www.nuget.org/packages/IronOcr.Linux MacOS:https://www.nuget.org/packages/IronOcr.MacOs MacOS (ARM):https://www.nuget.org/packages/IronOcr.MacOs.ARM Linux 및 macOS용 IronOcr.Extensions.AdvancedScan 이 패키지는 Linux 및 Mac 사용자를 대상으로 하며, IronOcr의 고급 기능도 이용하고자 하는 사용자를 위한 것입니다. Linux: NuGet MacOS: NuGet 문제 해결 이번 패키지 업데이트를 통해 IronOCR은 OpenCV 종속성을 패키지 내에 통합하여 간소화했습니다. 따라서 현재 OpenCV 종속성을 가져오는 개발자가 다음과 같은 오류를 수신하는 경우 이 업데이트를 참고하시기 바랍니다. The type of namespace name `OpenCvSharp` could not be found(are you missing a using directive or an assembly reference) OpenCV 네임스페이스를 제거하시면 문제가 해결될 것입니다. IronOCR .ZIP 파일을 다운로드하세요. IronOCR을 .ZIP 파일로 다운로드하는 방법도 있습니다. DLL 파일을 바로 다운로드 하려면 클릭하세요. .zip 파일을 다운로드하셨다면: .NET Framework 4.0 이상 설치 지침: net40 폴더에 있는 IronOcr.dll 파일을 프로젝트에 포함시키세요. 그런 다음 어셈블리 참조를 추가합니다. 시스템 구성 시스템.도면 시스템.웹 .NET Standard, .NET Core 2.0 이상 및 .NET 5용 지침 netstandard2.0 폴더에 있는 IronOcr.dll 파일을 프로젝트에 포함시키세요. 그런 다음 다음 위치에 NuGet 패키지 참조를 추가합니다. 시스템.도면.Common 4.7 이상 IronOCR 설치 프로그램(Windows 전용)을 다운로드하십시오. 또 다른 방법은 IronOCR 설치 프로그램을 다운로드하는 것입니다. 이 프로그램을 다운로드하면 IronOCR을 바로 사용할 수 있도록 필요한 모든 리소스가 설치됩니다. 이 옵션은 윈도우 시스템에서만 사용할 수 있다는 점을 유의해 주세요. 설치 프로그램을 다운로드하려면 여기를 클릭 하십시오. .zip 파일을 다운로드하셨다면: .NET Framework 4.0 이상 설치 지침: net40 폴더에 있는 IronOcr.dll 파일을 프로젝트에 포함시키세요. 그런 다음 어셈블리 참조를 추가합니다. 시스템 구성 시스템.도면 시스템.웹 .NET Standard, .NET Core 2.0 이상 및 .NET 5용 지침 netstandard2.0 폴더에 있는 IronOcr.dll 파일을 프로젝트에 포함시키세요. 그런 다음 다음 위치에 NuGet 패키지 참조를 추가합니다. 시스템.도면.Common 4.7 이상 IronOCR을 선택해야 하는 이유는 무엇일까요? IronOCR은 설치가 간편하고, 모든 기능을 갖추고 있으며, 문서화가 잘 되어 있는 .NET 소프트웨어 라이브러리입니다. IronOCR을 선택하시면 외부 웹 서비스, 지속적인 비용 부담, 또는 기밀 문서를 인터넷을 통해 전송할 필요 없이 99.8% 이상의 OCR 정확도를 달성할 수 있습니다. C# 개발자들이 바닐라 Tesseract 대신 IronOCR을 선택하는 이유: 단일 DLL 또는 NuGet 패키지로 설치 박스에는 테서랙트 5, 4, 3 엔진이 기본으로 포함되어 있습니다. 정확도 99.8% 로 일반 테서랙트보다 훨씬 뛰어납니다. 놀라운 속도와 멀티스레딩 MVC, 웹 애플리케이션, 데스크톱, 콘솔 및 서버 애플리케이션과 호환 가능 실행 파일이나 C++ 코드가 없습니다. PDF OCR 완벽 지원 거의 모든 이미지 파일이나 PDF 파일에 대해 OCR을 수행합니다. .NET Core, Standard 및 Framework 완벽 지원 Windows, Mac, Linux, Azure, Docker, Lambda, AWS에 배포 바코드 및 QR 코드 읽기 OCR 결과를 XHTML 형식으로 내보내기 OCR 결과를 검색 가능한 PDF 문서로 내보내기 멀티스레딩 지원 125개 국제 언어 모두 NuGet 또는 OcrData 파일을 통해 관리됩니다. 이미지, 좌표, 통계 및 글꼴을 추출합니다. 단순한 텍스트가 아닙니다. 상용 및 독점 애플리케이션 내에서 Tesseract OCR을 재배포하는 데 사용할 수 있습니다. IronOCR은 사진이나 저해상도 스캔 이미지처럼 디지털 노이즈나 결함이 있는 실제 이미지 및 불완전한 문서를 처리할 때 탁월한 성능을 발휘합니다. 다른 .NET Tesseract API 및 웹 서비스와 같은 .NET 플랫폼용 무료 OCR 라이브러리는 이러한 실제 사용 사례에서 성능이 그다지 좋지 않습니다. OCR with Tesseract 5 - Start Coding in C 아래 코드 예시는 C# 또는 VB .NET을 사용하여 이미지에서 텍스트를 읽는 것이 얼마나 쉬운지 보여줍니다. 한 줄짜리 :path=/static-assets/ocr/content-code-examples/get-started/get-started-1.cs string Text = new IronTesseract().Read(@"img\Screenshot.png").Text; $vbLabelText $csharpLabel 설정 가능한 Hello World :path=/static-assets/ocr/content-code-examples/get-started/get-started-2.cs using IronOcr; IronTesseract ocr = new IronTesseract(); using OcrInput input = new OcrInput(); // Add multiple images input.LoadImage("images/sample.jpeg"); OcrResult result = ocr.Read(input); Console.WriteLine(result.Text); $vbLabelText $csharpLabel C# PDF OCR 이와 동일한 접근 방식을 사용하여 모든 PDF 문서에서 텍스트를 추출할 수 있습니다. :path=/static-assets/ocr/content-code-examples/get-started/get-started-3.cs using IronOcr; IronTesseract ocr = new IronTesseract(); using OcrInput input = new OcrInput(); // We can also select specific PDF page numbers to OCR input.LoadPdf("example.pdf", Password: "password"); OcrResult result = ocr.Read(input); Console.WriteLine(result.Text); // 1 page for every page of the PDF Console.WriteLine($"{result.Pages.Length} Pages"); $vbLabelText $csharpLabel 다중 페이지 TIFF 파일의 OCR 처리 :path=/static-assets/ocr/content-code-examples/get-started/get-started-4.cs using IronOcr; IronTesseract ocr = new IronTesseract(); using OcrInput input = new OcrInput(); var pageindices = new int[] { 1, 2 }; input.LoadImageFrames("multi-frame.tiff", pageindices); OcrResult result = ocr.Read(input); Console.WriteLine(result.Text); $vbLabelText $csharpLabel 바코드 및 QR 코드 IronOCR의 독특한 기능 중 하나는 텍스트를 스캔하는 동시에 문서에서 바코드와 QR 코드를 읽을 수 있다는 점입니다. OcrResult.OcrBarcode 클래스의 인스턴스는 개발자에게 스캔된 각 바코드에 대한 자세한 정보를 제공합니다. :path=/static-assets/ocr/content-code-examples/get-started/get-started-5.cs using IronOcr; IronTesseract ocr = new IronTesseract(); ocr.Configuration.ReadBarCodes = true; using OcrInput input = new OcrInput(); input.LoadImage("img/Barcode.png"); OcrResult Result = ocr.Read(input); foreach (var Barcode in Result.Barcodes) { // type and location properties also exposed Console.WriteLine(Barcode.Value); } $vbLabelText $csharpLabel 이미지의 특정 영역에 대한 OCR IronOCR의 모든 스캔 및 읽기 방식은 페이지의 특정 부분 또는 여러 페이지에서 텍스트를 읽을 위치를 정확하게 지정할 수 있는 기능을 제공합니다. 이는 표준화된 양식을 살펴볼 때 매우 유용하며, 많은 시간을 절약하고 효율성을 향상시킬 수 있습니다. 작물 영역을 사용하려면 System.Drawing에 시스템 참조를 추가하여 System.Drawing.Rectangle 객체를 사용할 수 있도록 해야 합니다. :path=/static-assets/ocr/content-code-examples/get-started/get-started-6.cs using IronOcr; IronTesseract ocr = new IronTesseract(); using OcrInput input = new OcrInput(); // Dimensions are in pixel var contentArea = new System.Drawing.Rectangle() { X = 215, Y = 1250, Height = 280, Width = 1335 }; input.LoadImage("document.png", contentArea); OcrResult result = ocr.Read(input); Console.WriteLine(result.Text); $vbLabelText $csharpLabel 저화질 스캔 이미지용 OCR IronOCR OcrInput 클래스는 일반 Tesseract가 읽을 수 없는 스캔을 수정할 수 있습니다. :path=/static-assets/ocr/content-code-examples/get-started/get-started-7.cs using IronOcr; IronTesseract ocr = new IronTesseract(); using OcrInput input = new OcrInput(); var pageindices = new int[] { 1, 2 }; input.LoadImageFrames(@"img\Potter.tiff", pageindices); // fixes digital noise and poor scanning input.DeNoise(); // fixes rotation and perspective input.Deskew(); OcrResult result = ocr.Read(input); Console.WriteLine(result.Text); $vbLabelText $csharpLabel OCR 결과를 검색 가능한 PDF 파일로 내보내기 :path=/static-assets/ocr/content-code-examples/get-started/get-started-8.cs using IronOcr; IronTesseract ocr = new IronTesseract(); using OcrInput input = new OcrInput(); input.Title = "Quarterly Report"; input.LoadImage("image1.jpeg"); input.LoadImage("image2.png"); var pageindices = new int[] { 1, 2 }; input.LoadImageFrames("image3.gif", pageindices); OcrResult result = ocr.Read(input); result.SaveAsSearchablePdf("searchable.pdf"); $vbLabelText $csharpLabel TIFF 파일을 검색 가능한 PDF 파일로 변환 :path=/static-assets/ocr/content-code-examples/get-started/get-started-9.cs using IronOcr; IronTesseract ocr = new IronTesseract(); using OcrInput input = new OcrInput(); var pageindices = new int[] { 1, 2 }; input.LoadImageFrames("example.tiff", pageindices); ocr.Read(input).SaveAsSearchablePdf("searchable.pdf"); $vbLabelText $csharpLabel OCR 결과를 HTML로 내보내기 :path=/static-assets/ocr/content-code-examples/get-started/get-started-10.cs using IronOcr; IronTesseract ocr = new IronTesseract(); using OcrInput input = new OcrInput(); input.Title = "Html Title"; input.LoadImage("image1.jpeg"); OcrResult Result = ocr.Read(input); Result.SaveAsHocrFile("results.html"); $vbLabelText $csharpLabel OCR 이미지 향상 필터 IronOCR OCR 성능을 향상시키기 위해 OcrInput 객체에 고유한 필터를 제공합니다. 이미지 향상 코드 예제 :path=/static-assets/ocr/content-code-examples/get-started/get-started-11.cs using IronOcr; IronTesseract ocr = new IronTesseract(); using OcrInput input = new OcrInput(); input.LoadImage("LowQuality.jpeg"); // fixes digital noise and poor scanning input.DeNoise(); // fixes rotation and perspective input.Deskew(); OcrResult result = ocr.Read(input); Console.WriteLine(result.Text); $vbLabelText $csharpLabel OCR 이미지 필터 목록 IronOCR에 내장된 OCR 성능 향상용 입력 필터는 다음과 같습니다. OcrInput.Rotate(double degrees) - 이미지를 시계 방향으로 지정된 각도만큼 회전합니다. 반시계 방향으로 회전하려면 음수를 사용하십시오. OcrInput.Binarize() - 이 필터는 모든 픽셀을 중간 색상 없이 검정색 또는 흰색으로 변환하여 대비가 매우 낮은 이미지에서 OCR 성능을 향상시킬 수 있습니다. OcrInput.ToGrayScale() - 모든 픽셀을 회색조로 변환합니다. 정확도는 향상되지 않을 수 있지만 속도는 향상될 수 있습니다. OcrInput.Contrast() - 대비를 자동으로 높여 저대비 스캔 시 속도와 정확도를 향상시키는 경우가 많습니다. OcrInput.DeNoise() - 디지털 노이즈를 제거합니다. 노이즈가 예상되는 경우에만 권장됩니다. OcrInput.Invert() - 모든 색상을 반전시킵니다(흰색은 검은색이 되고 검은색은 흰색이 됩니다). OcrInput.Dilate() - 형태학을 발전시키고 객체 경계에 픽셀을 추가합니다. 침식(Erode)의 반대 기능입니다. OcrInput.Erode() - 형태 변환을 진행하여 객체 경계에서 픽셀을 제거합니다. 팽창(Dilate)의 반대 기능입니다. OcrInput.Deskew() - 이미지를 회전시켜 올바른 방향으로 정렬합니다. 테서랙트의 왜곡 허용 오차가 제한적이기 때문에 유용합니다. OcrInput.EnhanceResolution - 저화질 이미지의 해상도를 향상시킵니다. 이 설정은 일반적으로 낮은 DPI 입력을 자동으로 처리하는 데 사용됩니다. EnhanceResolution는 저해상도 이미지(275dpi 미만)를 감지하고, 해상도를 높이고, 텍스트를 선명하게 하여 OCR 결과를 향상시킵니다. 시간이 다소 걸리기는 하지만, 전체 OCR 작업 시간을 줄여주는 경우가 많습니다. Language - 22개 국제 언어 팩 중에서 선택할 수 있습니다. Strategy - 단어 간의 통계적 관계를 기반으로 빠르고 정확도가 낮은 전략과 고급 전략(정확도를 위해 AI 사용) 중에서 선택할 수 있습니다. ColorSpace - OCR을 흑백 또는 컬러로 표시할지 선택하세요. 일반적으로는 흑백 이미지가 최적이지만, 특정 대비 상황에서는 컬러 이미지가 더 나을 수 있습니다. DetectWhiteTextOnDarkBackgrounds - 네거티브 이미지에 맞춰 어두운 배경의 흰색 텍스트를 자동으로 감지하고 읽습니다. InputImageType - OCR 라이브러리가 전체 문서를 대상으로 작업하는지 또는 일부 조각을 대상으로 작업하는지를 지정하여 라이브러리를 안내합니다. RotateAndStraighten - IronOCR 회전되었거나 원근 왜곡의 영향을 받는 문서를 올바르게 처리할 수 있도록 합니다. ReadBarcodes - 바코드와 QR 코드를 텍스트 스캔과 동시에 자동으로 읽어들이며, 추가 시간을 거의 발생시키지 않습니다. ColorDepth - OCR 처리 과정에서 색상 깊이에 대한 픽셀당 비트 수를 결정합니다. 심도가 깊어지면 화질은 향상되지만 처리 시간도 길어집니다. 125개 언어 팩 IronOCR은 DLL 형태로 배포되는 언어 팩을 통해 125개 국제 언어를 지원하며, 해당 언어 팩은 이 웹사이트 또는 NuGet 패키지 관리자 에서 다운로드할 수 있습니다. 사용 가능한 언어에는 독일어, 프랑스어, 영어, 중국어, 일본어 등이 포함됩니다. MRZ, MICR 검사, 금융 데이터, 차량 번호판 등을 위한 특수 언어 팩이 있습니다. 또한 사용자 지정 Tesseract ".traineddata" 파일을 사용할 수 있습니다. 언어 예시 // Reference to the path of the source file that demonstrates setting language packs for OCR :path=/static-assets/ocr/content-code-examples/get-started/get-started-12.cs // Reference to the path of the source file that demonstrates setting language packs for OCR using IronOcr; // PM> Install IronOcr.Languages.Arabic IronTesseract ocr = new IronTesseract(); ocr.Language = OcrLanguage.Arabic; using OcrInput input = new OcrInput(); var pageindices = new int[] { 1, 2 }; input.LoadImageFrames("img/arabic.gif", pageindices); // Add image filters if needed // In this case, even thought input is very low quality // IronTesseract can read what conventional Tesseract cannot. OcrResult result = ocr.Read(input); // Console can't print Arabic on Windows easily. // Let's save to disk instead. result.SaveAsTextFile("arabic.txt"); $vbLabelText $csharpLabel 다국어 예시 또한 여러 언어를 동시에 사용하여 OCR을 수행할 수 있습니다. 이를 통해 유니코드 문서의 영어 메타데이터 및 URL에 대한 OCR 성능을 향상시킬 수 있습니다. // Reference to the path of the source file that demonstrates multi-language OCR :path=/static-assets/ocr/content-code-examples/get-started/get-started-13.cs // Reference to the path of the source file that demonstrates multi-language OCR using IronOcr; // PM> Install IronOcr.Languages.ChineseSimplified IronTesseract ocr = new IronTesseract(); ocr.Language = OcrLanguage.ChineseSimplified; // We can add any number of languages ocr.AddSecondaryLanguage(OcrLanguage.English); using OcrInput input = new OcrInput(); input.LoadPdf("multi-language.pdf"); OcrResult result = ocr.Read(input); result.SaveAsTextFile("results.txt"); $vbLabelText $csharpLabel 상세 OCR 결과 객체 IronOCR은 각 작업에 대해 OCR 결과 객체를 반환합니다. 일반적으로 개발자는 스캔된 텍스트를 얻기 위해 Text 속성에 접근합니다. 하지만 결과 객체에는 훨씬 더 자세한 정보가 포함되어 있습니다. // Reference to the path of the source file demonstrating detailed OCR result object usage :path=/static-assets/ocr/content-code-examples/get-started/get-started-14.cs // Reference to the path of the source file demonstrating detailed OCR result object usage using IronOcr; IronTesseract ocr = new IronTesseract(); // Must be set to true to read barcode ocr.Configuration.ReadBarCodes = true; using OcrInput input = new OcrInput(); var pageindices = new int[] { 1, 2 }; input.LoadImageFrames(@"img\sample.tiff", pageindices); OcrResult result = ocr.Read(input); var pages = result.Pages; var words = pages[0].Words; var barcodes = result.Barcodes; // Explore here to find a massive, detailed API: // - Pages, Blocks, Paraphaphs, Lines, Words, Chars // - Image Export, Fonts Coordinates, Statistical Data, Tables $vbLabelText $csharpLabel 성능 IronOCR은 별도의 성능 조정이나 이미지 수정 없이 바로 사용할 수 있습니다. 속도가 엄청나게 빨라졌습니다. IronOcr.2020+는 이전 빌드보다 최대 10배 빠르고 오류는 250% 이상 줄었습니다. 더 알아보기 C#, VB, F#, 또는 기타 .NET 언어에서 OCR에 대해 자세히 알아보려면 IronOCR 사용에 대한 실제 사례와 라이브러리 최적화의 미묘한 차이를 보여주는 커뮤니티 튜토리얼을 참조 하십시오. .NET 개발자를 위한 전체 API 참조 자료 도 제공됩니다. 커티스 차우 지금 바로 엔지니어링 팀과 채팅하세요 기술 문서 작성자 커티스 차우는 칼턴 대학교에서 컴퓨터 과학 학사 학위를 취득했으며, Node.js, TypeScript, JavaScript, React를 전문으로 하는 프론트엔드 개발자입니다. 직관적이고 미적으로 뛰어난 사용자 인터페이스를 만드는 데 열정을 가진 그는 최신 프레임워크를 활용하고, 잘 구성되고 시각적으로 매력적인 매뉴얼을 제작하는 것을 즐깁니다. 커티스는 개발 분야 외에도 사물 인터넷(IoT)에 깊은 관심을 가지고 있으며, 하드웨어와 소프트웨어를 통합하는 혁신적인 방법을 연구합니다. 여가 시간에는 게임을 즐기거나 디스코드 봇을 만들면서 기술에 대한 애정과 창의성을 결합합니다. 검토자: 제프리 T. 프리츠 .NET 커뮤니티 팀의 수석 프로그램 관리자 제프는 .NET 및 Visual Studio 팀의 수석 프로그램 관리자이기도 합니다. 그는 .NET Conf 가상 컨퍼런스 시리즈의 총괄 프로듀서이며, 개발자를 위한 라이브 스트림 'Fritz and Friends'를 주 2회 진행하며 시청자들과 함께 기술에 대해 이야기하고 코드를 작성합니다. 제프는 Microsoft Build, Microsoft Ignite, .NET Conf, Microsoft MVP Summit 등 주요 Microsoft 개발자 행사를 위한 워크숍, 프레젠테이션 및 콘텐츠 기획을 담당합니다. 시작할 준비 되셨나요? Nuget 다운로드 5,525,971 | 버전: 2026.3 방금 출시되었습니다 무료 체험 시작하기 NuGet 무료 다운로드 총 다운로드 수: 5,525,971 라이선스 보기 아직도 스크롤하고 계신가요? 빠른 증거를 원하시나요? PM > Install-Package IronOcr 샘플을 실행하세요 이미지가 검색 가능한 텍스트로 바뀌는 것을 확인해 보세요. NuGet 무료 다운로드 총 다운로드 수: 5,525,971 라이선스 보기