IronOCR 방법 텍스트를 이미지로 강조 표시 IronOCR로 C#에서 문자를 이미지로 강조 표시하기 커티스 차우 업데이트됨:1월 10, 2026 다운로드 IronOCR NuGet 다운로드 DLL 다운로드 윈도우 설치 프로그램 무료 체험 시작하기 LLM용 사본 LLM용 사본 LLM용 마크다운 형식으로 페이지를 복사하세요 ChatGPT에서 열기 ChatGPT에 이 페이지에 대해 문의하세요 제미니에서 열기 제미니에게 이 페이지에 대해 문의하세요 Grok에서 열기 Grok에게 이 페이지에 대해 문의하세요 혼란 속에서 열기 Perplexity에게 이 페이지에 대해 문의하세요 공유하다 페이스북에 공유하기 트위터에 공유하기 LinkedIn에 공유하기 URL 복사 이메일로 기사 보내기 This article was translated from English: Does it need improvement? Translated View the article in English IronOCR의 HighlightTextAndSaveAsImages 메서드는 감지된 텍스트(문자, 단어, 줄 또는 단락) 주위에 경계 상자를 그려 OCR 결과를 시각화하고 이를 진단 이미지로 저장하여 개발자가 OCR 정확도를 검증하고 인식 문제를 디버깅할 수 있도록 합니다. OCR 결과를 시각화하는 것은 엔진이 이미지 내에서 감지한 특정 텍스트 요소 주위에 윤곽을 렌더링하는 것입니다. 이 과정은 개별 문자, 단어, 줄 또는 단락의 정확한 위치에 고유한 강조 표시를 오버레이하여 인식된 콘텐츠의 명확한 지도를 제공합니다. 이 시각적 피드백은 OCR 출력 정확성을 디버깅하고 검증하는 데 중요하여 소프트웨어가 감지한 내용과 오류를 범한 위치를 보여줍니다. 복잡한 문서와 처리 문제를 다루는 경우, 시각적 강조는 필수적인 진단 도구로 변모합니다. 이 기사에서는 IronOCR의 HighlightTextAndSaveAsImages 방법을 사용하여 IronOCR의 진단 기능을 시연합니다. 이 함수는 텍스트의 특정 부분을 강조하고 이미지를 저장하여 검증용으로 사용합니다. 문서 처리 시스템을 구축하거나 품질 관리 측정값을 구현하거나 OCR 구현을 검증할 때, 이 기능은 OCR 엔진이 감지한 내용을 즉시 시각적으로 피드백합니다. 빠른 시작: PDF에서 단어 즉시 강조 표시 PDF를 로드하고 각 단어를 강조 표시하며 결과를 이미지로 저장하는 IronOCR 사용 예제입니다. OCR 결과에 대한 시각적 피드백을 얻기 위한 한 줄만 필요합니다. NuGet 패키지 관리자를 사용하여 https://www.nuget.org/packages/IronOcr 설치하기 PM > Install-Package IronOcr 다음 코드 조각을 복사하여 실행하세요. new IronOcr.OcrInput().LoadPdf("document.pdf").HighlightTextAndSaveAsImages(new IronOcr.IronTesseract(), "highlight_page_", IronOcr.ResultHighlightType.Word); 실제 운영 환경에서 테스트할 수 있도록 배포하세요. 무료 체험판으로 오늘 프로젝트에서 IronOCR 사용 시작하기 Free 30 Day Trial 최소 워크플로우(5단계) 페이지 회전을 감지하는 C# 라이브러리를 다운로드하세요. OCR 엔진 인스턴스화 `LoadPdf`로 PDF 문서 로드 `HighlightTextAndSaveAsImages`를 사용하여 텍스트 부분을 강조하고 이미지를 저장 텍스트 강조 표시 및 이미지를 저장하는 방법은 무엇입니까? IronOCR에서는 텍스트를 강조 표시하고 이미지를 저장하는 것이 간단합니다. 기존 PDF를 LoadPdf를 사용하여 불러온 다음 HighlightTextAndSaveAsImages 메서드를 호출하여 텍스트 섹션을 강조 표시하고 이미지로 저장합니다. 이 기술은 문서에서 OCR 정확성을 검증하고 텍스트 인식 문제를 디버그합니다. 이 메서드는 IronTesseract OCR 엔진 , 출력 파일 이름의 접두사, 그리고 강조 표시할 텍스트 유형을 지정하는 ResultHighlightType의 열거형 값, 이렇게 세 가지 매개변수를 받습니다. 이 예제에서는 ResultHighlightType.Paragraph를 사용하여 텍스트 블록을 단락으로 강조 표시합니다. 참고해 주세요이 함수는 출력 문자열 접두사를 사용하고 각 페이지에 대해 출력 이미지 파일 이름에 페이지 식별자(예: "page_0", "page_1")를 추가합니다. 이 예제에서는 세 개의 단락이 있는 PDF를 사용합니다. 입력 PDF는 어떤가요? 강조 코드를 구현하는 방법은 무엇입니까? 아래의 예제 코드는 OcrInput 클래스를 사용한 기본 구현을 보여줍니다. :path=/static-assets/ocr/content-code-examples/how-to/highlight-texts-as-images.cs using IronOcr; IronTesseract ocrTesseract = new IronTesseract(); using var ocrInput = new OcrInput(); ocrInput.LoadPdf("document.pdf"); ocrInput.HighlightTextAndSaveAsImages(ocrTesseract, "highlight_page_", ResultHighlightType.Paragraph); $vbLabelText $csharpLabel 출력 이미지는 무엇을 보여줍니까? 위의 출력 이미지에서 볼 수 있듯이 세 개의 단락이 모두 옅은 빨간 상자로 강조되었습니다. 이 시각적 표현은 개발자가 OCR 엔진이 문서를 어떻게 읽을 수 있는 블록으로 분할하는지를 빠르게 파악하도록 돕습니다. 결과 강조 유형의 다른 옵션은 무엇입니까? 위 예시에서는 ResultHighlightType.Paragraph를 사용하여 텍스트 블록을 강조 표시했습니다. IronOCR는 이 열거형을 통해 추가 강조 옵션을 제공합니다. 아래는 다양한 진단 목적을 위한 가용한 유형의 전체 목록입니다. 문자: OCR 엔진이 감지한 모든 개별 문자 주위에 윤곽을 그립니다. 특히 사용자 정의 언어 파일로 작업할 때, 문자 인식 또는 특수 글꼴의 디버깅에 유용합니다. 단어: 엔진이 식별한 각 완전한 단어를 강조합니다. 특히 바코드 및 QR 판독과 함께 텍스트 인식을 구현할 때 단어 경계와 올바른 단어 식별을 검증하는 데 이상적입니다. 줄: 감지된 모든 텍스트 줄을 강조합니다. 스캔된 문서 처리 시 줄 식별 검증이 필요한 복잡한 레이아웃의 문서에 유용합니다. 단락: 단락으로 그룹화된 전체 텍스트 블록을 강조합니다. 특히 테이블 추출 작업에서 문서 레이아웃을 이해하고 텍스트 블록 세분화를 검증하는 데 완벽합니다. 다양한 강조 유형을 비교하는 방법은 무엇입니까? 이 포괄적인 예제는 동일한 문서에서 다양한 유형에 대한 강조를 생성하여 결과를 비교할 수 있게 도와줍니다: using IronOcr; using System; // Initialize the OCR engine with custom configuration IronTesseract ocrTesseract = new IronTesseract(); // Configure for better accuracy if needed ocrTesseract.Configuration.ReadBarCodes = false; // Disable if not needed for performance ocrTesseract.Configuration.PageSegmentationMode = TesseractPageSegmentationMode.AutoOsd; // Load the PDF document using var ocrInput = new OcrInput(); ocrInput.LoadPdf("document.pdf"); // Generate highlights for each type Console.WriteLine("Generating character-level highlights..."); ocrInput.HighlightTextAndSaveAsImages(ocrTesseract, "highlight_character_", ResultHighlightType.Character); Console.WriteLine("Generating word-level highlights..."); ocrInput.HighlightTextAndSaveAsImages(ocrTesseract, "highlight_word_", ResultHighlightType.Word); Console.WriteLine("Generating line-level highlights..."); ocrInput.HighlightTextAndSaveAsImages(ocrTesseract, "highlight_line_", ResultHighlightType.Line); Console.WriteLine("Generating paragraph-level highlights..."); ocrInput.HighlightTextAndSaveAsImages(ocrTesseract, "highlight_paragraph_", ResultHighlightType.Paragraph); Console.WriteLine("All highlight images have been generated successfully!"); using IronOcr; using System; // Initialize the OCR engine with custom configuration IronTesseract ocrTesseract = new IronTesseract(); // Configure for better accuracy if needed ocrTesseract.Configuration.ReadBarCodes = false; // Disable if not needed for performance ocrTesseract.Configuration.PageSegmentationMode = TesseractPageSegmentationMode.AutoOsd; // Load the PDF document using var ocrInput = new OcrInput(); ocrInput.LoadPdf("document.pdf"); // Generate highlights for each type Console.WriteLine("Generating character-level highlights..."); ocrInput.HighlightTextAndSaveAsImages(ocrTesseract, "highlight_character_", ResultHighlightType.Character); Console.WriteLine("Generating word-level highlights..."); ocrInput.HighlightTextAndSaveAsImages(ocrTesseract, "highlight_word_", ResultHighlightType.Word); Console.WriteLine("Generating line-level highlights..."); ocrInput.HighlightTextAndSaveAsImages(ocrTesseract, "highlight_line_", ResultHighlightType.Line); Console.WriteLine("Generating paragraph-level highlights..."); ocrInput.HighlightTextAndSaveAsImages(ocrTesseract, "highlight_paragraph_", ResultHighlightType.Paragraph); Console.WriteLine("All highlight images have been generated successfully!"); $vbLabelText $csharpLabel 여러 페이지 문서를 처리하는 방법은 무엇입니까? 여러 페이지의 PDF 또는 여러 프레임의 TIFF 파일을 처리할 때, 강조 기능은 각 페이지를 개별적으로 자동 처리합니다. 이는 특히 PDF OCR 텍스트 추출 워크플로 구현 시 유용합니다: using IronOcr; using System.IO; IronTesseract ocrTesseract = new IronTesseract(); // Load a multi-page document using var ocrInput = new OcrInput(); ocrInput.LoadPdf("multi-page-document.pdf"); // Create output directory if it doesn't exist string outputDir = "highlighted_pages"; Directory.CreateDirectory(outputDir); // Generate highlights for each page // Files will be named: highlighted_pages/page_0.png, page_1.png, etc. ocrInput.HighlightTextAndSaveAsImages(ocrTesseract, Path.Combine(outputDir, "page_"), ResultHighlightType.Word); // Count generated files for verification int pageCount = Directory.GetFiles(outputDir, "page_*.png").Length; Console.WriteLine($"Generated {pageCount} highlighted page images"); using IronOcr; using System.IO; IronTesseract ocrTesseract = new IronTesseract(); // Load a multi-page document using var ocrInput = new OcrInput(); ocrInput.LoadPdf("multi-page-document.pdf"); // Create output directory if it doesn't exist string outputDir = "highlighted_pages"; Directory.CreateDirectory(outputDir); // Generate highlights for each page // Files will be named: highlighted_pages/page_0.png, page_1.png, etc. ocrInput.HighlightTextAndSaveAsImages(ocrTesseract, Path.Combine(outputDir, "page_"), ResultHighlightType.Word); // Count generated files for verification int pageCount = Directory.GetFiles(outputDir, "page_*.png").Length; Console.WriteLine($"Generated {pageCount} highlighted page images"); $vbLabelText $csharpLabel 성능 최적화의 모범 사례는 무엇입니까? 강조 기능을 사용할 때 다음 최적화 모범 사례를 고려해보십시오: 파일 크기: 강조 이미지는 특히 고해상도 문서의 경우 용량이 클 수 있습니다. 대량 처리할 때 출력 디렉토리의 가용 공간을 고려하세요. 최적화 팁은 빠른 OCR 구성 가이드에서 참조하세요. 성능: 강조 생성은 처리 오버헤드를 증가시킵니다. 생산 시스템에서 강조가 가끔 필요할 때, 이를 주요 워크플로의 일부가 아닌 별도의 진단 프로세스로 구현하세요. 배치 처리를 위해 멀티스레드 OCR 사용을 고려하세요. 오류 처리: 파일 작업 시 항상 적절한 오류 처리를 구현하세요: try { using var ocrInput = new OcrInput(); ocrInput.LoadPdf("document.pdf"); // Apply image filters if needed for better recognition ocrInput.Deskew(); // Correct slight rotations ocrInput.DeNoise(); // Remove background noise ocrInput.HighlightTextAndSaveAsImages(ocrTesseract, "highlight_", ResultHighlightType.Word); } catch (Exception ex) { Console.WriteLine($"Error during highlighting: {ex.Message}"); // Log error details for debugging } try { using var ocrInput = new OcrInput(); ocrInput.LoadPdf("document.pdf"); // Apply image filters if needed for better recognition ocrInput.Deskew(); // Correct slight rotations ocrInput.DeNoise(); // Remove background noise ocrInput.HighlightTextAndSaveAsImages(ocrTesseract, "highlight_", ResultHighlightType.Word); } catch (Exception ex) { Console.WriteLine($"Error during highlighting: {ex.Message}"); // Log error details for debugging } $vbLabelText $csharpLabel 강조는 OCR 결과와 어떻게 통합됩니까? 강조 기능은 IronOCR의 결과 객체와 매끄럽게 작동하여 시각적 강조와 추출된 텍스트 데이터를 상호 연결할 수 있게 도와줍니다. 이는 특히 인식된 텍스트의 특정 부분을 검증하거나 유효성을 검사해야 할 때 유용합니다. OcrResult 클래스는 감지된 각 요소에 대한 자세한 정보를 제공하며, 이는 이 메서드에서 생성된 시각적 강조 표시와 직접적으로 일치합니다. 문제가 발생하면 어떻게 해야 합니까? 강조 기능에 문제가 발생할 경우, 일반적인 해결책을 위한 일반 문제 해결 가이드를 참조하세요. 특정 강조 관련 문제에 대해서는: 빈 출력 이미지: 입력 문서에 읽을 수 있는 텍스트가 포함되어 있고 OCR 엔진이 문서 유형에 맞게 적절히 구성되어 있는지 확인하세요. 인식률을 높이려면 이미지 최적화 필터 또는 fixing image orientation를 적용해야 할 수 있습니다. 누락된 강조: 일부 문서 유형은 특정 전처리가 필요할 수 있습니다. 이미지 필터를 적용하거나 fixing image orientation를 사용하여 인식률을 높여보세요. 성능 문제 : 대용량 문서의 경우 처리 속도 향상을 위해 multithreading 구현을 고려해 보세요. 또한, 저품질 입력을 처리할 때 저품질 스캔 수정에 대한 가이드를 검토하세요. 프로덕션 디버깅에 이것을 어떻게 사용할 수 있습니까? 강조 기능은 우수한 프로덕션 디버깅 도구로 작용합니다. 장기 운영에 대한 중단 토큰 및 타임아웃과 통합하여 견고한 진단 시스템을 생성할 수 있습니다. 애플리케이션에 디버그 모드를 구현하는 것을 고려하세요: public class OcrDebugger { private readonly IronTesseract _tesseract; private readonly bool _debugMode; public OcrDebugger(bool enableDebugMode = false) { _tesseract = new IronTesseract(); _debugMode = enableDebugMode; } public OcrResult ProcessDocument(string filePath) { using var input = new OcrInput(); input.LoadPdf(filePath); // Apply preprocessing input.Deskew(); input.DeNoise(); // Generate debug highlights if in debug mode if (_debugMode) { string debugPath = $"debug_{Path.GetFileNameWithoutExtension(filePath)}_"; input.HighlightTextAndSaveAsImages(_tesseract, debugPath, ResultHighlightType.Word); } // Perform actual OCR return _tesseract.Read(input); } } public class OcrDebugger { private readonly IronTesseract _tesseract; private readonly bool _debugMode; public OcrDebugger(bool enableDebugMode = false) { _tesseract = new IronTesseract(); _debugMode = enableDebugMode; } public OcrResult ProcessDocument(string filePath) { using var input = new OcrInput(); input.LoadPdf(filePath); // Apply preprocessing input.Deskew(); input.DeNoise(); // Generate debug highlights if in debug mode if (_debugMode) { string debugPath = $"debug_{Path.GetFileNameWithoutExtension(filePath)}_"; input.HighlightTextAndSaveAsImages(_tesseract, debugPath, ResultHighlightType.Word); } // Perform actual OCR return _tesseract.Read(input); } } $vbLabelText $csharpLabel 다음으로 어디로 가야합니까? 이제 강조 기능을 사용하는 방법을 이해했으니, 탐색하세요: OCR 결과에서 검색 가능한 PDF 만들기 여권이나 면허증과 같은 특정 문서 유형 읽기 우리의 시작 가이드로 개발 환경에 IronOCR 설정 글로벌 애플리케이션을 위한 125개의 국제 언어 지원 구현 필터 마법사를 사용하여 이미지 처리 최적화 프로덕션 사용을 위해, 워터마크 제거 및 전체 기능에 액세스하려면 라이센스 획득을 기억하세요. 자주 묻는 질문 C# 애플리케이션에서 OCR 결과를 시각화하려면 어떻게 해야 할까요? IronOCR은 감지된 텍스트 요소(문자, 단어, 줄 또는 단락) 주위에 경계 상자를 그려 OCR 결과를 시각화하고 이를 진단 이미지로 저장하는 HighlightTextAndSaveAsImages 메서드를 제공합니다. 이 기능은 개발자가 OCR 정확도를 검증하고 인식 문제를 디버깅하는 데 도움이 됩니다. PDF 문서에서 단어를 강조 표시하는 가장 간단한 방법은 무엇입니까? IronOCR을 사용하면 단 한 줄의 코드로 PDF에서 단어를 강조 표시할 수 있습니다. 예를 들어, `new IronOcr.OcrInput().LoadPdf("document.pdf").HighlightTextAndSaveAsImages(new IronOcr.IronTesseract(), "highlight_page_", IronOcr.ResultHighlightType.Word)`와 같이 코드를 작성하면 PDF 파일이 로드되고 강조 표시된 단어가 포함된 이미지가 생성됩니다. HighlightTextAndSaveAsImages 메서드는 어떤 매개변수를 필요로 합니까? IronOCR의 HighlightTextAndSaveAsImages 메서드는 세 가지 매개변수를 필요로 합니다. 첫 번째는 IronTesseract OCR 엔진 인스턴스이고, 두 번째는 출력 파일 이름에 사용할 접두사 문자열이며, 세 번째는 강조 표시할 텍스트 요소(문자, 단어, 줄 또는 단락)를 지정하는 ResultHighlightType 열거형 값입니다. 텍스트 강조 기능을 사용할 때 생성되는 이미지의 이름은 어떻게 지정되나요? IronOCR은 사용자가 지정한 접두사와 페이지 식별자를 조합하여 출력 이미지 파일 이름을 자동으로 지정합니다. 예를 들어, 접두사로 "highlight_page_"를 사용하면 문서의 각 페이지에 대해 "highlight_page_0", "highlight_page_1" 등의 파일이 생성됩니다. OCR 개발에 있어 시각적 강조 표시가 중요한 이유는 무엇일까요? IronOCR의 시각적 강조 표시 기능은 OCR 엔진이 어떤 텍스트를 감지했는지, 그리고 잠재적인 오류가 발생하는 위치를 정확하게 보여줌으로써 중요한 진단 피드백을 제공합니다. 이 시각적 지도는 개발자가 인식 문제를 디버깅하고, OCR 정확도를 검증하고, 복잡한 문서에서 발생하는 문제를 해결하는 데 도움이 됩니다. 단어 외에 다른 유형의 텍스트 요소도 강조 표시할 수 있나요? 네, IronOCR의 ResultHighlightType 열거형을 사용하면 개별 문자, 단어, 줄 또는 전체 단락을 포함한 다양한 텍스트 요소를 강조 표시할 수 있습니다. HighlightTextAndSaveAsImages 메서드를 호출할 때 원하는 유형을 지정하기만 하면 다양한 수준의 텍스트 감지 결과를 시각화할 수 있습니다. 커티스 차우 지금 바로 엔지니어링 팀과 채팅하세요 기술 문서 작성자 커티스 차우는 칼턴 대학교에서 컴퓨터 과학 학사 학위를 취득했으며, Node.js, TypeScript, JavaScript, React를 전문으로 하는 프론트엔드 개발자입니다. 직관적이고 미적으로 뛰어난 사용자 인터페이스를 만드는 데 열정을 가진 그는 최신 프레임워크를 활용하고, 잘 구성되고 시각적으로 매력적인 매뉴얼을 제작하는 것을 즐깁니다. 커티스는 개발 분야 외에도 사물 인터넷(IoT)에 깊은 관심을 가지고 있으며, 하드웨어와 소프트웨어를 통합하는 혁신적인 방법을 연구합니다. 여가 시간에는 게임을 즐기거나 디스코드 봇을 만들면서 기술에 대한 애정과 창의성을 결합합니다. 시작할 준비 되셨나요? Nuget 다운로드 5,525,971 | 버전: 2026.3 방금 출시되었습니다 무료 체험 시작하기 NuGet 무료 다운로드 총 다운로드 수: 5,525,971 라이선스 보기 아직도 스크롤하고 계신가요? 빠른 증거를 원하시나요? PM > Install-Package IronOcr 샘플을 실행하세요 이미지가 검색 가능한 텍스트로 바뀌는 것을 확인해 보세요. NuGet 무료 다운로드 총 다운로드 수: 5,525,971 라이선스 보기