PDF OCR 텍스트 추출
Iron Tesseract는 다양한 이미지 형식과 PDF 문서를 읽을 수 있습니다. 이 기능은 기존의 무료 Tesseract 엔진으로는 사용할 수 없습니다.
OcrInput는 스캔 품질이 좋지 않은 경우 PDF 특성을 자동으로 보정하는 기능을 제공합니다.
개발자는 PDF 전체, 선택한 페이지 또는 단일 자르기 영역을 읽도록 지정할 수 있습니다.
C#에서 PDF 파일을 OCR하는 방법
- PDF 파일을 OCR 처리하는 C# 라이브러리 다운로드
- PDF 문서를 추가하려면
AddPdf메서드를 사용하여 PDF 문서를 추가합니다 - PDF 문서의 특정 페이지를
AddPdfPages메서드를 사용하여 -
Read메서드를 사용하여 추가된 PDF에 OCR을 수행하십시오 - 'Text' 속성의 모든 QR 코드 값 보기
Barcodes속성에서 모든 QR 코드 값을 확인합니다. Text 속성에 액세스하여 OCR 결과를 가져옵니다
C# PDF OCR
많은 OCR 도구가 최적의 조건에서는 잘 작동하지만, 어떤 환경에서도 향상된 안정성과 정확성으로 작업을 수행할 수 있는 도구가 필요하다면 IronOCR 텍스트 추출 솔루션이 바로 여러분이 필요로 하는 것입니다.
텍스트 추출을 위한 IronOCR은 처음부터 새롭게 구축되었으며, 실제 이미지를 99%의 정확도로 변환할 수 있는 기능을 갖추고 있습니다.
IronTesseract는 당사의 네이티브 C# OCR 라이브러리로, 품질이 항상 좋지 않거나 때로는 기울어져 있는 실제 이미지에서 거의 사람처럼 문자를 인식할 수 있습니다.
당사의 OCR 기능을 사용하면 스캔 품질이 좋지 않은 경우 PDF 또는 이미지의 특성을 자동으로 보정할 수 있습니다.
현재 이용 가능한 최고 수준의 OCR 솔루션을 소개해 드리면, 여러분도 직접 확인하실 수 있을 것입니다.
이미지 또는 PDF OCR 텍스트 추출에 IronOCR을 선택해야 하는 이유는 무엇일까요?
Tesseract 관리를 위해 IronOCR 솔루션을 선택하는 것은 다음과 같은 고유한 기능을 고려할 때 당연한 선택입니다:
- PDF OCR 텍스트 추출 엔진인 IronOCR for .NET은 순수 .NET 환경에서 바로 사용할 수 있습니다.
- Tesseract를 컴퓨터에 설치할 필요가 없습니다.
- 최신 엔진인 Tesseract 5(Tesseract 4 및 3 포함)와 탁월한 호환성을 보여줍니다.
- 모든 .NET 프로젝트에서 사용할 수 있습니다: .NET Framework 4.5 이상, .NET Standard 2 이상, 그리고 .NET Core 2, 3 및 5!
- 다른 오픈소스 Tesseract에 비해 정확도와 속도가 향상되었습니다.
- IronOCR은 Xamarin, Mono, Azure 및 Docker 개발 플랫폼을 지원합니다.
- NuGet 패키지를 사용하여 복잡한 Tesseract 사전 시스템을 관리할 수 있습니다.
- 별도의 추가 작업 없이 PDF, MultiFrame TIFF 및 모든 주요 이미지 파일에서 텍스트를 추출할 수 있습니다.
- 품질이 낮거나 비뚤어진 이미지 스캔을 보정하여 텍스트 추출 프로젝트에서 최상의 결과를 얻을 수 있습니다.
품질이 낮은 스캔본이 있으신가요? 문제없습니다!
IronOCR은 OCR 작업에 있어 한 차원 높은 수준을 자랑합니다. 실제로 많은 유사 제품들이 기계 인쇄된 고해상도의 완벽한 텍스트나 이미지와 잘 작동하도록 제작되어, 실제 환경에서는 부정확하거나 제대로 작동하지 않는 경우가 있습니다. 그러나 IronOCR의 경우 그렇지 않습니다.
IronOCR은 불완전한 문서를 수정하는 데 탁월합니다. 이 도구는 비뚤어진 스캔 이미지를 보정하고 저화질 사진을 보정하여 검색 가능한 PDF 문서나 이미지로 만들 수 있습니다. 이것이 바로 우리 제품이 타 제품과 차별화되는 점입니다.
워크플로에 맞게 IronOCR 성능을 조정하세요
Iron Software OCR 솔루션을 사용하면 워크플로우에 적합한 균형을 맞출 수 있도록 텍스트 추출 작업의 성능을 조정할 수 있습니다. 이 점이 많은 사용자와 개발자에게 매우 중요하다는 점을 잘 알고 있으므로, 당사는 성능 조절이 가능하고 유연한 OCR 솔루션을 구축했습니다.
예를 들어, OCR 작업 속도에 영향을 미치는 매우 중요한 요소 중 하나는 입력 이미지의 품질입니다. 배경 잡음이 적고 이미지의 dpi가 높을수록(200 dpi가 적정 범위임) 처리 속도가 빨라지고 OCR 결과의 정확도도 높아집니다. 그러나 IronOCR의 성능 조정 기능을 사용하면 화질이 낮은 이미지가 포함된 작업도 신속하게 완료할 수 있습니다.
또한, JPEG와 같은 저품질 이미지 형식보다 디지털 노이즈가 적은 PNG나 TIFF와 같은 입력 이미지 또는 스캔된 텍스트 형식을 선택하면 더 빠른 결과를 얻을 수 있습니다.
IronOCR 솔루션 설치는 매우 간편합니다
Iron Software 제품군은 설치 및 실행이 매우 간편합니다. 가장 널리 사용되는 개발 플랫폼에서 사용할 수 있습니다. 당사의 솔루션은 Windows, Linux, macOS, Azure, AWS 및 Docker를 포함한 크로스 플랫폼 지원을 제공합니다. C#이 개발자들 사이에서 가장 선호되는 Tesseract OCR 엔진인 데에는 이유가 있습니다.
125개 이상의 국제 언어 지원
OCR 작업의 경우, 특정 소프트웨어가 여러 언어를 지원할 때 더욱 유용해집니다. IronOCR 솔루션은 125개 국어를 지원하므로 없어서는 안 될 필수 도구입니다. 이러한 언어는 DLL 파일로 배포되는 언어 팩을 통해 설치할 수 있습니다. 이 라이브러리는 이 웹사이트나 Visual Studio용 NuGet 패키지 관리자에서 다운로드할 수 있습니다.
OCR 언어 팩 설치 방법
120개 언어를 지원합니다. 다음 두 가지 방법으로 추가 OCR 언어 팩을 다운로드할 수 있습니다:
NuGet Install-Package
NuGet에서 IronOCR 언어를 검색하세요.
OCR 데이터 방법 사용
ocrdata 파일을 다운로드하여 .NET 프로젝트 또는 프로그램 파일에 추가하십시오.
스캔한 파일이나 이미지에서 검색 가능한 문서를 손쉽게 생성하세요
저희가 특히 자랑스럽게 생각하는 기능 중 하나는 Tesseract 소프트웨어를 통해 입력 이미지나 스캔된 PDF 파일에서 검색 가능한 PDF 문서 또는 검색 가능한 텍스트를 생성할 수 있다는 점입니다. C# 및 VB.NET 환경에서 OCR 결과를 검색 가능한 PDF 문서로 내보낼 수 있습니다. 이는 기업과 정부 기관의 데이터베이스 구축, SEO, PDF 작업에 큰 도움이 될 수 있습니다.
최고의 OCR 도구의 강력한 기능을 활용하세요
IronOCR은 이미지와 문서에서 텍스트를 추출하는 데 있어 동급 최고의 도구입니다. 이 제품은 OCR 작업을 수행할 때 간편하고 원활한 경험을 제공하는 다양한 기능, 성능 및 솔루션을 갖추고 있습니다.
당사의 OCR Tesseract C# 라이브러리를 사용하면 C# 및 .NET 애플리케이션과 같은 개발 환경에서 이미지나 스캔된 문서에서 텍스트를 추출할 수 있습니다.
IronOCR을 사용하면 암호로 보호된 PDF 문서도 손쉽게 열 수 있을 뿐만 아니라 텍스트를 원활하게 추출할 수 있습니다.
또한 다음과 같은 특징을 가지고 있습니다:
- 실행 파일이나 C# 코드는 필요하지 않습니다
- 완벽한 PDF OCR 지원
- MVC, 웹 앱, 데스크톱, 콘솔 및 서버 애플리케이션과 호환됨
- .NET Core, Standard 및 Framework에 대한 완벽한 지원
C#및VB.NET을 사용하여 읽기- QR 코드 및 BARCODE 읽기
- OCR 결과를 XHTML 또는 검색 가능한 PDF 문서로 내보냅니다
- 멀티스레딩 지원
- 이미지, 좌표, 통계, 폰트 등을 추출합니다
IronOCR을 향한 과감한 첫걸음을 내디디세요
이 놀라운 OCR 솔루션의 기능을 고려할 때, IronOCR을 사용해 보기로 결정한다면 틀림없이 만족하실 것입니다.
저희 소프트웨어를 사용하려면 클릭 몇 번이면 충분합니다. 먼저 IronOCR을 설치하세요. 설치 과정은 매우 간단합니다. 또한, 당사의 모든 도구 사용법에 대한 매우 유용하고 상세한 단계별 가이드와 사용법 문서가 마련되어 있으며, 문의 사항에 최대한 신속하게(거의 즉시) 응답하는 유능한 지원 센터도 운영하고 있습니다.
망설이지 마시고, 지금 바로 IronOCR을 선택하세요. 이는 C#에서 PDF 파일을 읽는 방법을 배우는 데 있어 첫 번째이자 가장 중요한 단계입니다.
아직도 확신이 서지 않는다면, 당사의 무료 체험 라이선스 키를 이용해 보시기 바랍니다. 이를 통해 재정적 부담 없이 최신 버전의 IronOCR이 가진 모든 잠재력을 탐색해 보실 수 있습니다. 이를 통해 귀하에게 적합한 소프트웨어 라이선스를 결정하는 데 도움이 될 수 있습니다. 확실하지 않은 부분이 있다면, 귀하의 위치와 관계없이 주저하지 말고 저희 전문가 팀에 연락처를 통해 연락해 주십시오.

