푸터 콘텐츠로 바로가기
OCR 도구

Power Automate OCR (개발자 튜토리얼)

광학 문자 인식(OCR)은 이미지를 스캔하여, 스캔된 문서와 PDF에서 텍스트를 스캔하여 기계가 읽을 수 있는 텍스트로 변환하는 기술입니다. OCR은 PDF 데이터 추출을 위해 디지털화 및 자동화될 수 있는 책, 영수증, 양식 및 사진 등 다양한 형식을 컴퓨터에서 식별할 수 있도록 합니다. 이미지의 문자를 분석하고 그 패턴을 텍스트로 대응시킵니다. 이 광학 문자 인식 기술은 문서 디지털화, 자동 PDF 데이터 추출 및 입력, 송장 처리 및 스캔된 PDF를 검색 가능하게 하는 애플리케이션에 사용됩니다.

OCR은 크게 발전하여, 현재는 테이블과 열과 같은 레이아웃 이해에 복잡한 현대의 여러 언어를 인식하고 읽을 수 있습니다. 고급 OCR 기능 소프트웨어는 또한 이미지에 대한 사전 처리 기법도 사용합니다. 이에는 노이즈 제거와 대비 조정이 포함되어 있으며, 이는 저품질 이미지를 읽는 데 있어 OCR 소프트웨어의 정확성을 향상시킵니다. 가장 인기 있는 세 가지 OCR 도구는 Tesseract OCR 엔진, Power Automate 및 IronOCR이며, 높은 정확성과 유연성을 제공합니다. OCR은 문서 관리 및 텍스트 인식을 아웃소싱하기 위해 기업, 연구자 및 개발자에게 필수적인 도구가 되었습니다.

Microsoft Power Automate OCR이란 무엇인가요?

광학 문자 인식 by Microsoft Power Automate: 이 기능을 사용하면 기업이 이미지를 스캔한 문서와 PDF에서 텍스트를 쉽게 편집 가능하고 기계가 읽을 수 있는 형식으로 자동으로 추출할 수 있습니다. Microsoft Power Platform의 일부로서, Power Automate 데스크톱 및 온라인은 사용자가 필수적으로 코딩 능력 없이도 흐름을 만들 수 있게 해줍니다. 이는 반복적인 데이터 입력을 자동화하고 송장을 처리하며, OCR을 워크플로에 통합하여 문서를 디지털화할 수 있습니다.

이는 시간을 절약하고 오류를 최소화합니다. Power Automate의 OCR 기능에서 많은 다양한 형식과 언어를 지원할 수 있는 강력한 검색 도구입니다. AI Builder를 사용하여 구축되었으며, 여러 산업 분야에서 문자 인식 사용을 지원합니다. Microsoft Excel, SharePoint, OneDrive를 포함한 다른 Microsoft 서비스와 원활하게 통합되어, 문서 스캔부터 저장 또는 공유에 이르는 끝까지 자동화를 제공합니다. 이는 조직들이 효율성을 높이고, 문서 관리 과정을 간소화하며, 작업의 운영 정확성을 향상시키는 데 도움을 줍니다.

Power Automate에서 OCR을 구현함으로써 얻을 수 있는 이점

Power Automate에서 OCR을 구현함으로써 다음과 같은 이점을 얻을 수 있습니다:

시간과 노동 절약: 문서 텍스트 추출 자동화는 수동 데이터 입력에 사용될 시간을 상당히 절약합니다.

비용 효율적: 사용자 친화적이고 접근 가능하여 비싼 맞춤형 소프트웨어 솔루션의 필요성을 제거합니다.

통합: Microsoft Power Automate는 SharePoint, OneDrive, Excel 등 다른 Microsoft 365 서비스와의 원활한 통합을 제공합니다.

확장성: 한 번에 수천 개의 문서를 처리할 수 있어 대규모 비즈니스에 적합합니다.

오류 감소: 데이터 입력 과정을 자동화하면 인간 오류의 가능성을 최소화합니다.

Power Automate에서 OCR을 사용하는 방법

Power Automate는 AI Builder와 OneDrive를 포함한 여러 연결을 통해 OCR 기능을 지원합니다. Power Automate 온라인 또는 데스크톱을 사용하여 OCR 지원 워크플로우를 만드는 단계별 안내입니다:

1. Power Automate 설정

시작하려면 Power Automate 계정에 로그인하거나 계정이 없으면 가입하십시오. Power Automate는 Microsoft 365의 일부이므로 Office 365나 Dynamics 365를 사용하는 경우 이미 접근 권한을 가지고 있습니다.

2. 새 플로우 생성

생성 탭을 열고 인스턴트 플로우를 클릭하여 수동으로 시작할 수 있는 새로운 플로우를 만듭니다.

플로우에 이름을 지정합니다. 예를 들어, '승인 전'이라고 명명하고, 다음 트리거를 선택합니다: 파일이 폴더(SharePoint 또는 OneDrive)에 생성될 때 또는 수동으로 플로우를 트리거 합니다.

아래와 유사한 새로운 Power Automate 플로우가 생성됩니다.

Power Automate OCR (개발자 튜토리얼): 그림 5 - 새로운 자동화 흐름

3. OneDrive나 SharePoint에 파일 업로드

문서(이미지 또는 PDF)를 OneDrive for Business나 SharePoint에 업로드하는 작업을 추가합니다. 이 작업은 데이터를 추출하기 위한 OCR 프로세스를 트리거합니다. 이 데모에서는 SharePoint 문서 라이브러리를 사용하고 있습니다.

Power Automate OCR (개발자 튜토리얼): 그림 6 - 파일 업로드

4. AI Builder의 OCR 작업 사용

AI Builder를 활용하여 '이미지에서 텍스트 추출' 작업을 개발하십시오. AI Builder는 Power Automate 내에서 기계 학습을 깊이 통합한 기능으로, 사전 학습된 OCR 모델을 사용하여 사용자들이 쉽게 이미지나 PDF에서 텍스트를 식별할 수 있게 합니다.

Power Automate OCR (개발자 튜토리얼): 그림 7 - AI 빌더

텍스트를 추출할 이미지 파일을 선택합니다.

Power Automate OCR (개발자 튜토리얼): 그림 8 - 이미지 선택

5. 추출된 데이터 처리

OCR에 의해 텍스트가 추출되면 추가로 처리할 수 있습니다. 예를 들어:

추출된 텍스트를 Excel 형식으로 저장: '행 추가' 작업을 사용하여 추출된 텍스트를 Excel 파일에 삽입합니다.

이메일을 통해 텍스트 전송: '이메일 보내기' 작업을 사용하여 선택된 수신자들에게 추출된 텍스트를 전달합니다.

데이터베이스에 저장: 연결기를 사용하여 SQL Server, SharePoint 목록, 기타 데이터베이스로 데이터를 푸시하여 저장합니다.

IronOCR이란 무엇입니까?

IronOCR은 이미지, PDF, 스캔본에서 정확하게 OCR을 통해 텍스트를 추출할 수 있는 강력한 .NET OCR 라이브러리입니다. 다른 라이브러리들이 낮은 이미지 품질이나 노이즈 있는 이미지로 인해 텍스트 인식에서 어려움을 겪을 수 있는 경우 IronOCR는 125개 이상의 언어를 지원하여 다국어 사용 사례에 적합합니다. IronOCR에는 자동 언어 감지, 이미지 전처리, 노이즈 제거, 기울기 보정, 원래 레이아웃을 보존하면서 검색 가능한 PDF로 문서를 변환하는 등의 고급 기능이 포함되어 있습니다.

Power Automate OCR (개발자 튜토리얼): 그림 9 - IronOCR

이 제품은 간단한 .NET 프로젝트 API를 통해 쉽게 통합할 수 있으며, 개발자는 자신이 개발한 응용 프로그램에 OCR을 구현할 수 있습니다. 이 라이브러리는 특히 문서 디지털화, 데이터 입력 자동화된 워크플로우, 정확도 높은 텍스트 추출 작업 및 기업 수준 응용 프로그램을 위한 확장성을 제공합니다. 사용의 용이함과 강력한 OCR 기능이 강점입니다.

IronOCR의 특징

  • 낮은 해상도의 이미지와 노이즈가 있는 스캔 문서에서도 뛰어난 텍스트 추출 정확도를 제공합니다.
  • 다양한 언어 환경에서 사용하기 위해 자동 언어 감지를 통해 125개 이상의 언어를 지원합니다.
  • 이미지 전처리, 노이즈 감소, 기울기 보정, 대비 향상 및 선명화 도구를 제공하여 결함 있는 이미지에서 성능을 향상시킵니다.
  • 전체 텍스트 검색 가능한 PDF를 생성하여 스캔 문서나 이미지를 원래 레이아웃으로 검색 가능한 PDF로 변환합니다.
  • 레이아웃과 서식을 보존하여 표와 열이 있는 복잡한 문서의 구조, 폰트 및 서식을 유지합니다.
  • 일괄 처리: 한 번에 여러 이미지나 문서를 처리하여 대량 문서 처리를 지원합니다.
  • .NET과 간단한 통합: .NET 응용 프로그램과의 쉬운 통합을 위한 간단한 API를 지원하여 개발자가 OCR을 구현하는 데 큰 노력이 필요 없습니다.

OCR을 수행하는 샘플 코드

using IronOcr;

class Program
{
    static void Main(string[] args)
    {
        // Initialize Iron Tesseract OCR engine
        var Ocr = new IronTesseract();

        // Set language
        Ocr.Language = OcrLanguage.English;

        // Path to the image file
        var inputFile = @"path\to\your\image.png";

        // Read the image and perform OCR
        using (var Input = new OcrInput(inputFile))
        {
            // Perform OCR
            var Result = Ocr.Read(Input);

            // Display the extracted text in the console
            Console.WriteLine("Extracted Text:");
            Console.WriteLine(Result.Text);
        }
    }
}
using IronOcr;

class Program
{
    static void Main(string[] args)
    {
        // Initialize Iron Tesseract OCR engine
        var Ocr = new IronTesseract();

        // Set language
        Ocr.Language = OcrLanguage.English;

        // Path to the image file
        var inputFile = @"path\to\your\image.png";

        // Read the image and perform OCR
        using (var Input = new OcrInput(inputFile))
        {
            // Perform OCR
            var Result = Ocr.Read(Input);

            // Display the extracted text in the console
            Console.WriteLine("Extracted Text:");
            Console.WriteLine(Result.Text);
        }
    }
}
$vbLabelText   $csharpLabel

결론

IronOCR와 Power Automate OCR는 모두 텍스트 인식에 매우 강력하지만, IronOCR는 Power Automate OCR이 지원하는 간단한 사례를 넘어, 진지한 OCR 기능이 필요한 개발자나 비즈니스에 보다 강력하고 다재다능한 솔루션을 제공합니다. Power Automate의 OCR 엔진은 간단한 워크플로를 위해 설계되었으며 추가 구독이 필요할 수 있습니다.

반면에, IronOCR는 품질이 낮은 입력 이미지에서도 고품질 결과를 제공함으로써 두드러집니다. 125개 이상의 언어를 지원하고 형식과 레이아웃이 잘 보존됩니다. 복잡한 문서 처리 및 대규모 배치 작업에 대한 기능은 고급 이미지 전처리 옵션과 함께 잘 지원됩니다. .NET 애플리케이션에서 매우 사용자 정의할 수 있습니다.

Power Automate OCR는 마이크로소프트 생태계 내에서 제한적으로 자동화 또는 통합할 경우 충분하지만 IronOCR는 최대 정확도와 제어를 자랑하며, 여러 형식을 수용할 수 있는 검색 가능한 PDF 생성과 같은 기능을 지원합니다.

플랫폼 제약 없이 강력하고 사용자 정의 가능한 OCR 솔루션을 찾는 조직은 IronOCR를 권장합니다. Iron Software는 개발자에게 다양한 라이브러리 옵션을 제공합니다. 더 많은 정보를 보려면 라이브러리 스위트 페이지를 확인하세요.

칸나오팟 우돈판트
소프트웨어 엔지니어
카나팟은 소프트웨어 엔지니어가 되기 전 일본 홋카이도 대학교에서 환경 자원학 박사 학위를 취득했습니다. 학위 과정 중에는 생물생산공학과 소속 차량 로봇 연구실에서 활동하기도 했습니다. 2022년에는 C# 기술을 활용하여 Iron Software의 엔지니어링 팀에 합류했고, 현재 IronPDF 개발에 집중하고 있습니다. 카나팟은 IronPDF에 사용되는 대부분의 코드를 직접 작성하는 개발자로부터 배울 수 있다는 점에 만족하며, 동료들과의 소통을 통해 배우는 것 외에도 Iron Software에서 일하는 즐거움을 누리고 있습니다. 코딩이나 문서 작업을 하지 않을 때는 주로 PS5로 게임을 하거나 The Last of Us를 다시 시청하는 것을 즐깁니다.

Iron Support Team

We're online 24 hours, 5 days a week.
Chat
Email
Call Me