검색
회원가입로그인

한국딥러닝의 혁신적 VLM 기반 OCR 기술: 인공지능으로 업무 효율성 극대화 및 수익 증대

요약
  • 한국딥러닝은 김지현 대표의 리더십 아래 시각언어모델 기반 OCR 기술로 국내 시장에서 성공적으로 자리잡고 있다.
  • '쓰리 제로 OCR' 슬로건을 앞세워 기업의 비용 절감과 효율성을 증대시키며, VLM OCR 기술을 LLM과 결합하여 기능을 확장할 계획이다.
  • 한국딥러닝은 B2B 및 B2G 시장에서 누적 매출 100억 원을 돌파했으며, 해외 진출도 모색 중이다.

김지현 한국딥러닝 대표는 비전 광학 문자 인식(OCR) 기술을 단순한 문자 판독을 넘어 실질적인 수익 창출이 가능한 핵심 인공지능(AI) 기술로 강조한다. 2019년 설립된 한국딥러닝은 김지현 대표의 리더십 아래 AI 스타트업으로는 이례적으로 꾸준한 흑자를 기록하며 성장하고 있으며, 특히 시각언어모델(VLM) 기반 OCR 기술을 국내에서 선도적으로 선보였다. 김 대표는 OCR 기술이 기업의 인건비를 절감하고 비용 효율성을 직관적으로 향상시키는 가장 확실한 AI 도입 방식이라고 설명하며, 이것이 한국딥러닝이 OCR에 집중하는 이유라고 밝혔다. 한국딥러닝의 OCR 기술은 '제로 라벨링', '제로 디플로이 타임', '제로 프리 트레이닝'을 특징으로 하는 '쓰리 제로 OCR' 슬로건으로 대표되며, 4억 장 이상의 방대한 데이터 학습과 독자적인 VLM 기술을 통해 높은 정확도와 빠른 구축 속도(약 2주)를 구현했다. 이러한 기술력과 사업성을 바탕으로 한국딥러닝은 B2B 및 B2G 시장에서 성공적으로 안착하여 누적 매출 100억 원을 돌파했으며, 향후 VLM OCR을 대형언어모델(LLM)과 결합하여 실시간 이해 및 검색 기능까지 확장할 계획이다.

한국딥러닝과 김지현 대표: 젊은 리더십과 기술 혁신

한국딥러닝(Korea Deep Learning Inc.)은 2019년 5월, 당시 22세였던 김지현 대표에 의해 설립된 인공지능(AI) 전문 기업이다. 김지현 대표는 컴퓨터와 코딩 관련 서적이 가득한 환경에서 성장하여 자연스럽게 기술과 창업에 관심을 두게 되었으며, 이는 '코딩수저'라는 별칭으로 이어졌다. 대학 시절 예술학과 소프트웨어학을 동시에 전공하는 독특한 이력을 쌓았고, 이러한 융합적 배경은 이후 한국딥러닝의 기술 개발과 사업 전략에 영향을 미쳤다.

김지현 대표 (사진=한국딥러닝)<span class="footnote-wrapper">[9]</span>

김지현 대표 (사진=한국딥러닝)

설립 초기 기술보증기금과 창업진흥원의 기술혁신형 기업 선정, 청년창업사관학교 10기 최연소 대표(당시 만 23세) 등의 이력을 통해 주목받기 시작했다. 김 대표는 2022년 대한민국 인재상 100인에 선정되었으며, 2021년에는 대한민국 임팩테크 대상을 역대 최연소 대표 수상자로서 수상하며 기술력을 인정받았다. 또한 국내 최대 스타트업 행사인 IF 페스티벌 데모데이에서 대상을 수상하며 금융위원장상을 받기도 했다. 이러한 성과는 김 대표의 명확한 경영 철학, 즉 '시간을 아끼기 위한 효율적인 방법 모색', '멀리 보려는 노력과 냉철한 판단, 빠른 실행'에 기반한다.

한국딥러닝은 설립 이후 꾸준히 흑자를 기록하며 AI 스타트업으로서 주목할 만한 재무적 성과를 보여주고 있다. 이는 김 대표가 강조하는 '투자나 미래 성장성에만 의존하지 않는 마인드'와 직결된다. 회사는 현재 20~30명 이상의 AI 전문가를 보유하고 있으며, 서울 서초구와 판교에 사무실을 두고 있다. B2B(기업 간 거래)와 B2G(기업-정부 간 거래) 비즈니스를 중심으로 사업을 전개하며, 2024년에는 누적 매출 100억 원을 돌파하는 성과를 거두었다. 회사는 AI, 머신러닝, 딥러닝 솔루션 개발을 통해 사회 문제를 해결하는 것을 목표로 하며, 특히 비전 AI 분야에 강점을 보인다.

비전 OCR: '돈 버는 AI'로서의 사업성과 효율성

김지현 대표는 다양한 AI 기술 중에서도 광학 문자 인식(OCR) 기술이 가장 빠르게 성과를 낼 수 있으며, 실질적으로 '돈을 버는 AI'라고 강조한다. 그 이유는 OCR 기술이 기업의 운영 효율성을 직접적으로 개선하고 비용 절감 효과를 명확하게 보여주기 때문이다. 기업이 AI를 도입하는 과정은 복잡하고 어려울 수 있지만, OCR은 인건비를 확실하게 줄이고 비용 효율을 직관적으로 향상시키는 명확한 가치를 제공한다. 이는 수동 데이터 입력과 같은 반복적이고 오류 발생 가능성이 높은 작업을 자동화함으로써 달성된다.

OCR 기술은 이미지나 스캔 문서에서 텍스트를 추출하여 디지털 데이터로 변환하는 기본 기술이다. 이 디지털화된 텍스트는 검색, 분석, 처리가 용이해져 다양한 비즈니스 프로세스를 혁신할 수 있다. 예를 들어, 금융 기관에서는 청구서나 계약서 처리 자동화, 공공 기관에서는 공문서 디지털화 및 관리, 물류 회사에서는 송장 정보 자동 추출, 제조업에서는 제품 라벨 인식 등에 OCR을 활용하여 업무 속도를 높이고 오류를 줄인다.

한국딥러닝의 고객사 사례는 OCR의 이러한 경제적 효과를 명확히 보여준다. 한 기업은 매일 40여 종의 다양한 문서 처리에 어려움을 겪고 있었으나, 한국딥러닝의 VLM OCR 솔루션을 도입한 후 문서 한 건당 인식 및 처리 시간을 기존 10분에서 1분으로 단축했다. 이는 90% 이상의 시간 단축에 해당하며, 결과적으로 해당 기업은 연간 17억 원의 비용을 절감할 수 있었다. 이처럼 OCR은 단순히 기술적 가능성을 넘어, 실제 비즈니스 현장에서 측정 가능한 ROI(투자수익률)를 제공하는 실용적인 AI 솔루션임을 입증하고 있다. 문서 디지털화가 가속화되면서 OCR의 역할과 중요성은 더욱 커질 것으로 예상되며, 이는 OCR 시장의 성장 잠재력이 무궁무진함을 시사한다.

한국딥러닝의 핵심 기술: VLM 기반 '딥 OCR+'와 '쓰리 제로'

한국딥러닝의 OCR 기술 경쟁력은 시각언어모델(Vision Language Model, VLM)에 기반한 독자적인 솔루션 '딥 OCR+'에서 나온다. VLM은 텍스트뿐만 아니라 이미지의 시각적 정보까지 함께 이해하고 처리하는 차세대 AI 모델로, 한국딥러닝은 이를 OCR 기술에 국내에서 가장 먼저 적용한 기업 중 하나이다. '딥 OCR+'는 기존 OCR의 한계를 넘어 문서의 의미와 구조를 자동으로 분석하고 핵심 정보를 추출하도록 설계되었다.

한국딥러닝 AI OCR 설명 이미지<span class="footnote-wrapper">[61]</span>

한국딥러닝 AI OCR 설명 이미지

기존 OCR 솔루션은 주로 정형화된 문서나 이미지에서 텍스트를 추출하는 데 중점을 두어, 표, 조항, 문단 등 복잡한 구조나 비정형 문서(예: 계약서, 손글씨 메모, 특정 포맷 없는 청구서) 처리에는 제약이 있었다. 이러한 문서를 처리하기 위해서는 문서마다 별도의 데이터 라벨링, 모델 설계, 사전 훈련 과정이 필요했으며, 이는 도입 및 유지보수 비용 증가로 이어졌다.

하지만 한국딥러닝의 VLM 기반 '딥 OCR+'는 이러한 문제를 해결한다. VLM은 '글씨를 보고, 의미를 이해하는' 구조를 가지므로, 특정 포맷에 의존하지 않고도 문서의 전체 구조와 맥락을 파악할 수 있다. 예를 들어, 손글씨로 휘갈겨 쓰거나 '롯데백화점 김포'를 '롯백 김포'와 같이 줄임말로 쓴 경우에도, VLM은 단순히 문자 모양만 인식하는 것이 아니라 의미 기반 추론을 통해 '롯백'이 '롯데백화점'을 의미한다는 것을 이해하고 정확하게 처리할 수 있다. 이는 한국딥러닝이 우편물 수기 송장 인식 프로젝트처럼 극악의 난이도를 가진 실제 과제를 성공적으로 수행할 수 있었던 배경이다.

이러한 기술적 우위는 '쓰리 제로(Three Zero) OCR'이라는 슬로건에 집약되어 있다:

  • 제로 라벨링(Zero Labeling): 별도의 데이터 라벨링 작업 없이 다양한 문서 유형 즉시 처리 가능.

  • 제로 디플로이 타임(Zero Deploy Time): 모델 구축 및 배포 시간 최소화 (평균 2주 내외).

  • 제로 프리 트레이닝(Zero Pre-training): 광범위한 사전 훈련 데이터(4억 장 이상)를 기반으로 추가 학습 없이 높은 정확도 보장.

이 '쓰리 제로'는 한국딥러닝이 지난 5년간 확보한 4억 장 이상의 방대한 학습 데이터와 문서에 최적화된 자체 개발 프론티어 모델 '딥 이미지(Deep Image)', 그리고 고성능 데이터 운영(DataOps) 시스템을 통해 가능하다. 또한, 기술 이해도가 높은 석박사급 '테크니컬 PM' 인력이 고객사와 직접 소통하며 기술 도입을 지원하는 체계도 빠른 구축을 가능하게 한다. 딥러닝 기반 2단계 CNN 아키텍처와 Transformer 기반 아키텍처를 결합하여 99% 이상의 정확도0.2초 이내의 빠른 추론 속도를 구현했다고 주장한다. 이러한 기술력은 한국딥러닝이 OCR 블라인드 테스트 등 공급기업 선정 과정에서 가장 많이 선택받는 이유라고 김 대표는 설명한다.

시장 경쟁 환경과 한국딥러닝의 미래 전망

OCR 시장은 기술 발전과 디지털 전환 가속화에 따라 수요가 급증하고 있으며, 이에 따라 경쟁 또한 치열해지고 있다. Google Cloud Vision AI, Microsoft Azure AI Vision, AWS Textract, 네이버 Clova OCR, 카카오, Abbyy, Mindee 등 국내외 다수의 기업들이 OCR 솔루션을 제공하며 경쟁하고 있다. 이들 솔루션은 클라우드 기반의 강력한 API, 다양한 기능(이미지 분석, 얼굴 인식 등)을 제공하지만, 때로는 비정형 데이터 처리나 특정 언어(특히 한국어) 인식 정확도, 보안, 커스터마이징 유연성 등에서 한계를 보이기도 한다.

이러한 경쟁 환경 속에서 한국딥러닝은 VLM 기반의 차별화된 기술력'쓰리 제로 OCR'로 대표되는 사용 편의성을 강점으로 내세운다. 특히, 의미 기반 추론 능력, 비정형 문서 처리 능력, 제로 라벨링/프리 트레이닝 접근 방식은 기존 OCR 솔루션과의 명확한 차별점이다. 또한, 고객의 보안 요구사항에 맞춰 온프레미스(On-premise) 구축을 지원하여 민감 데이터의 외부 유출 우려를 해소하는 점도 금융, 공공기관 등 보안이 중요한 고객에게 매력적인 요소이다. 문서의 맥락과 레이아웃을 이해하여 필요한 정보만 정확히 추출하는 키-밸류(Key-Value) 추출 기능 역시 높은 평가를 받는다.

한국딥러닝은 이미 국내 다수의 IT 대기업을 고객사로 확보하며 기술력을 입증했으며, 누적 매출 100억 원 돌파는 이러한 성공을 방증한다. 김지현 대표는 2025년을 터닝포인트이자 가장 중요한 시기로 보고 있으며, 최고 실적 달성과 함께 투자 라운드 오픈을 계획하고 있다고 밝혔다.

향후 기술 개발 방향은 VLM OCR을 LLM(대형언어모델)과 결합하여 기능을 더욱 고도화하는 데 초점을 맞추고 있다. 이를 통해 단순 텍스트 추출 및 이해를 넘어 실시간 문서 검색 및 질의응답까지 지원하는 것을 목표로 한다. 이미 대형 물류 및 IT 기업 3곳과 관련 기술 실증(PoC)을 진행 중이며, 기술은 완성 단계에 있어 조만간 정식 공개될 예정이다. 또한, OCR 기술 외에도 이미지 분석, 3D 모델 생성 등 다양한 비전 AI 솔루션을 기반으로 인도네시아 건설사와의 협력 등 해외 시장 진출도 모색하고 있다. OCR을 단순히 문서를 인식하는 기술이 아닌, 기업의 업무 자동화 워크플로우 핵심 요소로 만들겠다는 비전을 가지고 있다.

공유하기
카카오로 공유하기
페이스북 공유하기
트위터로 공유하기
url 복사하기
조회수 : 117
heart