델타엑스의 Vision, 일상을 바꾸는 새로운 접근법

AI 프론티어 – 김수훈 델타엑스 대표 上

AI 프론티어, 인공지능의 시대를 맞아 대한민국의 AI 산업을 선도하는 기업들의 이야기를 다룹니다. 본 기사는 한국인공지능협회와 협력해 회원사들의 소개와 제품 소개, 개발현황, 비즈니스 그리고 도전과 AI 이슈에 대한 인사이트를 제공합니다.

 

[더테크=조재호 기자] 인공지능(AI)의 실체화는 로봇과 자동차 산업이 대표적이다. 챗GPT로 촉발된 생성형 AI는 기술 개발 경쟁을 넘어 서비스 보급의 단계로 차근차근 움직이고 있다. 사이버 공간의 AI를 현실 세계로 현현하는데 가장 앞선 분야는 앞서 언급한 자동차와 로보틱스 기술이 있다.

 

여기서 AI의 실체화를 돕고 세상과 소통하는 기능 중 가장 중요한 부분인 인지 솔루션이 꼽힌다. 인간의 눈을 대신하는 카메라를 통한 세계의 인식은 AI 연산의 시작이자 결과를 확인할 수 있는 핵심기술이다.

 

이에 국내 스타트업으로 컴퓨터 비전 영역을 전문적으로 연구하고 있는 델타엑스(DeltaX)의 김수훈 대표를 만나 이야기를 나눴다.

 

 

델타엑스에 대한 간략한 소개와 근황이 궁금합니다.

 

델타엑스는 카메라 컴퓨터 비전을 전문으로 연구하고 있습니다. 이제 3살이 조금 넘은 회사로 70명 정도가 근무하고 있습니다. 대부분이 연구원이며, 굉장히 다양한 국적을 지닌 사람들이 모였습니다. 절반이 외국인이고 현재 14개국 정도 되네요.

 

저희의 전문 영역은 컴퓨터 비전입니다. 컴퓨터 비전은 영상이나 이미지를 분석하고 관련한 솔루션을 개발하는 분야입니다. 그중에서도 카메라 센서를 활용한 인지 모델을 개발하고 있습니다. 솔루션은 주로 자율주행과 스마트팩토리, 홈 애플리케이션에 활용될 수 있고요.

 

주요 고객사로는 완성차 업체와 스마트팩토리 쪽이 있습니다. 대표적인 고객사로는 현대차와 기아차, 현대모비스 등 현대차그룹과 협력하고 있고 제조사에 부품을 공급하는 업체들도 저희의 협력 업체들입니다.

 

컴퓨터 비전을 전문으로 한 이유가 있을까요? 시장에서의 평가도 궁금합니다.

 

회사 창립부터 컴퓨터 비전 영역에 집중했습니다. 다만 자동차 영역에 집중한 것은 1년 정도 된 것 같네요. 올해는 자동차 업체들과 PoC(Proof of Concept, 아이디어 검증)이 늘어나면서 새로운 시나리오와 비즈니스 모델이 굉장히 많이 추가됐죠.

 

협력사도 하나의 회사지만 부서가 굉장히 다양하거든요. 바라보는 관점도 조금씩 달라요. 똑같은 카메라를 같은 위치에 장착하고 모니터링하더라도 어떤 부서는 인포테인먼트 관점으로 접근하고요.

 

다른 부서는 운전자나 승객의 자세를 중점적으로 봐요. 자율주행이 되면 예전처럼 똑바로 앉아 있는 자세에서 다른 자세로 굉장히 많이 바뀌거든요. 누워 갈 수도 있고요. 그러면 안전벨트나 에어백의 작동 하는 기준들이 다 바뀌거든요.

 

똑같은 솔루션이라고 할지라도 여러 부서에서 신경을 쓰고 있죠. 올 한해는 자동차 영역에 대한 연구 개발이 매우 많았었죠.

 

카메라를 이용한 컴퓨터 비전 기술에 집중한 이유가 있을까요?

 

카메라는 사람으로 보면 눈이라고 할 수 있는 정말 중요한 센서입니다. 가장 많은 정보를 다루고 있으니까요. 우리의 눈이 색과 형상을 구별하고 움직임을 확인하는 가장 중요한 기관임과 동시에 청각이나 후각, 미각, 촉각 등 다른 감각보다 훨씬 많은 정보를 처리합니다.

 

카메라도 똑같습니다. 눈처럼 영상을 기반으로 한 센서입니다. 어떤 측면에선 유일한 센서고요. 라이다(LiDAR, 레이저광 센서) 센서도 있지만, 작동 방식이 다르고 매우 고가입니다. 카메라는 눈과 비슷한 특성을 보이면서 가장 광범위하게 활용되는 장비입니다. 저희 손의 휴대폰을 시작으로 야외 공원이나 공장에도 다 카메라가 달려 있고 다양한 역할을 합니다.

 

산업영역에서도 가장 넓은 범위에서 활용되고 있습니다. 그만큼 혁신할 수 있는 분야도 많고 활용될 영역도 넓죠. 시장도 가장 크고요. 저희가 어떠한 혁신을 일으켰을 때 가장 파급력이 큰 분야라고 생각합니다. 할 일도 많고 또 저렴하기도 합니다.

 

카메라라는 광범위한 영역에서 어떤 혁신이 있을 수 있는지, 조금 더 자세한 설명을 부탁합니다.

 

카메라는 오랜 기간 사용된 센서입니다. 광학카메라부터 디지털카메라로 바뀌고 CCTV 전반에 걸쳐 오랫동안 이미 성숙한 산업입니다. 그래서 개발도 많이 되어 있고 가격 자체도 저렴하죠.

 

일반적이라는 이야기는 우리가 사진을 찍거나 영상을 촬영하는 통상적인 영역에 있어서는 충분하지만, 특정 영역 혹은 전문 영역에서는 부족하다는 이야기입니다. 그러니까 소수의 대체 센서들이 있고 가격이 비싼 전문 영역이 된 거죠.

 

카메라는 기본적으로 2D, 평면을 다루죠. 우리가 어떤 것을 촬영해도 저장하는 방식은 픽셀 (Pixel) 안에 가로 세로에 있는 색상 정보니까요. 결국 3D영역을 평면으로 매핑(Mapping) 하거든요.

 

하지만 이제 기술의 발달로 입체적인 콘텐츠들이 발달했어요. 3D 영화부터 VR이나 AR, XR 같은 서비스들의 확장성과 엔터테인먼트적인 요소가 많아졌는데 카메라는 그걸 할 수가 없어요.

 

그런데 카메라로 기존에 할 수 없었던 3D 역량을 갖추게 된다면 3차원 스캔이 고정밀의 측정 장비까지 없어도 우리 일상에서 활용할 수 있는 여지가 아주 많아지거든요. 그래서 우리가 정말 많이 쓰고 있는 카메라에서 기존에 할 수 없었던 영역을 혁신한다면 무언가 카메라 활용 애플리케이션의 가능성을 열어보자는 계기가 저에게 있었던 거죠.

 

델타엑스의 솔루션의 완성도가 궁금합니다. 완성도에 대해 평가해 보자면 어느 정도일까요?

 

완성도에 대한 평가에 대한 기준은 다양합니다만 특정 ROI(Region of Interest, 이미지 관심영역)에서는 라이다 대비 95%의 정확도를 달성했습니다. 이 수치도 특정 영역에 따라 조금은 달라질 수 있습니다.

 

라이다도 근·중·원거리 용도에 따라 다르고 카메라도 조금씩은 다르거든요. 모든 영역에서 다 그렇다는 것은 아닙니다. 카메라는 영상으로 정보를 얻지 못하면 거리를 잴 수 없어서 정적인 영역에서는 판단할 수가 없으니까요.

 

두 번째로는 측정 알고리즘의 영역에서 완성도인데 저희는 인풋대비 아웃풋 성능이 거의 동등한 수준으로 빠른 모델을 보유하고 있습니다. 어떤 디바이스 위에 이러한 알고리즘이 돌아가는 소프트웨어 속도도 굉장히 중요하거든요. 어떤 정보가 몇 FPS로 들어왔는데 나가는 정보가 느리면 자동차처럼 빠르게 이동하는데에 활용할 수 없으니까요.

 

대표님이 목표하신 지점이나 단계가 있을까요?

 

라이다 센서 대비 90% 이상의 정확도를 지닌 범용 알고리즘을 만드는 게 하나의 목표입니다. 아주 고정밀도 측정이 필요한 영역은 언제나 따로 존재합니다. 그런 부분은 라이다 센서가 필요할 것이고 그렇지 않은 영역, 굳이 라이다가 아니더라도 되는 영역이 많이 있다는 거죠.

 

다음으로 카메라로 들어온 영상 정보를 통해 행동을 분석하고 감정이나 의도 등을 정형화된 벡터로 잘 이해하고 이 벡터를 GPT 같은 생성형 모델에 넣어서 행동과 언어 모델이 직접 대화할 방법을 모색하고 있습니다. 행동과 언어 간 이종 대화를 포함하는 영역입니다.

 

앞서 말한 것처럼 라이다 센서 대비 95%를 넘기는 수준까지 정확도 측면에서는 순조롭게 진행 중이고 행동을 이해하는 알고리즘을 개발하고 있습니다. 사람이 눈을 통해 정보를 접하는 것과 마찬가지로 카메라가 영상을 분석해 사람처럼 이해하게 만드는 작업입니다.

 

 

지난 해 자동차 업체와 많은 협력을 진행했는데, 관련 성과가 궁금합니다.

 

저희가 진행 중인 인캐빈(In-Cabin, 차량 내부 감지) 모니터링 솔루션은 카메라 하나로 탑승자의 나이와 성별을 분류하고 감정이나 행동 등 다양한 정보를 분석합니다. 아울러 운전자의 제스처를 기반으로 차량 전체를 제어할 수 있도록 하는 모델을 개발하고 있습니다.

 

아직은 학습된 데이터를 기반으로 분류하는 수준이지만, 추후 복합적인 행동을 하더라도 인지할 수 있는 수준까지 끌어올릴 계획입니다. 가령 사람들은 다양한 행동 속에서 어떤 특정 행동이 메시지를 담고 있다고 자연스럽게 파악하는 것처럼 저희의 모델도 사람처럼 이해할 수 있는 수준까지 끌어올릴 계획입니다.

 

완성차 업체와 함께 스마트팩토리 분야에서는 어떠한 성과가 있었을까요.

 

스마트팩토리와 관련해서는 현대차그룹의 솔루션을 만들고 있습니다. 자율주행이나 자동차 관련이 아닌 제조 공장 관점에서의 솔루션입니다.

 

기존에 광학 센서 장비로 접근하던 부분을 훨씬 빠르고 저렴한 가격으로 진행할 수 있는 솔루션을 만들고 있습니다. 제조 공정에서 속도를 올려준다는 것은 전반적인 생산설비의 효율성을 올려줄 수 있다는 뜻이죠. 그리고 설비 시스템의 단가가 낮아진다는 점은 훨씬 더 많은 영역으로 수평 전개할 수 있다는 이야기입니다.

 

이외에 여러 업체와 협업해 비즈니스를 전개하고 매출을 내고 있습니다.

 

자율주행 분야에서는 모빌아이나 테슬라가 유명한데 델타엑스의 경쟁력은 무엇일까요?

 

앞선 두 회사는 정말 엄청난 기업입니다. 자본력이나 인력 구성 측면에서 비교하기 어려울 것 같아요. 저희는 카메라 인지 영역에서만 집중할 생각입니다. 두 회사가 하지 않는 새로운 혁신을 찾아내고 새로운 IP를 발굴하는 것이 저희의 역할입니다.

 

하지만 저희가 하는 영역의 도메인만 놓고 본다면 두 업체보다 더 경쟁력 있고 잘하는 기업으로 성장하겠다는 것이 목표입니다.

 

테슬라야 워낙 유명한 곳이고 모빌아이는 이스라엘의 작은 알고리즘 회사로 시작했지만, 지금은 칩도 만들고 다양한 하드웨어도 직접 만드는 규모로 성장했어요. 시총이 50조쯤 되는 것 같아요. 현대차그룹과 비슷한 규모라고 생각하시면 될 것 같습니다.

 

이런 기업이 가지고 있는 인프라는 저희가 가질 수 없는 부분입니다. 그리고 저희보다 훨씬 넓은 영역을 커버하고 있고요. 저희는 두 기업처럼 넓은 영역의 도메인을 할 생각이 없습니다. 계획도 없고요. 오히려 모빌아이나 테슬라와 협력할 수 있는 기업이 되는 것이 델타엑스의 목표라고 보실 수 있습니다.

 

델타엑스가 바라보는 AI 산업과 비전이 궁금합니다.

 

AI라는 말을 굳이 쓰지 않아도 될 만큼 자연스럽게 우리 일상에 녹아들 시대가 찾아오리라고 생각합니다. 그러면 AI가 우리에게 적대적일 것이냐 아니면 사람의 한계를 보완하는 요소로 작용할 것이냐에 대한 문제는 갑론을박이 있잖아요. 당연히 사람에게 이로운 방향으로 나아갈 수 있도록 노력할 겁니다. 그냥 가만히 있는다고 자연스럽게 갈 것 같진 않습니다. 모두가 함께 노력해야 합니다.

 

챗GPT 이후 생성형 AI가 굉장히 혁신적인 요소였다가 어느덧 좀 덤덤해졌잖아요. 그만큼 AI는 일상에 빠르게 녹아들 것입니다. 그리고 단순이 룰 베이스로 진행되던 의사결정 구조도 바뀔 것 같고요. 산업 전반을 혁신하고 있습니다.

 

그 뒷단엔 센서 인더스트리도 있구요 과거의 아날로그 디지털 센서 구조가 저희가 하고 있는 컴퓨터 비전 같은 부분으로 대체되면서 사람처럼 복합적인 이해 능력을 갖춘 센서로 바뀔 겁니다.

 

일상을 바꾸고 새로운 접근 방식을 만드는 것. 그 핵심에 컴퓨터 비전이 있다고 생각합니다. 카메라 센서의 알고리즘을 중점적으로 연구하고 솔루션을 개발하는 회사로 계속 성장할 겁니다.

 

<下편에 계속>

 

김수훈 대표는…

포항공과대학교에서 화학과 소프트웨어 공학을 전공하고 삼성전자 반도체 사업을 총괄하는 SYS LSI 사업부를 거쳐 2004년 전기자동차 및 파워팩을 전문으로 개발하는 TS㈜ 대표이사로 14년간 재직했다. 이후 한류AI센터와 RnDeep의 사장을 역임하고 2020년 컴퓨터 비전과 머신 러닝 AI 솔루션 기업 델타엑스를 창업해 대표로 취임했다.
 

델타엑스는 2020년 중소벤처기업부의 인공지능 챔피언십 대회를 계기로 창업해 우승을 차지하며 장관상을 수상한 것을 시작으로  2021년  ICCV 국제컴퓨터비전학회 'Instance Segmentation' 세계 1위,  2022년 현대자동차 · 기아 '오픈 이노베이션 라운지' 최종 기업 선정, 2023년 한국인공지능협회 회장상 AI Technology·Investment Award를 수상한 바 있다.


관련기사

18건의 관련기사 더보기

배너

배너