AI 프론티어, 인공지능의 시대를 맞아 대한민국의 AI 산업을 선도하는 기업들의 이야기를 다룹니다. 본 기사는 한국인공지능협회와 협력해 회원사들을 소개하고 제품 개발현황과 비즈니스 그리고 AI 이슈에 대한 인사이트를 나눕니다. |
[더테크=조재호 기자] 다양한 기술과 콘텐츠를 지닌 인공지능(AI) 기업 중 맥케이가 소개한 기술은 특별했다. AI가 생성하는 결과물에서의 사용자가 원하는 맥락을 가져갈 수 있기 때문이다.
챗GPT처럼 대화형 서비스였다면 그리 특별하지 않을 수 있었다. 그러나 이미지 분야에서 일관성을 유지할 수 있고 이를 연속으로 생성할 수 있다면 영상화의 가능성도 엿볼 수 있었다. 게다가 사용자가 원하는 부분만 수정하거나 맥락을 가져갈 수 있다는 점에서 더 흥미로웠다.
맥케이는 최근 오픈AI가 공개한 동영상 생성 AI와 같은 결을 지닌 AI 기술력을 국내 최초로 선보인 기업이다. 아울러 맥락과 연속성을 부여한 이미지 생성 AI ‘MOAI’와 안무와 모션 등의 저작물을 데이터화하는 ‘모잉’을 서비스하고 있다. 이에 더테크는 최재호 대표를 만나 이미지 및 영상 AI 기술과 최근 AI 이슈에 대해 알아봤다.
맥케이에 대해 소개를 부탁합니다.
저희는 AI를 만드는 회사입니다. 특징이라면 다른 스타트업에 비해 인공지능 분야를 연구하던 박사급 인력이 좀 많은 편이죠. 전체 인원의 30% 정도가 박사급 인력이라고 보시면 될 것 같습니다. 그러다 보니 기술 개발 중심으로 조금은 난이도가 있는 개발을 수행하고 있습니다.
일부 계약에 따라 클라이언트의 이름을 거론하기 힘들지만, 기업이 해결하기 힘들어하는 과업들을 대상으로 B2B 비즈니스를 전개하고 있습니다. 아울러 저희가 만든 생성형 AI를 접목한 B2C도 차근차근 준비하고 있습니다.
가장 먼저 최근 화제가 된 영상 생성 AI가 궁금합니다.
저희가 이미지 관련 AI 개발을 꾸준히 진행하고 있어서 가능했던 것 같습니다. 관련 AI 모델을 준비하고 있었고 지금은 사업화 단계에 다다랐거든요. 그러던 중 오픈AI의 소라가 공개됐죠. 처음에는 어떻게 만들었을까 하는 궁금증이었습니다. 저희 생각보다 빨리 나왔거든요.
이후에 미국의 리하이대학교에서 관련 논문이 나왔어요. 소라를 리버스 엔지니어링(Reverse Engineering, 역설계)적인 측면으로 해석한 내용이었습니다. 그래서 저희도 시도해봤는데, 이번에 공개한 영상이 나왔습니다.
아쉬운 부분도 있습니다만 저희는 오픈AI처럼 몇백억짜리 서버를 굴릴 수 없었습니다. 저희는 고작 PC로 만드는 수준이라 연산 과정에서 멈출 수도 있고 화질을 개선하려고 해도 제약이 많습니다. 리소스의 차이로 결과물이 달라져 아쉬움이 큽니다.
자원이 충분하다면 소라와 비슷한 수준을 기대해볼 수 있을까요? 개발 기간도 궁금합니다.
정확한 것은 테스팅을 더 해봐야겠지만 아무래도 자원의 격차는 무시할 수 없다고 봅니다. 기술적인 측면에서도 저희처럼 조그만 회사가 따라가기가 쉽진 않을 것 같습니다. 하지만 자원과 기술 측면에서 굳이 비교하자면 기술보단 자원이 부족하다고 생각합니다.
개발 기간에 대해서는 조금 애매한 부분이 있지만 3주 정도 걸린 것 같습니다. 이게 3주라는 시간이 큰 의미가 있는건 아니에요. 열흘이 걸려도 해결되지 않는 문제가 5분 만에 답이 나오기도 하거든요. 개발이라는 게 노력 대비 출력이 항상 일정하진 않습니다.
그래도 개발에 전념하는 박사급 인력이 5명이나 있다는 점이 뿌듯합니다. 어디를 가도 이런 팀이 없어요. 그래서 다른 곳보다 짧은 시간에 많은 일을 처리할 수 있었습니다.
맥케이가 영상 생성 AI를 만들 수 있었던 저변에는 생성형 AI가 만들어내는 결과값에 맥락을 유지하는 것이 중요해 보입니다. 이에 관련해 맥케이만의 노하우가 있을까요?
맥락을 유지하는 것, 개발단에서는 컨텍스트라고 하는데요. 저희만의 노하우가 있습니다. 회사가 발표한 논문에 일부 공개하기도 했고요. 이미지 생성 분야에서 논문을 발표하고 특허를 낸 자체가 자신이 있으니까 할 수 있었던 부분입니다. 물론, 정말 중요한 부분은 영업 비밀입니다.
이 컨텍스트를 유지한다는 건 다음 이미지나 영상에 나올 내용을 어떻게 입히느냐 하는 문제라고 보시면 될 것 같습니다. 너무 많이 입혀도 문제고 너무 덜 입히면 일관성이 사라지죠. 예를 들어 저희가 보여드린 이미지에서 빨간 옷을 입은 사람의 이미지로 일관성을 유지하고 있는 부분이 있습니다.
전반적인 밸런싱에 따라 결과가 달라지기 때문에 고민이 많은 부분입니다. 이미지와 영상도 다르고 분야마다 달라지거든요. 이 부분에 대해서 추가 테스트를 진행하고 후속 논문도 준비하고 있습니다.
맥케이가 맥락이 있는 결과물을 생성하는 것에 집중한 이유가 있을까요.
시장의 요구가 있기 때문입니다. 결과물의 톤앤매너를 맞출 수 없다면 무용지물이거든요. 신기한데 쓸 수 없다는 이야기를 많이 하셨어요. 사용자가 준비 중인 시놉시스나 스토리 라인을 만들려면 맥락이 이어지는 것이 중요했기 때문입니다.
예를 들어 동화에 쓸 삽화를 한 장 만드는데 특정 AI 모델에 문장을 넣으면 1장에서 8장 혹은 10장의 이미지가 출력됩니다. 그중에서 마음에 드는 걸 쓰고 다음 삽화를 만들기 위해 또 AI를 활용하면 또 다른 그림이 출력됩니다. 이 과정에서 맥락을 찾을 수 없다면 같은 행동을 반복하겠죠. 두 번째 그림을 맞추고 나면 또 세 번째에서도 비슷한 상황이 펼쳐집니다. 이 과정 굉장히 비효율적이라는 거죠.
맥락이 있는 결과물이라면 AI 관련 이슈 중 딥페이크 같은 분야에서 악용될 수도 있지 않을까요.
악용될 소지는 크죠. 저희가 이미지 생성 AI 비즈니스를 준비하면서 조금이라도 문제가 될 수 있는 단어들은 다 금지하고 생성을 막고 있습니다. 그래도 키워드를 절묘하게 집어넣다 보면 나오는 부분이 있어서 계속 관리해나갈 부분이라고 보고 있습니다.
선정성이나 혐오스러운 것 혹은 윤리적으로 문제가 될 수 있는 부분은 계속 막고 있습니다. 이 부분에서 이슈가 생기면 아무리 기술이 좋아도 그 회사는 결국 문을 닫거든요. 계속 신경을 쓰고 자정의 노력을 기울이고 있습니다.
그리고 딥페이크를 비롯해 윤리적인 이슈도 있고 관련한 방어 기술이나 예방에 대한 연구를 진행하자는 논의도 있습니다. 또 다른 방향으로는 성인 산업이나 도박 관련 부분도 있습니다. 그쪽 시장은 아무래도 굴러가는 자금의 규모가 다르니까요. 회사를 운영하는 대표나 개발자 개개인의 윤리 의식도 중요한 부분입니다.
이미지나 영상 생성 이외에도 맥케이가 보유한 기술이 궁금합니다.
저희가 다른 스타트업에 비해 전반적으로 나이가 많은 편입니다. 그러다 보니 기술적인 스펙트럼이 굉장히 넓습니다. 데이터 마이닝이나 고객 관계 관리(CRM), 빅데이터 처리라든가 보통 데이터 공학으로 소개하죠. 자연어처리(NLP)도 잘하고 있고요. 다양한 AI 제품들을 만들고 있습니다.
자체 검색 엔진도 있고 스마트폰 유저 취향 분석, AI 키오스크라든가 AI 임베디드 CCTV 같은 것도 있습니다. 이 중에서 모션 인식기술 기반 AI CCTV 솔루션은 지난해 국토부 강소기업을 만들어준 기술입니다. 저희가 기술 기반의 조직이다 보니까 영업을 하는 조직이 없었어요. 최근 이미지 생성 AI 비즈니스를 준비하면서 조금씩 보강을 해가고 있습니다.
멕케이의 AI 활용을 살펴보면 ‘움직임’과 관련된 부분이 많습니다. 자체 콘텐츠에도 모아이나 모잉이라는 이름이 Mo, Movement에 집중한 것으로 보이는데요. 특별한 이유가 있을까요?
제가 관심이 있었던 분야가 AI와 저작권이어서 그렇습니다. 모션 저작권과 관련해서 국내 브레이크 댄스가 세계 1위라고 하고 해당 분야에서 종사하는 사람들은 30대 중반만 넘어가도 먹고 살기가 막막하거든요. 그 사람들이 만든 수많은 동작이 저작권이 있는데도요. 음악이나 다른 쪽과 비교했을 때 너무 차이가 나는 거죠.
그래서 저희가 데이터를 하는 사람이니까 데이트를 모아 기준을 만들면 저작권 문제를 좀 풀어볼 수 있지 않을까 생각하고 있습니다. 아직 창작자들의 인식이나 사회적인 관심이 덜 한 부분이라서 더디긴 합니다. 개인적으로 세상이 자기 권리를 제대로 찾는 세상이 되어야 한다고 생각하기 때문에 계속 안고 가려고 합니다.
지금도 모션 쪽에 관심이 많고 AI 키오스크도 모션 관련 기술이었습니다. 관심이 있다 보니 노하우도 다른 곳보다 좀 많이 쌓였고요. 그리고 회사 이름을 지으면서 모션하고 발음이 좋은 두 글자짜리 이름을 찾다가 모잉이 되었네요.
멕케이의 비전과 전망이 궁금합니다.
비전은 좋으리라 생각합니다. AI는 제가 경험한 모든 컴퓨터 분야 중 가장 임팩트가 있는 것 같아요. 사회적으로나 문화적으로 세상 전반을 바꿀 수 있는 기술로 보입니다. 이 시대의 증기기관 같은 느낌이에요. 그리고 이 변화의 방향이 궁금하기도 하고요.
사업의 전망에 대해서도 굉장히 좋은데요. 지금 AI는 모든 산업군이 관심을 보이고 있습니다. 비즈니스 측면에 대해 조금 더 말해보자면 두 가지로 분류할 수 있는데요 API를 가져다 비즈니스로 풀어갈 회사가 있고 뒤에서 모든 기술을 가지고 올라갈 회사가 있을 것으로 보입니다.
이 중에서 두 번째인 기술 베이스의 회사가 있어야 한다고 봅니다. 저희는 엔지니어니까 자기 기술을 팔아야겠죠. 열심히 노력해서 벌어야겠죠. 그래도 전망은 나쁘지 않고 저희가 할 일은 계속 있지 싶습니다.
올해 AI 업계의 화두가 있다면 어떤 부분일까요?
비즈니스 모델이 아닐까 합니다. AI의 대표주자인 오픈AI를 보더라도 버는 만큼 손해를 보는 구조입니다. 서버 비용이 어마어마하니까요. 인프라 구축과 함께 전기세도 무시하기 힘들 것으로 보입니다. 과거 가상 화폐 채굴도 전기세가 가장 큰 문제였잖아요. AI는 채굴보다 훨씬 더 복잡합니다. 서비스를 진행하면서 개인에게 받을 수 있는 비용은 한계가 있습니다.
다른 수익 모델이 있어야 할 것이라는 게 제 판단입니다. 저희는 이걸 광고 쪽으로 보고 있어요. 제일 비슷한 산업이 검색 엔진 시장이고 구글의 수익 70%는 광고에서 나옵니다. 저희도 여러 기술을 선정해서 광고와 관련한 특허를 내고 있습니다.
기술적인 부분은 업계에 종사하고 있지만 상상하기 힘듭니다. 제 예측보다 빠르거든요. 어떤 건 6개월에서 1년씩 빠르게 등장합니다.
마지막으로 하고 싶으신 말이 있다면 자유롭게 부탁드립니다.
우리나라에도 구글 같은 회사가 있었으면 좋겠어요. 회사에서 주어진 업무를 효율적으로 하는 것을 넘어 회사 안에서 창조적인 뭔가를 할 수 있게 도와주는 역할도 할 수 있는 회사가 있었으면 좋겠습니다.
우리나라에도 그런 회사 하나쯤은 있어도 되지 않나 생각합니다. 저희도 많이 벌어서 그렇게 해보려고 합니다. 구글이나 페이스북처럼, 미국의 IT 회사처럼 멋진 직장을 만들어보려고 열심히 살고 있습니다. 쉽진 않네요. 감사합니다.