[더테크=조재호 기자] 생성형 인공지능(AI)의 선두주자 오픈AI가 신규 AI 모델을 선보였다. 사람처럼 보고 듣고 말하며 실시간 대화까지 할 수 있을 정도로 빠른 답변을 제공한다. 이번 신규 모델 공개는 경쟁사인 구글의 I/O를 하루 앞두고 진행됐는데, 멀티모달(Multi Modal)을 본격적으로 지원하는 모델이라는 점에서 큰 이슈가 될 전망이다.
오픈AI가 현지시각 13일 ‘스프링 업데이트’ 행사를 진행했다. 온라인으로 진행된 이번 행사에서는 최신 AI 모델 ‘GPT-4o’를 공개하고 시연했다. 챗GPT에 더 많은 도구와 언어를 지원한다,
GPT-4o의 o는 모든 것을 뜻하는 라틴어 접두사 Omni(옴니)를 의미한다. 텍스트 기반의 대화 방식에서 한단계 더 진화했다는 의미다. GPT-4o는 사용자와 실시간으로 대화할 수 있으며 텍스트와 시각, 청각 데이터를 종합해 분석하고 처리할 수 있는 모델이다.
일반적인 텍스트로 파악하기 힘든 사용자의 말투나 억양을 파악한다거나 수학 문제를 보고 풀이하는 등의 기능을 선보였다. 오픈AI는 GPT-4o가 기존 GPT-4 Turbo 보다 빠른 답변 속도를 지녔으며 비용은 절반 수준이라고 설명했다. 지난해 11월 GPT-4 Turbo를 공개하고 반년 만에 한 단계 더 나아간 것이다.
미라 무라티 오픈AI CTO는 “GPT-4o는 GPT-4의 성능을 더욱 빠르게 구현하는 것에 집중한 모델”이라며 “텍스트, 시각, 청각 데이터를 종합적으로 분석하고 처리할 수 있다”고 설명했다.
이날 시연에서는 스마트폰으로 “발표에 앞서 긴장되는데 어떻게 해야 할까”라는 질문에 “깊이 심호흡을 하면 도움이 될 것”이라고 답했다. 이 개발자가 숨을 거칠게 몰아쉬자 GPT는 “그런 방식으로 숨을 쉬는 것은 도움이 되지 않는다”며 “천천히 숨을 내쉬어야 한다”고 추가 답변을 제시했다.
다른 개발자는 잠에 쉽게 들지 못하는 친구를 위해 잠자리 이야기를 들려달라고 말했는데, 이에 대해 GPT는 다양한 톤의 목소리로 이야기를 들려줬다. 또 다른 활용 사례로는 종이에 적힌 수학 문제를 시각 기능을 활용해 풀이하는 모습을 소개했다.
이번 행사에서 GPT-4o는 대부분 스마트폰을 활용해 시연됐다. 경량화나 사용성 강화 그리고 온디바이스 AI 등 사용성에 신경을 쓴 부분으로 보인다.
실시간 통역도 눈에 띄는 부분인데 무라티 CTO가 이탈리아어로 이야기한 것을 다른 개발자가 영어로 답하는 등의 활용법을 선보였다. 오픈AI에 따르면 GPT-4o의 평균 응답 시간은 최소 232ms, 평균 320ms로 사람의 반응 시간과 비슷한 수준이다.
이번 행사에 대해 샘 알트만 CEO는 블로그와 X(트위터)를 통해 두 가지 사항을 강조했다. 첫 번째로는 오픈AI가 개발한 AI 모델을 무료 혹은 저렴한 가격으로 제공한다는 점이고, 두 번째로는 이번 모델이 최고의 AI 모델이자 인간처럼 답하고 표현하는 방법을 갖췄다는 내용이다.
아울러 X에서 her를 언급했는데, 지난 2013년 개봉한 AI와 관련한 SF 멜로 영화로 개인화된 미래 LA에서 인공지능과 사랑에 빠진 남자의 이야기를 그렸다. 해당 영화의 배경은 2025년인데 이보다 1년 앞선 시점에서 사람처럼 대화할 수 있는 AI를 개발했다는 점을 강조한 것으로 해석된다.
이번 행사에서 공개된 GPT-4o는 바로 사용할 수 있다. AI 음성 관련 업데이트도 조만간 진행될 예정이다. 이번 AI 모델의 출시로 다시 한번 AI 모델 경쟁이 시작될 전망이다. 최근 구글과 앤트로픽, 코히어, 구글 등이 기존 GPT-4와 어깨를 나란히 할 모델을 출시했는데, 다시 한번 격차를 벌린 것으로 보이기 때문이다.
아울러 한국시간 기준 15일 오전 2시로 예고된 구글의 연례 개발자 회의인 구글I/O에 앞서 오픈AI가 기선제압에 성공했다는 평가도 나온다. 그만큼 기습적으로 발표된 신규 모델과 함께 이슈몰이에도 성공한 것으로 보인다.
구글I/O를 통해 공개될 내용에 대해서는 대해서 구체적으로 알려지지 않았지만, 자사의 AI 모델인 제미나이 업그레이드 및 온디바이스 AI 내용이 담겨있을 것으로 예상된다. 이외에도 다음달 WWDC에서 AI 전략을 발표할 것으로 알려진 애플에 대해서도 사람들의 관심이 다시 한번 집중될 것으로 보인다.