복잡한 텍스트도 영상으로...오픈AI, AI모델 '소라' 공개

텍스트를 입력하면 동영상으로 만들어주는 인공지능(AI) 모델 개발
언어에 대한 깊은 이해를 갖고 있어 프롬프트 정확하게 해석 가능

 

[더테크=전수연 기자] 챗GPT의 개발사 오픈AI(OpenAI)가 프롬프트를 이해하고 해석해 캐릭터를 생성할 뿐만 아니라 텍스트로 동영상을 제작하는 ‘새로운 AI’를 선보였다.

 

오픈AI는 15일(현지시간) 텍스트를 동영상으로 만들어주는 AI 시스템을 공개했다.

 

오픈AI는 이날 블로그를 통해 해당 AI 시스템의 이름을 ‘소라(Sora)’라고 소개하며 여러 캐릭터, 특정 유형의 동작, 복잡한 장면 등 최대 1분 길이의 동영상을 빠르게 제작할 수 있다고 전했다.

 

소라는 언어에 대한 깊은 이해를 통해 프롬프트를 정확히 해석하고 생생한 감정을 표현하는 캐릭터를 생성할 수 있다. 또한 사용자가 프롬프트에서 요구한 것뿐만 아니라 프롬프트 세계 자체를 이해한다.

 

이와 함께 소라는 텍스트만으로 동영상을 생성하면서 기존의 이미지를 동영상으로 만들 수도 있다. 특히 기존 동영상을 확장하거나 누락된 프레임을 채우는 것도 가능하다.

 

실제로 오픈AI는 "스타일리한 여성이 따뜻하게 빛나는 네온사인과 움직이는 도시 간판으로 가득한 도쿄 거리를 걷고 있습니다. 그녀는 검은색 가죽 재킷, 긴 빨간색 드레스, 검은색 부츠를 착용하고 검은색 지갑을 들고 있습니다"라고 입력한 후 생성된 영상을 홈페이지에서 소개했다.

 

다만 오픈AI는 이러한 AI를 제한된 수의 창작자만 사용할 수 있도록 허용한다. 또한 소라를 회사 제품에 통합하기 전 전문가팀에 맡겨 안전성 여부를 평가한다.

 

이는 앞서 페이스북 모회사 메타, 구글, 스타트업 런어웨이 AI 등이 ‘텍스트 투 비디오(Text to Video)’ 모델을 개발한 것과 비슷한 과정으로 보인다.

 

이 외에도 IT 전문매체 디인포메이션은 오픈AI가 웹 검색 서비스를 개발하고 있다고 전했다. 소식에 따르면 오픈AI는 구글이 장악한 검색 시장에 도전할 준비를 하고 있으며 이 서비스는 마이크로소프트의 검색 엔진 빙을 기반으로 일부 구동될 것이라고 전했다.

 

다만 이 서비스가 독립적인지 챗GPT의 일부 서비스로 제공될지에 대해서는 알려지지 않은 것으로 나타났다.

 



배너

배너