[더테크=전수연 기자] 영상이해 초거대 AI 개발 기업 트웰브랩스(Twelve Labs)가 영상 언어 생성 모델을 통해 긴 영상을 분석하고 정보를 제공하는 기능을 선보였다. 트웰브랩스는 초거대 AI 영상언어 생성 모델 페가수스(Pegasus-1)를 9일 정식 공개했다. 이번에 공개된 페가수스 모델은 트웰브랩스가 자체 개발한 800억 파라미터 규모의 초거대 영상언어 생성 모델(Video Language Foundation Model)이다. 긴 영상을 마치 사람처럼 정교하게 텍스트로 요약하거나 챗GPT를 사용하듯 영상에 관한 자유로운 질의응답을 가능하게 한다. 트웰브랩스는 자체 구축한 3억 개 이상의 영상-텍스트 페어로 구성된 데이터셋 중 약 10% 규모인 3500만 개 분량을 이번 모델 개발을 위해 활용했다. 페가수스 모델은 개발자용 API 형태로 상용화돼 즉시 도입 가능하다. 나아가 최근 오픈AI가 발표한 GPT4-V에서 볼 수 있던 Text-To-Text 혹은 Image-To-Text를 넘어선 긴 영상 요약, 영상 내 주제별 챕터 및 하이라이트 기능, 질의응답 등 Video-To-Text를 가능하게 한다. 트웰브랩스 관계자는 더테크에 “예를 들어 방송에서
[더테크=전수연 기자] 트웰브랩스(Twelve Labs)가 글로벌 시장에서 초거대 AI 영상 이해 기술력을 인정받았다. 트웰브랩스는 글로벌 리서치 기업 CB인사이트가 발표한 세계 50대 생성 AI 스타트업에 국내 기업 최초로 선정됐다고 11일 밝혔다. CB인사이트는 지난 8일 독창성, 기술 참신성, 비즈니스 성과, 인재 수준, R&D 실적 등을 고려해 유망한 생성 AI 스타트업을 발표했다. 선정된 스타트업은 △오픈 AI △미드저니 △허깅페이스 △코히어 등의 인공지능 기업이다. 트웰브랩스는 영상 이해를 위한 초거대 AI 모델을 자체 개발하는 생성 AI 스타트업이다. 영상검색, 분류, 생성 등 첨단 AI 기술을 다 기업이 활용할 수 있도록 API 형태로 개발자에게 제공하고 있다. 앞서 트웰브랩스는 실리콘밸리의 인덱스벤처스 등으로부터 1700만 달러 규모의 시드투자를 유치했다. 투자 유치 이후 트웰브랩스는 오라클과 대규모 클라우드 파트너십을 통해 최신 AI 학습용 엔비디아 A100, H100 GPU를 확보했다. 이를 기반으로 트웰브랩스는 하반기에 열리는 오라클 클라우드 월드 등을 통해 영상 이해 특화 대규모 생성 AI 모델을 공개하고 신규 API 기능을 공