데이터브릭스, 생성형 AI 플랫폼 ‘모자이크 ML’ 인수

1조 7000억 원 규모에 인수
생성형 AI 모델에 대한 접근성 확대 기대

 

[더테크=조명의 기자] 데이터브릭스가 생성형 AI 플랫폼 모자이크ML(MosaicML)을 약 13억 달러(약 1조 7000억 원)에 인수하는데 최종 합의했다고 28일 밝혔다.

 

이번 인수를 통해 양 사는 생성형 AI 모델에 대한 접근성을 높여 모든 조직이 자체 데이터로 AI 모델을 구축, 소유 및 보호할 수 있도록 돕는다는 방침이다.

 

모자이크ML은 최첨단 대규모 언어 모델(LLM) ‘MPT-7B’로 잘 알려져 있다. MPT-7B는 공개 이후 330만 건의 다운로드를 기록할 정도로 인기를 끌었다. 최근에는 새로운 버전인 MPT-30B를 선보이며 기업들이 자체 데이터를 이용해 비용 효율적인 방식으로 AI 모델을 신속하게 구축하고 학습하도록 적극 지원하고 있다. 

 

현재 앨런 AI 연구소, 제너럴 인텔리전트, 히포크라틱 AI, 리플릿, 스캐터랩스 등이 모자이크ML의 생성형 AI 기술을 채택, 활용 중이다. 

 

테이터브릭스에 따르면, 데이터브릭스 레이크하우스 플랫폼에 모자이크ML 기술을 결합하면 비용 부담 없이 가치 있는 데이터에 대한 제어, 보안 및 소유권을 효율적으로 유지할 수 있다.

 

모자이크ML의 모델 학습 자동 최적화 기술은 표준화된 접근방식과 비교해 2배에서 7배 빠른 속도를 지원하고, 선형에 가까운 확장성을 기반으로 수십억 개의 매개변수를 가진 모델을 단 몇 시간 만에 학습시킬 수 있다.  뿐만 아니라 양사의 기술이 결합된 플랫폼은 LLM을 훈련시키고 사용하는 데 드는 비용을 대폭 줄여준다.

 

테이터브릭스는 모자이크ML의 생성형 AI 학습 기술이 적용된 데이터브릭스의 통합 데이터 및 AI 플랫폼은 높은 유연성을 제공하면서 강력하면서도 광범위한 AI 사용사례를 발굴해 낼 것이라고 설명했다.

 

이번 인수로 모자이크ML의 연구팀을 포함한 전 직원이 데이터브릭스에 합류하게 된다. 현재 가장 인기있는 고급 오픈소스 모델인 MPT-30B와 모자이크ML 제품을 구동하는 학습 알고리즘을 개발한 모자이크ML의 머신러닝(ML) 및 신경망 연구팀은 데이터브릭스에 합류 후에도 모델 학습 효율 개선을 위한 선구적인 AI 연구를 이어나갈 계획이다.

 

알리 고드시 데이터브릭스 CEO는 "기업들이 AI가 가져다주는 혜택을 온전히 누리기 위해서는 데이터에 대한 제어권을 확보해야 한다“며 ”데이터브릭스와 모자이크ML은 AI를 보편화하고, 레이크하우스를 생성형 AI 및 LLM 구축에 가장 이상적인 플랫폼으로 발전시키는데 상당한 시너지를 낼 수 있을 것”이라고 밝혔다. 



배너

배너