2024.11.22 (금)
T 뉴스
멀티미디어
독자 · 소통
[더테크=조재호 기자] 기존 음성인식 모델보다 10배 많은 언어를 지원하는 메타의 새로운 AI가 발표됐다. 메타는 언어 다양성 보존에 기여하기 위해 이번 AI 모델을 오픈 소스로 공개했다. 메타가 24일, 4000개 이상의 음성을 식별하고 1100개의 언어를 음성에서 텍스트 또는 텍스트에서 음성으로 변환하는 ‘대규모 다국어 음성인식(Massively Multilingual Speech, 이하 MMS)’ AI 모델을 오픈소스로 공개했다. MMS 프로젝트는 음성 정보에 의존하는 사람들을 비롯해 많은 사람이 더 쉽게 정보에 접근하고 언어의 다양성을 보존하는 것을 목표로 한다. 현재 전 세계에서 사용하는 언어의 수는 7000개가 넘는 것으로 알려져 있는데 기존 음성 인식 모델은 최대 100여개의 언어만을 지원해 한계가 있었다. 메타의 MMS AI 모델은 음성↔텍스트 변환이 가능한 언어를 기존 100여개에서 1107개로 10배 이상 확대했고, 음성으로 식별할 수 있는 언어의 수도 기존 대비 40배가량 늘렸다. 단순히 지원 언어의 양만 늘어난 것도 아니다. MMS를 통해 훈련된 AI 모델은 기존 변환 모델보다 우수한 성능을 자랑한다. 분석 결과에 따르면 음성 변환 언어
더테크는 ‘스마트 테크 전문‘ 미디어입니다. AI, 사물인터넷, 미래모빌리티 등 인더스트리 4.0 시대를 이끌어갈 딥테크 분야를 중심으로 다양한 ICT 산업컨텐츠를 제공하고 있습니다. 뉴스레터 발송을 위한 최소한의 개인정보를 수집하고 있습니다. 수집된 정보는 발송 외 다른 목적으로 이용되지 않으며 서비스 종료가 되거나 구독을 해지할 경우 즉시 파기됩니다.