더테크 (THE TECH) - 대한민국 대표 블루오션 테크 미디어

메타의 새로운 음성인식 AI 모델, 오픈 소스로 공개

[더테크=조재호 기자] 기존 음성인식 모델보다 10배 많은 언어를 지원하는 메타의 새로운 AI가 발표됐다. 메타는 언어 다양성 보존에 기여하기 위해 이번 AI 모델을 오픈 소스로 공개했다. 메타가 24일, 4000개 이상의 음성을 식별하고 1100개의 언어를 음성에서 텍스트 또는 텍스트에서 음성으로 변환하는 ‘대규모 다국어 음성인식(Massively Multilingual Speech, 이하 MMS)’ AI 모델을 오픈소스로 공개했다. MMS 프로젝트는 음성 정보에 의존하는 사람들을 비롯해 많은 사람이 더 쉽게 정보에 접근하고 언어의 다양성을 보존하는 것을 목표로 한다. 현재 전 세계에서 사용하는 언어의 수는 7000개가 넘는 것으로 알려져 있는데 기존 음성 인식 모델은 최대 100여개의 언어만을 지원해 한계가 있었다. 메타의 MMS AI 모델은 음성↔텍스트 변환이 가능한 언어를 기존 100여개에서 1107개로 10배 이상 확대했고, 음성으로 식별할 수 있는 언어의 수도 기존 대비 40배가량 늘렸다. 단순히 지원 언어의 양만 늘어난 것도 아니다. MMS를 통해 훈련된 AI 모델은 기존 변환 모델보다 우수한 성능을 자랑한다. 분석 결과에 따르면 음성 변환 언어