[더테크=이지영 기자] 네이버클라우드가 자사 AI 서비스에 실시간 방송 속 화자의 음성을 추출해 바로 자막을 생성하는 기능을 공개했다.
네이버클라우드는 AI를 기반으로 음성을 텍스트로 변환하는 기업용 서비스 ‘클로바 스피치(CLOVA Speech)’에 실시간 스트리밍 기능을 출시했다고 2일 밝혔다.
클로바 스피치는 높은 수준의 한국어 인식률과 빠른 인식 속도의 STT(Speech-to-text) 서비스로 네이버 클라우드 플랫폼에서 기업용 제품으로 사용할 수 있다. 현재는 네이버 뉴스의 자동 자막 생성 기능, 네이버 쇼핑라이브, 고객센터 통화 데이터 관리 등에 적용됐다.
이번 신규 기능인 실시간 스트리밍은 라이브 방송과 같은 실시간 스트리밍 영상에서 화자가 말하는 내용을 즉시 텍스트로 추출해주는 기술이다. 또한 한국어, 영어, 일본어의 3개 국어를 지원하며 음성의 어절 단위로 텍스트가 형성된다.
네이버클라우드는 현재 생방송 실시간 자막 서비스가 속기사의 손을 거쳐 제공되고 있으나 실시간 스트리밍 기술을 활용한다면 별도의 타이핑 없이 실시간으로 자막을 송출할 수 있다고 설명했다. 또한 고객센터에서도 통화 내용을 즉각 테스트화해 모니터링할 수 있다.
이와 함께 네이버클라우드는 실시간 스트리밍 신규 출시에 맞춰 다양한 사용자 수요에 맞춘 옵션을 제공하고 서비스 요금을 인하했다. 또한 각 기능별로 선택할 수 있게 하며 영어 발음의 정확도를 판단하는 기능도 선택 옵션으로 추가했다.