[더테크=조재호 기자] 미디어젠 컨소시엄이 헬스케어 AI 구축을 위한 질의응답 데이터가 성능 검증을 통과했다. 수집된 데이터는 올해 상반기 한국지능정보사회진흥원이 운영하는 AI-Hub를 통해 일반에 공개될 예정이다. 미디어젠 컨소시엄은 초거대 AI 모델을 위한 인공지능 데이터 사업에서 구축된 데이터를 활용해 제작한 초거대 언어 모델(LLM)이 TTA 성능검증을 통과했다고 17일 밝혔다. 이번 사업은 AI 최신 기술인 초거대 AI 언어 모델 및 응용 서비스 개발에 필수적인 대량의 말뭉치 데이터를 구축하는 것으로 일반인과 의료진의 질의응답 데이터와 전문 의료 서적 데이터, 증강 데이터 등으로 구성됐다. 미디어젠 컨소시엄은 과학기술정보통신부가 주관하고 한국지능정보사회진흥원(NIA)이 추진하는 2023년도 인공지능 학습용 데이터 구축 사업의 LLM을 위한 학습용 데이터 구축 사업자로 최종 선정됐고 약 2억 어절의 헬스케어 분야 생성형 AI 챗봇 질의응답 데이터를 구축했다. 미디어젠 컨소시엄은 메트릭스, 비디, 위뉴, 메인 등 5개 전문 기업이 뭉쳐 데이터를 구축했다. 구축된 데이터는 통계적 다양성, 구문 정확성, 의미 정확성, 유사성 등에 대해 진행된 TTA 정밀
[더테크=전수연 기자] 음성 AI 기업 미디어젠이 구글이 개발한 E2E(기업들의 웹 사이트 간에 행해지는 정보나 거래의 교환) 음성인식 시스템인 ‘컨포머(Comformer)’를 벤치마킹해 기존 컨포머의 성능을 유지하면서 처리 속도를 약 40% 향상시킬 수 있는 기능을 선보인다. 미디어젠은 새로운 컨볼루션 네트워크 구조가 증강된 트랜스포머 기반 음성인식 시스템을 개발했다고 26일 밝혔다. 이번 기술 개발은 한국전자통신연구원(ETRI)의 연구인력 현장지원 프로그램을 통해 이뤄졌다. LJSpeech 데이터셋을 이용한 음성인식 실험결과 구글의 컨포머는 CER 4.8%, WER 19.6%의 성능을 보였고 미디어젠의 음성인식 시스템은 CER 4.8%, WER 19.2%의 성능을 보였다. 미디어젠은 이를 바탕으로 자사 시스템이 구글 컨포머 수준의 음성인식 성능을 유지하며 처리속도는 컨포머 서브샘플링 40ms 대비 80ms로 향상됐음을 확인할 수 있었다. 이와 함께 베이스라인이 되는 트랜스포머 기반 음성인식 시스템은 CER 6.9%, WER 23%의 인식 성능을 나타냈다. 본 실험은 순수 신경망의 성능을 평가하기 위해 빔서치 등의 백엔드 처리를 수행하지 않고 아웃풋 노드의
[더테크=이지영 기자] 미디어젠과 부산외국어대학교가 AI 플랫폼 사업을 통한 맞춤형 교육 커리큘럼 구성을 진행한다. 아울러 첨단 AI 기술 확장을 위해 협력한다. 미디어젠이 부산외대와 AI 에듀테크 기술의 공교육 적용 및 시민 교육으로의 확장을 위한 양해각서를 체결했다고 27일 밝혔다. 이번 업무협약은 △AI 에듀테크 기술의 교육 환경 적용 △AI 기반 커리큘럼 및 교육 솔루션 공동 개발 △재학생 등의 실무 경험을 위한 협력 △평생 교육 AI 기술 확장 등을 골자로 한다. 고훈 미디어젠 대표이사는 “부산외국어대학교는 최신 AI 기술을 실제 교육에 접목하고자 하는 의지가 강하다”며 “신속하고 발전적인 행보가 부산 지역의 전체 AI 기술 활용에 크게 기여할 것으로 기대된다”고 밝혔다. 미디어젠과 부산외대는 대학에서 자체 생산한 교육 콘텐츠를 AI 기술과 접목해 독창적인 교육 커리큘럼을 구성하며, 이를 시민 평생교육에도 적용할 수 있는 기반을 마련할 예정이다. 한편, 부산외대는 이번 업무협약을 통해 내년 신학기부터 AI 기술에 대해 이론과 실무를 경험할 수 있는 마이크로 전공 개설을 검토하고 있다. 미디어젠은 음성인식, 음성합성, 거대언어모델(LLM), AI 학습
[더테크=조재호 기자] 미디어젠이 정부의 헬스케어 분야 초거대 AI 모델을 위한 데이터 구축 사업을 수주했다. 사업이 완료되면 이를 기반으로 한 챗봇을 통해 다양한 건강관련 정보를 얻을 수 있을 것으로 보인다. 미디어젠 컨소시엄은 29일, 과학기술정보통신부가 주관하고 한국지능정보사회진흥원(NIA)이 추진하는 ‘2023년도 인공지능 학습용 데이터 구축 사업’의 초거대 AI 모델을 위한 학습용 데이터 구축 사업자로 최종 선정됐다. 이번 사업은 헬스케어 분야의 약 2억 어절 이상인 초거대 규모 생성형 AI 챗봇의 질의응답 데이터를 구축한다. AI 최신 기술 중 하나인 거대 언어 모델(LLM) 및 응용 서비스 개발을 위한 말뭉치 데이터를 구축하는 것으로 실제 일반인과 의료진의 질의응답과 전문 의료 서적, 증강 데이터 등으로 구성된다. 송민규 미디어젠 상무는 “생성형 AI 챗봇에 대한 일반의 기대가 매우 큰 상황에서 초거대 AI 모델을 위한 대규모 데이터 구축 사업자로 선정된 것에 대해 기쁘게 생각한다”며 “실생활에 도움을 줄 수 있는 헬스케어 분야에서 AI 데이터의 환각(Hallucination) 현상을 최소화하기 위한 노력을 아끼지 않을 예정”이라고 밝혔다. 컨소
[더테크=전수연 기자] 음성 AI 기반 기술 기업 미디어젠은 19일 개최되는 헝가리 부다페스트 세계육상선수권 대회에 한국어 음성합성(TTS) 기술을 공급한다고 18일 밝혔다. 세계육상선수권대회는 중국의 인공지능(AI) 대표 기업 iFLYTEK이 다국어 AI 기술 제공사로 후원하며 한국어 음성 합성 엔진은 미디어젠에서 공급한다. 2023 세계육상선수권대회는 미디어젠 솔루션을 활용한 디지털 휴먼을 통해 장내 안내, 홍보, 서비스 등이 제공되며 일반 남녀, 아동 등 다양한 음성과 감정 상태에 따른 음성 출력이 이뤄진다. 미디어젠은 iFLYTEK 글로벌 서비스 플랫폼에 AI 솔루션을 탑재해 공동 판매를 준비 중이며 대회 이후 글로벌 진출을 목표로 하고 있다. 현재 미디어젠은 초거대 AI 사전 학습을 위한 데이터 구축 및 AI 엔진 알고리즘 원천 기술을 보유하고 있다. 이를 바탕으로 스마트카, 스마트 컨택센터, AI 에듀테크, AI 키오스크 등 여러 부문에서 사업화를 진행하고 있다. 아울러 미디어젠은 iFLYTEK과 올 3월 AI 기술 제휴 및 글로벌 AI 공동사업을 위한 업무협약을 체결했으며 국내 시장과 해외 진출을 위한 신사업 협력 관계를 유지할 계획이다.