미디어젠, 정부 주도 AI 모델 데이터 구축 사업 선정

미디어젠, 공공위한 ‘헬스케어’ 분야 초거대 AI 구축 나서
NIA의 ‘AI-Hub’ 통해 모든 데이터 일반에 공개될 예정

 

[더테크=조재호 기자] 미디어젠이 정부의 헬스케어 분야 초거대 AI 모델을 위한 데이터 구축 사업을 수주했다. 사업이 완료되면 이를 기반으로 한 챗봇을 통해 다양한 건강관련 정보를 얻을 수 있을 것으로 보인다.

 

미디어젠 컨소시엄은 29일, 과학기술정보통신부가 주관하고 한국지능정보사회진흥원(NIA)이 추진하는 ‘2023년도 인공지능 학습용 데이터 구축 사업’의 초거대 AI 모델을 위한 학습용 데이터 구축 사업자로 최종 선정됐다.

 

이번 사업은 헬스케어 분야의 약 2억 어절 이상인 초거대 규모 생성형 AI 챗봇의 질의응답 데이터를 구축한다. AI 최신 기술 중 하나인 거대 언어 모델(LLM) 및 응용 서비스 개발을 위한 말뭉치 데이터를 구축하는 것으로 실제 일반인과 의료진의 질의응답과 전문 의료 서적, 증강 데이터 등으로 구성된다.

 

송민규 미디어젠 상무는 “생성형 AI 챗봇에 대한 일반의 기대가 매우 큰 상황에서 초거대 AI 모델을 위한 대규모 데이터 구축 사업자로 선정된 것에 대해 기쁘게 생각한다”며 “실생활에 도움을 줄 수 있는 헬스케어 분야에서 AI 데이터의 환각(Hallucination) 현상을 최소화하기 위한 노력을 아끼지 않을 예정”이라고 밝혔다.

 

컨소시엄 구성을 살펴보면 미드어젠과 메트릭스, 비디, 위뉴, 메인 등 5개 업체가 참여했다. 주관기업인 미디어젠은 초거대 AI 모델을 개발하고 학습용 데이터의 구축 설계 및 품질 관리 전반을 관장한다.

 

클라우드 워커 플랫폼 운용사인 메트릭스와 AI 소프트웨어 플랫폼 기업인 비디는 다년간 데이터 사업에 참여해 양질의 데이터를 구축한 경험을 보유하고 있다. 의료 전문 기업인 위뉴와 메인은 최근 생성형 AI의 약점으로 불리는 환각 효과를 최소화하기 위해 실제 의료진 데이터의 수집 및 검수 역할을 담당할 예정이다.

 

데이터 구축 사업으로 초거대 AI 훈련용 데이터가 구축되면 생성형 AI 모델 기반 챗봇을 통해 헬스케어 분야에 지식 정보를 얻을 수 있다. 아울러 의료진이 직접 작성한 데이터를 활용한 질의응답은 AI의 불확실성을 최소화할 수 있을 것으로 기대한다.

 

한편, 데이터 구축은 올해 연말까지 진행되고 구축이 완료된 후에는 NIA에서 운영하는 ‘AI-Hub’를 통해 모든 데이터가 일반에 공개될 예정이다.


관련기사

33건의 관련기사 더보기

배너