[더테크=조재호 기자] ICT 서비스 및 플랫폼 개발 기업 비디는 올해 초거대 AI 영역 공모를 통해 ‘초거대 AI 사전학습용 헬스케어 질의응답 데이터’구축 과제를 제안하고 사업자로 선정돼 관련 사업을 진행하고 있다고 21일 밝혔다.
이번 데이터 구축 사업은 과학기술정보통신부가 주관하고 한국지능정보사회진흥원(NIA)에서 추진하는 생성형 AI 데이터 구축 사업의 일환이다.
비디는 2020년부터 AI 학습용 데이터 구축 사업에 참여해 ‘데이터 수집·정제·가공 처리 도구’와 ‘데이터 수집 공정관리 플랫폼’에 대한 노하우를 기반으로 사업에 참여했다.
김용목 비디 전무는 “생성형 AI에 대한 기대가 큰 상황에서 회사의 확보한 ‘구문 정확성 검증 도구’와 ‘대화 데이터 정제 가공’ 솔루션을 활용해 데이터 품질을 높여 AI 모델 성능 향상에 기여할 것”이라고 밝혔다.
이번 과제에서는 데이터 구축에 필요한 ‘데이터 수집·정제·가공 처리 도구’에 초거대 AI 구축을 위한 단계별 데이터 처리 효율화 기술, 대량 데이터 분산 처리 기술 등을 적용했다.
아울러 플랫폼 구축에 오디오·프리텍스트·센싱데이터 등 다양한 데이터를 처리하는 과정에서 실시간 모니터링 및 공정 수치를 시각화해 데이터 품질을 보증했다.