[더테크=전수연 기자] 국내 연구진이 오픈AI의 GPT-4V와 구글의 제미나이 프로 수준의 멀티모달 LLM을 개발했다. KAIST는 전기및전자공학부 노용만 교수 연구팀이 기업에서 비공개하고 있는 상업 모델인 LLM의 시각 성능을 뛰어넘는 공개형 멀티모달 LLM을 출시했다고 20일 밝혔다. KAIST는 텍스트뿐만 아니라 이미지 데이터 유형까지 처리할 수 있는 멀티모달 LLM이 해외 대형 기업의 풍부한 컴퓨팅 자원의 지원으로부터 인간의 뇌에 있는 신경망의 개수와 유사한 수준의 모델이 만들어지고 있으나 학계에서는 이런 개발이 쉽지 않았다고 분석했다. 이에 노용만 교수 연구팀은 단순히 모델의 크기를 키우거나 고품질의 시각적 지시 조정 데이터셋을 만들지 않고 멀티모달 LLM의 시각 성능을 획기적으로 높인 콜라보(CoLLaVO), 모아이(MoAI) 2가지 기술을 연속적으로 개발했다. 연구팀이 개발한 첫 번째 기술 콜라보는 현존하는 공개형 멀티모달 LLM이 비공개형 모델의 성능에 비해 현저하게 낮은 이유와 일차적으로 물체 수준에 대한 이미지 이해 능력이 떨어진다는 점을 우선 검증했다. 해당 능력을 효율적으로 증가시켜 시각-언어 태스크에 대한 성능을 향상하기 위해 연구팀은
[더테크=전수연 기자] 엔씨소프트(이하 엔씨)가 국내 게임사 최초로 LLM(거대언어모델)을 선보였다. '본업'인 게임 뿐만 아니라 다양한 영역에 이를 활용하고 생성형 AI분야에서 자사의 존재감을 키워나갈 것으로 보인다. 엔씨소프트는 자체 개발한 AI 언어모델 ‘VARCO(바르코) LLM’을 16일 공개했다. ‘AI를 통해 당신의 독창성을 실현하세요’((Via AI, Realize your Creativity and Originality)라는 의미를 가진 NC AI 언어모델의 통합 브랜드 명칭이다. (관련기사: 엔씨소프트, 신규 프로젝트 임박한 듯…AI로 추정) VARCO 브랜드로 운영되는 자체 언어모델의 종류는 △기초 모델(Foundation) △인스트럭션 모델(Instruction) △대화형 모델(Dialogue) △생성형 모델(Generative)로 나뉜다. 각 LLM은 매개변수(Parameter)의 규모에 따라 성능이 구분된다. 엔씨 관계자는 더테크에 “바르코는 바르코 스튜디오 플랫폼 서비스의 명칭이다. 바르코 스튜디오를 통해 게임 개발 시 콘텐츠 생성 등을 할 수 있다”며 “더불어 대화형 모델 제공과 B2B 업계 에서의 활용이 가능하다. 예를 들어 기
[더테크 뉴스] 할루시네이션(Hallucination, 거짓정보)을 줄여 더욱 정확한 답변이 가능해진 질의응답 AI챗봇이 선을 보였다. 국내 인공지능 기업 스켈터랩스는 자체 대화형 AI 기술을 대용량 언어모델과 결합해 할루시네이션을 줄인 ‘큐나(QNA)-GPT’를 출시한다고 28일 밝혔다. 큐나-GPT는 QnA 챗봇 솔루션으로, 각종 웹사이트·문서·내부 정보 등에 대해 자유롭게 질문할 수 있는 서비스다. FAQ 등 단순반복 안내 업무를 제공하는 기업이라면 어디든 활용 가능하다. 이를 통해 사용자는 필요한 정보를 빠르게 얻을 수 있다. 또 기업 내부에서 사용하는 슬랙, 인트라넷 등에도 연동할 수 있다. 스켈터랩스 관계자는 <더테크>와의 통화에서 “(큐나-GPT는) 최신 정보 기반의 데이터를 활용한다. 개발한 대화형 AI 기술 안에 답변 생성 시 지식베이스의 정보와 모순 답변 회피설계가 되어있다”고 설명했다. 이를 통해 문제됐던 챗GPT의 할루시네이션 현상을 개선하고 높은 정확도를 확보했다. 스캘터랩스는 특정 언어모델이나 버전에 국한하지 않고 고객사에 따라 모델을 선택해 활용하며 솔루션을 구축해 나갈 예정이다. 향후에는 스켈터랩스만의 자체적인 언어모델