구글, 제미나이 기반 sLLM ‘젬마’ 공개

2024.02.22 11:00:44

인공지능 개발자와 연구자를 위한 오픈소스 모델 공개
매개변수 2B, 7B 두 가지 유형으로 라마-2 넘어서는 벤치마크 기록

 

[더테크=조재호 기자] 구글이 인공지능(AI) 개발자와 연구자를 위한 소형 AI 모델을 오픈소스로 공개했다.

 

구글은 21일(현지시간) 자사의 신규 AI 모델 ‘Gemma(젬마)’를 공개했다. 젬마는 구글의 AI 모델 제미나이 기반의 경량화 sLLM(smaller Large Language Model, 소형 언어 모델)이다. ‘보석’을 뜻하는 라틴어 ‘gemma’에서 영감을 받은 이름이다.

 

젬마는 매개변수가 20억개인 젬마 2B와 70억개인 젬마 2B 두 가지 유형으로 공개됐다. 젬마는 코랩(Colab)과 캐글 노트북(Kaggle notebooks), 허깅페이스(HuggingFace), 맥스텍스트(MaxText), 엔비디아 네모(NVIDIA NeMo)를 통해 사용할 수 있다.

 

아울러 사전 훈련 및 지시 조정된 모델은 버텍스 AI(Vertex AI), 구글 쿠버네티스 엔진(Google Kubernetes Engine, GKE)을 통해 설치할 수 있다.

 

젬마는 구글이 공개한 벤치마크 데이터에 따르면 매개변수 70억개 모델을 기준으로 평균 64.3점을 기록해 메타(Meta)의 AI 모델 라마-2(Llama-2)dml 45.3점을 앞섰다.

 

구글은 “젬마는 주요 벤치마크에서 더 큰 규모의 모델보다 뛰어난 성능을 보여줬다”며 “안전하고 책임감 있는 결과를 위한 구글의 엄격한 기준을 준수했다”고 설명했다.

 

젬마는 개발 단계부터 구글의 AI 원칙을 최우선으로 설계됐다. △개인정보 및 민감 데이터 필터링을 시작으로 △인간의 피드백을 기반으로 한 강화 학습(RLHF)을 통한 미세조정 △레드팀 테스트 △자동화된 적대적 테스트 △위험 행동 평가 등을 진행했다.

 

애플리케이션의 필요에 맞게 자체 데이터에서 젬마 모델을 미세 조정할 수 있도록 △멀티 프레임워크 △디바이스 및 하드웨어 호환성 △구글 클라우드 최적화 등의 도구와 시스템을 지원한다.

 

한편, 구글은 젬마가 AI 혁신을 이끄는 개발자와 연구진들의 오픈 커뮤니티를 위해 만들어졌다며 다양한 모델 규모와 함께 개발자들의 혁신을 지원하고 협업을 촉진하는 방안이라고 설명했다.

조재호 기자 jjh@the-tech.co.kr
Copyright @더테크 (TEC TECH) Corp. All rights reserved.




14건의 관련기사 더보기

  • 네이버포스트
  • X
  • Facebook