[더테크=전수연 기자] 메타(Meta)가 다양한 목적으로 사용 가능한 최신 LLM 라마3(Llama 3)를 오픈소스로 공개했다. 메타는 사전 훈련과 미세조정을 마친 80억 개(8B)와 700억 개(70B) 매개변수 모델 두 가지를 공개했다고 19일 밝혔다. 메타는 두 모델이 현재 동급의 오픈소스 모델 중 최고 수준의 성능인 것으로 평가받는다고 전했다. 대규모 다중 작업 언어 이해(MMLU)를 포함한 다양한 업계 표준 벤치마크에서 높은 성적을 받았으며 추론, 코드 생성, 지시 수행에 있어 전보다 성능이 크게 개선됐다. 라마3의 성능 향상은 모델의 사전 훈련, 사후 훈련 과정을 고도화함으로써 이뤄졌다. 사전 훈련을 위해 데이터셋의 양을 늘리고 필터링 과정을 거쳐 고품질 데이터만이 선별됐다. 라마3는 15조 이상의 토큰으로 훈련됐고 이는 라마2 대비 7배 이상 많으며 코드량은 4배 더 많다. 또 라마3의 사전 훈련에는 일상 질문부터 과학, 기술, 공학, 수학 분야, 코딩, 역사 지식에 이르기까지 다양한 분야의 데이터셋이 사용됐다. 이를 통해 모델은 보다 다양한 영역에서 활용될 수 있다. 또 사전훈련의 규모를 확대하고 고도화된 지시 미세조정(Instruction f
[더테크=조재호 기자] 구글이 인공지능(AI) 개발자와 연구자를 위한 소형 AI 모델을 오픈소스로 공개했다. 구글은 21일(현지시간) 자사의 신규 AI 모델 ‘Gemma(젬마)’를 공개했다. 젬마는 구글의 AI 모델 제미나이 기반의 경량화 sLLM(smaller Large Language Model, 소형 언어 모델)이다. ‘보석’을 뜻하는 라틴어 ‘gemma’에서 영감을 받은 이름이다. 젬마는 매개변수가 20억개인 젬마 2B와 70억개인 젬마 2B 두 가지 유형으로 공개됐다. 젬마는 코랩(Colab)과 캐글 노트북(Kaggle notebooks), 허깅페이스(HuggingFace), 맥스텍스트(MaxText), 엔비디아 네모(NVIDIA NeMo)를 통해 사용할 수 있다. 아울러 사전 훈련 및 지시 조정된 모델은 버텍스 AI(Vertex AI), 구글 쿠버네티스 엔진(Google Kubernetes Engine, GKE)을 통해 설치할 수 있다. 젬마는 구글이 공개한 벤치마크 데이터에 따르면 매개변수 70억개 모델을 기준으로 평균 64.3점을 기록해 메타(Meta)의 AI 모델 라마-2(Llama-2)dml 45.3점을 앞섰다. 구글은 “젬마는 주요 벤치마
주간 'Tech Point’는 금주의 소식을 톺아보고 정리한 뉴스 큐레이션 콘텐츠입니다. 한 주를 돌아보며 독자 여러분께 한 번 더 알려드리고 싶은 소식과 그 외 이슈들을 함께 모아봤습니다. [더테크=전수연 기자] 1월 3주차 ‘주간 Tech Point’는 ‘갤럭시 언팩 2024(Galaxy Unpacked 2024)’ 행사 소식부터 살펴보겠습니다. 삼성전자는 17일(현지시간) 미국 새너제이에 위치한 SAP센터에서 언팩 행사를 진행하고 ‘갤럭시 S24 시리즈’를 공개했습니다. 갤럭시 S24 시리즈는 갤럭시 AI를 기반으로 소통하는 방식을 새롭게 정의했습니다. 특히 실시간 통역 기능으로 통화부터 메시지까지 새로워진 검색 경험을 제공하며 1월 31일 국내를 포함해 전 세계에 순차 출시됩니다. 갤럭시 S24 울트라 모델은 티타늄 블랙·티타늄 그레이·티타늄 바이올렛·엠버 옐로 4종의 색상으로 출시됩니다. 이번 갤럭시 S24의 특징 중 하나인 실시간 통역(Live Translate)은 실시간으로 양방향 통역 서비스를 제공합니다. 또 온디바이스 AI를 기반으로 이뤄지면서 별도의 앱 없이 기본 탑재됐습니다. 전화 통역을 비롯해 기본 문자 기능, 국내외 주요 모바일
[더테크=조재호 기자] 카카오브레인이 멀티모달 언어모델 오픈소스 ‘허니비(Honeybee)’를 깃허브에 공개했다. 카카오브레인은 19일 이미지와 대규모 언어모델을 연결할 수 있는 새로운 모듈을 제안하고자 높은 수준의 멀티모달 언어모델(Multimodal Large Language Model, MLLM) 오픈소스 ‘허니비’를 공개했다. 현재 멀티모달 언어모델 연구는 공개된 모델의 수가 적고 학습 방법이 자세히 공개되지 않아 개발이 어려운 상황이다. 이에 카카오브레인은 멀티모달 언어모델의 발전에 기여하고자 자체 개발한 ‘허니비’의 소스코드를 공개하기로 결정했다. 김일두 카카오브레인 각자 대표는 “허니비 모델의 추론을 가능하게 하는 코드도 깃허브에 공개했으며 이를 활용한 서비스 확장을 고려중”이라며 “더욱 발전된 AI 모델 확보를 위해 끊임없이 연구개발을 진행할 것”이라고 전했다. MLLM은 이미지와 명령어를 입력하면 텍스트로 답변하는 모델로 텍스트로만 입·출력하는 대규모 언어모델의 확장된 형태라고 할 수 있다. 이미지와 텍스트를 모두 입력할 수 있어 이미지가 담긴 장면을 묘사하거나 이미와 텍스트가 혼합된 콘텐츠에 관한 질문을 이해하고 답변할 수 있는 능력을 지녔
[더테크=전수연 기자] 카카오뱅크가 자사 금융 기술 오픈소스를 공개하면서 국내 핀테크 기업과 연구기관을 지원한다. 카카오뱅크는 기술의 공익 확산과 모바일 금융 환경의 안전성 및 편의성을 높이는 데 기여하기 위해 혁신 금융 기술을 담은 오픈소스를 공개했다고 14일 밝혔다. (관련기사: 카카오뱅크, ISMS-P 인증으로 정보보호 시스템 강화) 오픈소스는 소스코드가 공개돼 누구나 접근, 사용, 수정할 수 있는 소프트웨어로, 이번에 카카오뱅크가 공개하는 오픈소스는 무자각 터치 데이터와 금융특화 언어 모델 2가지다. 무자각 터치 데이터는 사용자의 입력 습관 데이터를 익명화한 자료로 사용자마다 화면을 누르는 시간, 압력, 속도 등 사용 습관이 상이한 점을 이용해 휴대폰 명의도용 탐지 등 금융 사기 예방을 위한 카카오뱅크 무자각 인증 기술에 활용된다. 실제 사용자의 데이터를 얻기 어려운 대학교나 스타트업, 소형 핀테크사 등은 카카오뱅크의 무자각 터치 데이터를 연구·개발에 적용하고 생체 인증 기술을 개발할 수 있다. 금융특화 언어 모델은 카카오뱅크가 에프앤가이드와 함께 개발한 언어 모델로 금융 환경에 자주 사용되는 말뭉치를 학습해 은행의 다양한 서비스를 보다 쉽게 설명한다
[더테크 뉴스] 메타와 IBM, AMD가 인공지능(AI) 분야의 개방형 혁신과 확산을 위해 50여개의 AI기업과 연구기관이 참여한 AI 얼라이언스를 결성했다. 오픈AI-마이크로소프트, 구글, AWS 등 AI 기술과 관련해서는 기밀을 유지했던 주요 빅테크와 상반된 움직임으로 독자적 생태계를 구축할 수 있을지 관심이 모인다. 메타는 4일 공식홈페이지를 통해 50여 기업과 연구기관이 모여 ‘AI 얼라이언스(AI Alliance)’를 결성했다고 발표했다. 이 연합에는 메타와 IBM, AMD, 인텔, 델, 소니그룹 등 글로벌 대기업을 포함해 예일대, 코넬대, 다트머스대, 예루살램 히브리대, 임페리얼 칼리지 런던, 도쿄대, 게이오대 등의 유수의 대학과 미 항공우주국(NASA), 국립과학재단(NSF) 등 미국 정부 기관도 참여했다. AI 얼라이언스는 AI 기술을 개방된 형태로 개발하는 것이 중요하다는 견해다. 개방형 혁신이 사람들에게 혜택을 주고 AI가 책임감 있게 개발될 수 있다고 생각하기 때문이다. 기존 소프트웨어 프로그램을 개발하는 방식 중 개발 과정이나 설계를 공개하는 오픈소스 방식이다. 이번 동맹 발표와 함께 아르빈드 크리슈나(Arvind Krishna) IBM
[더테크=이지영 기자] 카카오뱅크가 오픈소스 보안 보증 국제 표준 인증을 획득해 오픈소스 활용과 보안 관리 역량을 국제적으로 알렸다. 카카오뱅크는 국제표준화기구(ISO)의 오픈체인(OpenChain) 프로젝트가 규정한 ‘오픈소스 소프트웨어 보안 관리체계 국제표준(ISO/IEC 18974:2023)’ 준수 기업으로 인정받았다고 23일 밝혔다. 오픈체인 프로젝트는 오픈소스 소프트웨어의 사용권 준수와 보안 취약점 관리를 위한 기업들의 자발적 협의체로 2016년 미국 비영리단체 리눅스 재단(Linux Foundation)에서 설립했다. 오픈소스 소프트웨어 보안 관리체계 국제표준은 오픈체인 프로젝트가 각 기업의 오픈소스 관리 체계를 다면적으로 평가해 체계성과 일관성 있는 오픈소스 보안 관리 역량을 갖춘 기업들에게 인증을 부여한다. 카카오뱅크는 △오픈소스 정책과 프로세스 수립의 적정성 △컴플라이언스 시스템 구축 여부 △담당 조직과 인력의 전문성 △사내 구성원의 교육 수행 등에 대한 기준 충족 여부 등 오픈체인 프로젝트가 규정한 30여 개 보안인증 요건을 충족했다. 카카오뱅크는 모든 인터넷은행을 포함한 국내외 금융사 중 이 인증을 받은 것은 자사가 처음이라고 밝혔다. 특
[더테크=조재호 기자] 현대차그룹과 정보통신산업진흥원(NIPA)이 글로벌 소프트웨어 기술 선도를 위해 협력사의 경쟁력 강화에 나섰다. SDV(Software Defined Vehicle) 전환이 가속화되는 가운데 오픈소스 기반의 서비스 플랫폼으로 상생협력 시스템을 구축한다. 현대차그룹은 서울시 서초구에 있는 오픈업센터에서 현대차·기아, 현대모비스, 현대오토에버, 정보통신산업진흥원 관계자들이 참석한 가운데 ‘자동차 제조업 분야 오픈소스 SW 기반 디지털 전환을 위한 업무협약’을 체결했다고 8일 밝혔다. 이번 업무협약은 자동차 분야의 SDV 전환 가속화가 진행되고 있는 상황에서 협력업체에 대한 지원을 통해 소프트웨어 개발 경쟁력을 강화하기 위한 차원이다. 성낙섭 현대차·기아 연구개발기획조정실장(상무)는 “SDV 시대 선도를 위해 소프트웨어 기술력 확보는 필수적”이라며 “이번 협약으로 협력사들의 오픈소스 소프트웨어 활용성과 경쟁력을 강화하고 부품사와 긴밀한 협력을 통해 고객에게 더 진보한 가치를 제공할 것”이라고 말했다. 현대차그룹 4사는 현대차를 비롯한 주요 완성차 업체의 오픈소스 활용 사례 및 분석 데이터를 제공하고 NIPA는 오픈소스 정보 분석과 이를 제공할
[더테크=조명의 기자] 큐브리드가 조달청과 자사의 오픈소스 DBMS ‘큐브리드(CUBRID)’에 대한 다수공급자계약을 완료했다고 22일 밝혔다. 이에 따라 공공 기관에서는 다수공급자계약(MAS) 방식으로 분리 발주를 통해 큐브리드에 대한 공개소프트웨어 유지 및 지원 서비스를 직접 계약해 사용할 수 있다. 디지털 서비스몰은 클라우드, 상용SW, 공개SW, 데이터 거래 등 IT 신기술에 대한 공공구매 활성화를 위해 조달청이 구축한 IT 상품·서비스 전용 공공조달 플랫폼이다. 큐브리드는 디지털 서비스몰 공개SW 부문 1호 계약 기업이 됨에 따라, 빅데이터 및 클라우드 등 최신 기술에 맞춰 안정적이고 유연한 오픈소스 DBMS를 필요로 하는 공공기관들이 보다 효율적으로 이를 이용할 수 있게 됐다. 디지털 서비스몰에서 도입한 다수공급자계약(MAS) 제도는 각 공공기관의 다양한 수요를 충족하기 위해 서비스 품질 등에서 같거나 비슷한 종류의 용역을 수요기관이 선택할 수 있도록 2인 이상을 계약상대자로 하는 계약제도다. 적격성 평가 결격사유가 없고 구매입찰공고의 입찰참가자격 요건을 충족하는 모든 업체에게 조달계약 참여 기회가 제공된다. 큐브리드는 한국정보통신기술협회(TTA)
[더테크=조명의 기자] EDB는 4일 케빈 댈러스 CEO를 선임했다고 밝혔다. 케빈 댈러스 신임 CEO는 CEO 겸 이사회 멤버로 합류했으며, 전 CEO였던 에드 보야진은 이사회 의장으로 이사회에 남는다. 케빈 댈러스 CEO는 기술 기업에서 디지털 혁신과 성장을 주도한 30년 경력의 소유자다. 마이크로소프트에서 25년 가까이 근무하며 클라우드 및 AI 비즈니스 개발 부문 부사장을 역임했다. 가장 최근에는 TPG 포트폴리오 기업이자 미션 크리티컬 지능형 시스템을 위한 소프트웨어 선도 기업 윈드리버 CEO로 재직했다. 지난해 2022년 골드 스티비 어워드, 아메리칸 비즈니스 어워드, 올해의 기업가, 2022년 글로비 어워드 올해의 경영자 부문 금상을 수상하기도 했다. EDB는 지난해 베인 캐피털 프라이빗 에퀴티로부터 대규모의 투자를 받아 EDB 포스트그레스 및 클라우드 제품 혁신을 지속하고 있다. EDB는 이번 댈러스 CEO 선임을 시작으로 EDB의 혁신과 성장을 가속화하기 위한 다음 단계로 진입한다는 계획이다. 댈러스 CEO는 “EDB는 데이터와 AI의 교차점에 초점을 맞춰 관련 지원에 나서고 있으며, 이러한 중요한 시기에 CEO로서 성장의 이끌게 되어 매우
[더테크=전수연 기자] 인텔이 다양한 프로그램에 활용될 수 있는 오픈소스 AI 키트를 공개했다. 프로그램을 오픈소스와 결합해 효율적인 결과물로 구축할 수 있을 것으로 보인다. 인텔은 액센추어(Accenture)와 협력을 바탕으로 총 34개의 오픈소스 AI 레퍼런스 키트를 커뮤니티에 공개했다고 26일 밝혔다. 각 키트는 △모델 코드 △데이터 학습 △머신러닝 파이프라인에 대한 지침 △라이브러리 △oneAPI 구성요소들이 포함돼 멀티 아키텍처 온프레미스, 클라우드, 엣지 환경에서 접근 가능하며 AI를 최적화할 수 있다고 인텔 측은 밝혔다. 키트는 인텔의 AI 소프트웨어 포트폴리오 구성 요소와 개방형 표준 기반 oneAPI 멀티 아키텍처 프로그래밍 모델을 기반으로 구축됐다. 개발자와 데이터 과학자들은 키트를 통해 다양한 분야에서 효율적으로 AI 응용 프로그램을 구축하는 방법을 제공 받는다. 인텔 관계자는 더테크에 “레퍼런스 키트는 여러 결합해 어떤 솔루션을 만들 수 있는지 보여주는 구현사례라고 보면 된다”며 “사용 방법과 예시를 카테고리별로 나눠서 알려주는 지침”이라고 설명했다. 프로그램 개발자는 키트를 활용해 응용 프로그램에 AI를 도입하고 기존 지능형 솔루션을
[더테크=문용필 기자] 오픈AI의 ‘GTP’와 구글의 ‘팜2’(PaLM2)에 집중됐던 글로벌 LLM(대규모 언어모델) 판도에 메타와 마크 저커버그 CEO가 승부수를 띄운 모습이다. 자사의 차세대 LLM인 ‘라마2’(Llama2)를 과감히 오픈소스로 공개한 것. 공익적 연구 뿐만 아니라 상업적 용도로 이용할 수 있다는 점에서 LLM 모델을 적용하는 생성형인공지능(AI) 서비스 기업들의 큰 관심을 모을 것으로 보인다. 메타는 18일(현지시간) 자사 뉴스룸을 통해 “라마2의 다음 버전을 오픈 소스로 제공할 준비가 돼 있으며 연구 및 상업적 용도로 무료 사용할 수 있도록 하고 있다”고 밝혔다. 아울러 “우리는 개방형 접근 방식이 오늘날의 AI 모델, 특히 빠르게 발전하는 생성 공간 모델 개발에 적합하다고 생각한다”며 “AI모델을 공개적으로 사용할 수 있게 함으로써 모든 이들에게 혜택을 줄 수 있다”는 입장을 나타냈다. (관련기사: 메타의 새로운 음성인식 AI 모델, 오픈 소스로 공개) 저커버그 CEO는 자신의 페이스북을 통해 라마2 관련 소식을 전하며 “오픈 소스는 더 많은 개발자가 새로운 기술로 구축할 수 있게 하므로 혁신을 이끌어낸다”며 메타에 인프라 및 AI워