[더테크=조재호 기자] 아마존웹서비스(이하 AWS)가 AWS 리인벤트(re:Invent)에서 엔비디아와 전략적 협력을 확대한다고 1일 발표했다. 이번 협력 확대는 초기 머신러닝(ML) 선도 기업들의 오랜 파트너십을 기반으로 한다. 양사는 차세대 GPU와 CPU, AI 소프트웨어를 갖춘 엔비디아의 최신 멀티노트 시스템부터 AWS 니트로 시스템(AWS Nitro System) 고급 가상화 및 보안, 엘라스틱 패브릭 어댑터(Elastic Fabric Adapter, EFA) 상호 연결, 울트라클러스터(UltraCluster) 확장성까지, 파운데이션 모델(FM) 학습과 생성형 AI 애플리케이션 구축 기술들을 결합할 예정이다. 아담 셀립스키(Adam Selipsky) AWS CEO는 “AWS와 엔비디아는 세계 최초의 GPU 클라우드 인스턴스를 시작으로 13년 이상 협력해 왔다”며 “우리는 차세대 엔비디아 GH200과 AWS의 클라우드를 결합해 함께 혁신을 지속할 것”이라고 말했다. 이번 협력으로 AWS는 멀티노드 NV링크 기술이 적용된 GH200을 제공하는 최초의 클라우드 제공 업체가 된다. GH200은 동일한 모듈의 Arm 기반 CPU와 결합한다. GH200 NVL
[더테크=조재호 기자] 사피온은 자율주행 추론용 Automotive 향 NPU(신경망처리장치) IP가 국제 평가인증기관인 DNV(Det Norske Veritas)로부터 ISO 26262 인증을 획득했다고 1일 밝혔다. DNV는 글로벌 보증 및 리스크 관리 전문 기업으로 다양한 산업 분야에 걸쳐 산업 표준을 설정하고 관리한다. 사피온은 자율주행 차량이 요구하는 추론 요건 및 안전 설계 요구사항을 만족하는 ISO26262 기준에 맞춰 NPU IP를 개발했다. 사피온의 자율주행 자동차용 NPU IP는 내년에 공개될 예정이다. 사피온은 데이터센터용 X330과 신경망 처리 관련 코어 아키텍처는 동일하지만 기능안전과 관련 요구사항에 맞춰 안정 기능(Safety Feature)이 다수 추가됐고 차량용 실시간 처리에 적합하도록 설계 구성을 변경했다. 류수정 사피온 대표는 “Automotive 향 NPU IP가 ISO26262 인증을 획득해 자율주행환경에서 안전성 확보를 위한 자사의 노력을 인증받는 계기가 됐다”며 “사피온은 자동차 업계의 요구사항을 충족하면서 확장성과 효율성을 갖춘 AI 추론 솔루션을 제공할 계획이며 미래 모빌리티에 발맞춰서 가능성을 확대해 나갈 계획”이
[더테크=조재호 기자] 아마존웹서비스(이하 AWS)가 AWS 리인벤트(re:Invent)에서 거대언어모델(LLM)과 기타 파운데이션 모델(FM)의 구축, 학습, 배포를 가속하는데 도움이 되는 아마존 세이지메이커(Amazon SageMaker)의 새로운 기능 5가지를 발표했다. 이번에 발표된 신규 기능에는 배포 비용과 모델 지연 시간을 줄여 관리형 머신러닝(ML) 인프라 운영을 최적화하는 기능이 포함됐다. 브라틴 사하(Bratin Saha) AWS 인공지능 및 머신러닝 부문 부사장은 “생성형 AI에 대한 관심이 모든 산업군으로 확산됐다”며 “AI 도입을 위한 시스템 구축, 학습, 배포를 위해 학습 속도와 비용 최적화, 지연 시간 단축, FM 평가와 노코드 모델 구축까지 아마존 세이지메이커를 개선해 고객의 접근성을 높일 수 있도록 도울 것”이라고 말했다. 이번에 발표된 세이지메이커의 신규 기능을 살펴보면 고객이 더 쉽고 빠르게 모델을 학습시키고 운영해 생성형 AI 애플리케이션을 개선할 수 있도록 돕는다. 세이지메이커 하이퍼포드(SageMaker HyperPod)는 대규모 FM 학습 가속화를 지원한다. 세이지메이커 인퍼런스(SageMaker Inference)는…
[더테크=조재호 기자] 네이버 검색이 변화한다. 복잡하고 긴 내용을 대화하듯 입력해도 AI가 원하는 결과를 요약해서 답변해주고 관련 서비스까지 연결한다. 여러번 검색하고 결과를 비교하는 과정을 반복해 정보를 찾던 부분을 개선하고 각종 서비스의 연결성도 강화했다. 네이버는 30일부터 네이버 통합검색에 생성형 AI 검색 서비스 ‘큐(CUE:)’를 적용했다고 밝혔다. 큐:는 네이버가 지난 9월부터 시범 운영중인 생성형 AI 검색서비스로 쇼핑과 로컬 등 네이버의 다양한 서비스 연계로 편의성을 높였다. ‘사람처럼 검색(Human-like searching)’하는 과정을 통해 질문의 의도와 맥락을 고려해 이용자가 여러번 검색하며 얻어야 했던 정보를 한번에 찾아준다. 통합검색에 적용된 큐:는 사용자가 입력하는 질문의 유형에 따라 유동적으로 노출된다. 구체적인 의도를 가진 대화형 질의에는 검색 결과 상단에서 큐:의 답변을 확인할 수 있다. ‘~해줘’, ‘~알려줘’, ‘~추천해줘’, ‘~뭐야?’ 등 추천이나 제안이 필요한 질문에도 효과적으로 답한다. 예를 들어 ‘크리스마스에 예약 가능하고 주차되는 성수동 맛집 찾아줘’ 라는 질문에 각각의 정보를 하나씩 확인해야 했다면 큐:는
[더테크=전수연 기자] HD현대가 산학연 협력 강화를 통해 AI 분야 초격차 경쟁력 확보에 나선다. HD현대는 서울대학교와 공동으로 AI 분야 산학연 포럼 ‘HD현대&SNU AI 포럼’을 개최했다고 30일 밝혔다. 이날 진행된 포럼은 AI 기술 전반의 이해도를 높일 수 있는 ‘인사이트(Insight) 세션’과 그룹 핵심 사업 AI 기술을 소개하는 ‘유스케이스(Usecase) 세션’으로 나뉘어 진행됐다. 기조 강연자로는 AI 연구기관 캐나다 벡터연구소(Vector Institute)의 데발 판디아(Deval Pandya) 박사가 ‘AI의 역사와 진화과정’ 발표를 진행했다. 인사이트 세션은 ‘AI 미래와 방향성’이라는 주제로 하정우 네이버클라우드 센터장, 윤성로 서울대 교수, 이화영 LG AI 연구원 상무 등 강연과 참석자들의 대담 방식으로 진행됐으며 김영옥 HD현대 AI전략담당 상무가 AI 전략과 방향성을 소개했다. 이어 유스케이스 세션은 조선해양, 건설기계, 에너지 등 HD현대의 3대 핵심사업을 중심으로 자세한 AI 적용 사례가 발표됐다. 첫 세션은 ‘바다의 무한한 잠재력 실현’을 주제로 HD현대의 자율운항 전문회사 아비커스의 자율운항선박 상용화 현황
[더테크=전수연 기자] AWS(아마존웹서비스)가 애플리케이션 개발 시 데이터 기반 모델 맞춤화 방법과 작업 도구를 개선한 신규 기능을 발표했다. 특히 AI를 통해 복잡한 프롬프트를 이해하도록 구성돼 개발 작업에 도움을 줄 것으로 보인다. AWS는 AWS 리인벤트(re:Invent)에서 모델 선택권을 확대하고 사용자가 비즈니스에 적절한 생성형 AI 애플리케이션을 구축하도록 돕는 아마존 베드록(Amazon Bedrock)의 신기술을 30일(현지시각) 공개했다. (관련기사: AWS, 차세대 프로세서 그래비톤4·트레이니움2 공개) (관련기사: AWS, 생성형 AI 기반 어시스턴스 ‘아마존 Q’ 발표) 아마존 베트록은 LLM(대규모언어모델), AI21랩스, 앤트로픽, 코히어, 메타 등 아마존의 파운데이션 모델에 접근할 수 있는 완전 관리형 서비스로, 사용자가 생성형 AI 애플리케이션을 구축하는 데 필요한 기능과 개인정보 보호·보안을 지원한다. AWS는 독점(proprietary) 데이터로 모델을 맞춤화하는 방법을 간소화하며 복잡한 작업의 실행을 자동화하는 도구를 제공한다. 이를 통해 안전장치 기반의 생성형 AI 접근성을 높일 계획이다. AWS는 기업이 생산성 향상,…
[더테크=이지영 기자] IT 벤처 다우기술이 제공하는 단체문자 전문 사이트 뿌리오가 AI 기반의 문자서비스를 선보였다. 뿌리오는 29일 국내 최초로 생성형 AI를 활용한 문자서비스를 정식 출시했다고 30일 밝혔다. 뿌리오는 △기업 마케팅을 위한 단체문자(SMS·LMS·MMS) △카카오 알림톡·친구톡 △전자문서 △모바일쿠폰 등을 대량 발송 및 분석하는 통합 마케팅 플랫폼이다. 신규 출시된 AI 문자서비스는 챗GPT 모델 기반의 학습 데이터를 활용하는 서비스로 사용자가 발송 목적과 주요 키워드를 입력하면 자동으로 최적화된 메시지를 생성한다. 이를 통해 뿌리오는 사용자가 문자 작성을 위해 들이는 시간과 리소스를 단축하고 양질의 문자 작성을 지원할 수 있다. AI 문자서비스는 선거 문자, 기업 홍보, 마케팅, 프로모션 등 모든 분야에 활용될 수 있다. 특히 2024년 예정인 제22대 국회의원 선거에서도 AI 데이터를 기반으로 선거 문자 메시지를 생성할 수 있다. 김성욱 다우기술 비즈마케팅부문 전무는 “이번 AI 문자서비스는 국내 최초로 정식 출시된 생성형 AI 문자서비스로 기업 홍보와 마케팅에 도움이 될 것”이라며 “현재 기술 개발을 통해 RCS(차세대 문자서비스)
[더테크=전수연 기자] LG그룹의 인공지능(AI) 연구 허브인 LG AI연구원이 AWS(아마존웹서비스)의 클라우드를 도입해 다양한 데이터를 가공, 관리하며 자사 솔루션을 고도화했다. LG AI연구원은 AWS 리인벤트(re:Invent) 2023에서 AI 이미지-투-텍스트 캡셔닝 솔루션을 출시했다고 30일 밝혔다. (관련기사: LG의 초거대 멀티모달 AI, ‘엑사원 2.0’ 공개) 신규 캡션 솔루션은 3000억 개의 파라미터를 보유한 LG AI 연구원의 멀티모달 파운데이션 모델인 엑사원(EXAONE)을 활용한다. 엑사원은 광고, 패션, 리테일 등 여러 산업 분야의 사용자를 위해 정확하고 관련성 높은 콘텐츠를 위한 캡셔닝 솔루션을 제공한다. 엑사원의 새로운 제로샷 이미지 캡션 솔루션은 생성형 AI를 활용해 인간의 인지 능력과 유사하게 이전의 경험, 지식, 훈련을 바탕으로 본 적 없는 객체나 장면을 자동으로 이해하고 설명한다. 이는 엑사원이 한국어, 영어로 된 이미지와 텍스트를 이해하고 인간에 가까운 추론 능력으로 상세한 이미지 캡션과 키워드를 작성할 수 있게 한다. 광고 산업 종사자는 해당 기술을 통해 제품 설명을 자동화하거나 광고, 마케팅 캠페인을 위한 새로운
[더테크=전수연 기자] 개발자 데이터 플랫폼 기업 몽고DB(MonggoDB)가 AWS(아마존 웹 서비스) 플랫폼에 자사 서비스를 결합해 자체 데이터 기반 애플리케이션 개발을 돕는다. 몽고DB는 AWS 리인벤트 2023(AWS re:Invent 2023)에서 몽고DB 아틀라스 벡터 서치와 아마존 베드록의 통합을 통해 AWS 클라우드 인프라에서 차세대 애플리케이션 구축을 지원한다고 30일 밝혔다. (관련기사: 몽고DB, AWS 아마존 코드위스퍼러 기능 지원 협업) 몽고DB 아틀라스 벡터 서치는 기업의 운영 데이터를 기반으로 생성형 AI, 시맨틱 검색 기능을 애플리케이션에 도입하도록 지원하고 맞춤형 유저 경험을 제공한다. 양사의 이번 통합으로 개발자는 생성형 AI를 활용해 다양한 사례를 다루고 벡터 서치로 처리한 자체 데이터(proprietary data)를 기반으로 빠른 응답이 가능한 최신 애플리케이션을 생성할 수 있다. 사히르 아잠(Sahir Azam) 몽고DB CPO는 “스타트업부터 대기업까지 모든 규모의 기업이 차세대 애플리케이션 구축과 미래 비즈니스 대비를 위해 생성형 AI를 모색하고 있지만 상당수는 자체 데이터 보호와 AI 구동 시스템 정확도를 우려하고
[더테크=조재호 기자] ‘노란 포도’나 ‘보라색 바나나’처럼 본 적 없는 시각 개념을 이해하고 상상하는 인공지능(AI) 능력 구현이 가능해졌다. 카이스트는 안성진 전산학부 교수 연구팀이 구글 딥마인드와 미국 럿거스 대학교와의 국제 공동 연구를 통해 시각적 지식을 체계적으로 조합해 새로운 개념을 이해하는 AI 모델과 프로그램을 수행하는 벤치마크를 개발했다고 30일 밝혔다. 안 교수가 이끄는 국제 공동 연구팀은 시각 정보에 대한 체계적 일반화를 연구할 수 있는 벤치마크를 개발했다. 시각 정보는 언어와 달리 명확한 단어나 토큰 구조가 없어 이 구조를 학습하고 체계적 일반화를 달성하는 것이 큰 도전이다. 체계적 일반화 혹은 조합적 일반화는 시각을 인식하는 능력이다. 예를 들어 사람은 보라색 포도나 노란 바나나 같은 개념을 학습하고 이를 나눈 뒤 재조합해 노란 포도나 보라색 바나나와 같은 이미지나 개념을 상상하는 능력을 말한다. 체계적 일반화 문제는 1988년 미국의 인지과학자 제리 포더(Jerry Fodor)와 제논 필리쉰(Zenon Pylyshyn)이 인공신경망이 해결할 수 없는 분야라는 주장과 함께 35년 동안 인공지능 딥러닝 분야에서 큰 도전 과제로 남아있었다
[더테크=전수연 기자] AI 에이전트 스타트업 ‘라이너(Liner)’가 자사 AI 기술로 글로벌 시장 내 존재감 확대에 나선다. 라이너는 서울 서초구 모나코스페이스에서 ‘Personal AI for Everyone’이라는 주제로 기자간담회를 29일 개최했다. 라이너는 이날 초개인화 AI 에이전트로 진화하고 있는 라이너 코파일럿, 라이너 AI 워크스페이스에 대해 소개하고 △서비스 성장 지표 △AI 기술 △제품 비전과 목표를 설명했다. 자율 AI로 알려진 AI 에이전트는 사람의 개입 없이도 문제 해결을 위한 의사결정을 자율 수행하는 인공지능이다. 라이너는 고차원 문제에 대해 AI가 스스로 문제를 분석하고 작은 단위로 문제를 분리해 해결한 뒤 답을 내기 때문에 생산성 측면에서 주목받고 있다고 판단했다. 이를 통해 라이너는 지난 8월 AI 에이전트 ‘라이너 AI 워크스페이스’를 선보였다. 또 기자간담회에서 원화윤 라이너 PO는 라이너 코파일럿과 라이너 AI 워크스페이스를 소개했다. 이에 따르면 라이너는 미국 구독자의 비율이 약 55%로 미국 시장을 중심으로 성장하고 있다는 점이 강조됐다. 다음으로 발표에 나선 허훈 라이너 테크 리드는 AI 에이전트의 기본 개념 설명
[더테크=전수연 기자] 한국 딜로이트 그룹(이하 딜로이트)이 2024년 생성형 AI 시장 전망과 통신, 반도체 산업의 성장을 예측했다. 보고서에 따르면 생성형 AI를 탑재할 기업이 늘어날 것으로 보인다. 딜로이트는 딜로이트 글로벌이 2024년 생성형 AI 시장규모와 성장 가능성을 포함해 통신산업, 반도체, 미디어 엔터테인먼트, 스포츠 산업을 분석한 ‘첨단기술, 미디어 및 통신(TMT) 2024 예측(Technology, Media, & Telecom 2024 Predictions)’ 보고서를 발간했다고 29일 밝혔다. (관련기사: 도시의 미래 비전...'디지털화 및 자동화') 이번에 발간된 TMT 2024 보고서는 △생성형 AI △지속가능성 △미디어, 엔터테인먼트&스포츠 △통신, 첨단기술 4가지 주제에 대해 모두 19개 장으로 구성됐다. 생성형 AI의 경우 딜로이트는 2024년 생성형 AI 전용 반도체칩 시장 규모가 미화 400억 달러 수준까지 성장할 것으로 전망했다. 기업용 소프트웨어 업체들 대부분은 2024년을 기점으로 제품과 서비스에 생성형 AI를 포함할 것으로 나타났다. 또 생성형 AI를 적용해 기업용 소프트웨어 업체가 얻을 수 있는 추