LG AI '엑사원', AWS 생성형 AI 기반으로 고도화

LG AI연구원, AWS리인벤트 2023서 AI 이미지 투 텍스트 캡셔닝 솔루션 공개
3000억 개 파라미터를 통해 관련성 높은 콘텐츠 기반 마련

 

[더테크=전수연 기자] LG그룹의 인공지능(AI) 연구 허브인 LG AI연구원이 AWS(아마존웹서비스)의 클라우드를 도입해 다양한 데이터를 가공, 관리하며 자사 솔루션을 고도화했다.

 

LG AI연구원은 AWS 리인벤트(re:Invent) 2023에서 AI 이미지-투-텍스트 캡셔닝 솔루션을 출시했다고 30일 밝혔다.

 

(관련기사: LG의 초거대 멀티모달 AI, ‘엑사원 2.0’ 공개)

 

신규 캡션 솔루션은 3000억 개의 파라미터를 보유한 LG AI 연구원의 멀티모달 파운데이션 모델인 엑사원(EXAONE)을 활용한다. 엑사원은 광고, 패션, 리테일 등 여러 산업 분야의 사용자를 위해 정확하고 관련성 높은 콘텐츠를 위한 캡셔닝 솔루션을 제공한다.

 

엑사원의 새로운 제로샷 이미지 캡션 솔루션은 생성형 AI를 활용해 인간의 인지 능력과 유사하게 이전의 경험, 지식, 훈련을 바탕으로 본 적 없는 객체나 장면을 자동으로 이해하고 설명한다.

 

이는 엑사원이 한국어, 영어로 된 이미지와 텍스트를 이해하고 인간에 가까운 추론 능력으로 상세한 이미지 캡션과 키워드를 작성할 수 있게 한다. 광고 산업 종사자는 해당 기술을 통해 제품 설명을 자동화하거나 광고, 마케팅 캠페인을 위한 새로운 콘텐츠를 만들 수 있다.

 

LG AI연구원은 엑사원의 학습 중 파라미터 수가 늘어나는 등 필요에 따라 효율적으로 IT 리소스를 확장할 수 있도록 조정 가능한 컴퓨팅 용량을 클라우드에서 제공하는 아마존 엘라스틱 컴퓨트 클라우드(Amazon EC2)를 사용한다.

 

소비재 기업, 마케팅 에이전시 등 LG AI연구원의 사용자는 AWS의 확장성을 활용해 시간당 2000개의 이미지 캡션을 생성할 수 있다. LG AI연구원은 머신러닝(ML) 모델을 구축, 훈련, 배포하는 완전 관리형 서비스 아마존 세이지메이커(Amazon SageMaker)를 사용해 3억5000만 개의 고해상도 이미지와 텍스트 세트를 엑사원에 학습시켰다.

 

LG AI연구원은 클라우드를 사용해 온프레미스 인프라보다 빠르면서 결과 미세 조정, 체크포인트 구현, 데이터 편향과 같은 문제를 해결할 수 있었다. 또한 텍스트 프롬프트에 따라 새로운 이미지를 만드는 AI 버추얼 아티스트 틸다(Tilda)를 개발했다. 틸다는 3000개의 이미지, 패턴을 생성해 의상을 디자인하는 데 도움을 준다.

 

이와 함께 LG AI연구원은 LG생활건강에 지난 8월 생성형 AI 기술이 AWS 상에서 만들어 낸 독특한 디자인을 피부, 의류에 인쇄할 수 있는 미니 즉석 타투 프린터 ‘임프린투’ 기술 개발에 협력한 바 있으며, 추후 LG 계열사에 소프트웨어 코드를 생성하도록 지원할 예정이다. 

 



배너

배너