[더테크=전수연 기자] 구글(Google)이 연례 개발자 행사 ‘구글 I/O 2024’를 개최하고 AI 챗봇 제미나이(Germini) 신규 업데이트 사항, 생성형 AI 툴 등 다양한 기술 변화를 공유했다. 특히 개선된 ‘생성형 AI 검색’을 전면에 내세웠는데, 제미나이 모델이 적용되며 눈길을 끌었다.
I/O를 통해 공개된 주요 내용 중 경량 개방형 모델 ‘제미나이 1.5 프로’는 번역, 코딩, 추론 등과 같은 주요 사용 사례 전반에 걸쳐 품질 개선이 이뤄졌다. 제미나이 1.5 플래시의 경우에는 모델의 응답 시간 속도가 중요한 작업에 최적화된 모델로 빠르고 빈도가 잦은 작업에 활용될 수 있다.
구글은 제미나이 API·AI 스튜디오에 오디오 인식 기능을 추가해 제미나이 1.5 프로가 AI 스튜디오에 업로드된 동영상의 이미지, 오디오를 추론하도록 개발했다. 또한 픽셀 디바이스를 시작으로 멀티모달 제미나이 나노를 사용하는 앱들은 텍스트를 넘어 시각, 청각, 음성, 언어 등 다양한 정보를 맥락에 맞게 이해할 수 있다.
제미나이 나노의 멀티모달 기능은 시각 장애인, 저시력 이용자에게 이미지에 대한 명확한 설명을 제공할 수 있다. 또한 온라인 쇼핑 중 발견한 옷의 스타일의 설명을 표시하는데, 제미나이 나노는 온디바이스 기능이기 때문에 관련 정보를 빠르게 불러올 수 있다.
텍스트 투 이미지 AI ‘이마젠(Imagen) 3’는 자연어, 프롬프트의 의도를 이해하고 긴 프롬프트의 정보를 통합해 이미지를 생성한다. 이미지 생성 모델의 취약점이라 불리는 저작권 문제를 완화하기 위해 광범위한 필터링, 데이터 라벨링이 적용됐다.
이를 통해 이마젠 3는 공정성, 편견, 콘텐츠 안전 등의 대해 레드팀 평가가 진행되고 있으며 워터마킹 도구인 ‘SynthID’를 포함하고 있다. 워터마크를 이미지 픽셀에 직접 삽입해 식별이 가능하면서 사람의 눈에는 감지할 수 없도록 구성됐다. 이는 디자인 저작권을 보호하는 수단이기 때문에 생성된 이미지의 저작권 문제를 예방할 수 있다.
구글은 비디오 생성 모델인 ‘비오(Veo)’도 공개했다. 비오는 다양한 시네마틱 비주얼 스타일로 1분 이상의 고화질 1080p 해상도 동영상을 생성할 수 있다. 자연어 이해뿐 아니라 ‘타임랩스’, ‘풍경의 공중 촬영’과 같은 영화 용어를 이해해 영상 업계에서의 활용이 주목된다.
뿐만 아니라 구글은 예술, 음악 창작 영역에 AI를 접목하기 위해 유튜브, 뮤지션, 프로듀서들과 협업하고 있다. 이를 토대로 한 AI 음악 생성 모델인 ‘리리아(Lyria)’를 공개했는데, 이 모델은 음악 창작 과정을 강화하는 데 도움이 되도록 설계되고 있다.
구글은 음악 AI 도구의 도움으로 제작된 데모 녹음을 공개한 뮤지션 위클리프 진, 마크 레빌레 일렉트로닉 뮤지션 등과 함께 음악 관련 실험을 계속 이어가고 있다. 이러한 연구들은 글로벌 산업인 ‘케이팝’에도 새로운 영향을 끼칠 것으로 예상된다.
이외에도 구글은 고도화된 검색 기능을 위한 ‘AI 개요(AI Overviews in Search)’를 소개했다. AI 개요는 검색어 입력 시 언어를 단순화하거나 더 자세히 분류하는 옵션을 사용해 사용자의 요구를 단순화한다.
특히 제미나이 모델의 다단계 추론 기능을 통해 복잡한 질문, 뉘앙스를 이해할 수 있다. 예를 들어 ‘준비하기 쉬운 3일 식사 계획 만들기’를 검색할 경우 웹 전반에 걸쳐 다양한 요리법이 포함된 개요를 표시한다. 자연스러운 한 문장을 단계별로 구분하기 때문에 검색에 들이는 시간을 감소시킬 수 있다.
구글은 제미나이 1.5 프로 사용자에게 지메일, 구글 문서, 구글 드라이브, 구글 슬라이드, 구글 시트 등 워크스페이스 랩(workspace Labs) 측면에서의 접근을 추가했다. 사용자는 구글 드라이브에서 문서를 찾을 때 제미나이에 명령만으로 결과를 얻을 수 있게 된다.
아울러 구글은 증강 현실 콘텐츠를 구글 지도에서 바로 사용할 수 있는 방법도 선보였다. 특히 삼성, 퀼컴과 협력해 안드로이드를 기반으로 구축 중인 확장 현실(XR) 플랫폼의 기반이라고 볼 수 있다. 글로벌 이용자 수가 높은 구글 지도에 증강 현실이 더해질 경우 다양한 여행객들의 관심을 받을 것으로 보인다.