오라클의 오픈소스 DB 기술 '히트웨이브 AI'

오라클, 온라인 미디어브리핑 진행
별도의 벡터 데이터베이스 구축 불필요

 

[더테크=전수연 기자] 오라클이 별도의 벡터 데이터베이스로의 이동 없이 생성형 AI를 엔터프라이즈 데이터에 구현할 수 있도록 지원한다. 이 생성형 AI는 인-데이터베이스 LLM, 자동화된 인-데이터베이스 벡터 저장소, 확장 벡터 처리와 비정형 콘텐츠 기반의 맥락화된 자연어 대화 기능을 제공한다.

 

오라클은 ‘오라클 오픈소스DB 생성형 AI 기술 발표 온라인 미디어브리핑’을 2일 진행했다.

 

히트웨이브 사용자일 경우 오라클 클라우드 리전, 오라클 클라우드 인프라스트릭처 전용 리전과 주요 클라우드 서비스 전반에서 히트웨이브 생성형 AI를 즉시 사용할 수 있다.

 

히트웨이브 생성형 AI는 개발자가 내장형 임베딩 모델을 사용해 단일 SQL 명령어로 기업의 비정형 콘텐츠를 위한 벡터 저장소를 생성할 수 있게 한다. 사용자는 인-데이터베이스 LLM, 외부 LLM을 사용해 단일 동작으로 자연어 검색을 수행할 수 있다.

 

데이터는 데이터베이스 내에서 유지되며 히트웨이브의 확장성을 기반으로 GPU 프로비저닝의 필요성도 줄어든다. 히트웨이브는 오라클이 제공하는 완전 관리형 데이터 프로세스다. 멀티 클라우드 환경에서 지원된다. 


니푼 아가르왈 오라클 MySQL 및 히트웨이브 개발 담당 수석 부사장은 “히트웨이브는 오라클이 제공하는 완전 관리형 데이터 프로세스”라며 “이번 기능은 오라클이 지속해서 개발해온 혁신 기술이자 완전히 새로운 기술”이라고 말했다.

 

새롭게 공개된 생성형 AI 기능 중 인-데이터베이스 LLM은 생성형 AI 애플리케이션의 개발을 간소화한다. 사용자는 외부 LLM 선정과 통합 없이 다양한 클라우드 제공업체 데이터센터와 LLM 가용성 관련 우려를 낮출 수 있다.

 

인-데이터베이스 LLM은 히트웨이브 벡터 저장소를 활용해 데이터 검색, 콘텐츠 생성과 요약, 검색증강생성(RAG) 등을 수행할 수 있게 해준다. 사용자는 오토 머신러닝과 같은 기타 내장형 히트웨이브 기능을 생성형 AI와 결합해 애플리케이션을 구축할 수 있다. 히트웨이브 생성형 AI는 OCI 생성형 AI 서비스에도 통합돼 있어 LLM 제공업체들의 사전 훈련된 기본 모델 활용도 지원한다.

 

아가르왈 부사장은 “생성형 AI, 벡터는 히트웨이브에서 오브젝트 스토리지 내부 데이터를 처리할 수 있다”며 “이를 통해 사용자는 생성형 AI의 이점을 DB 내부에서 관리할 수 있다”고 설명했다.

 

자동화된 인-데이터베이스 벡터 저장소는 사용자가 데이터를 별도의 벨터 데이터베이스로 이동하거나 AI 전문성을 갖추지 않고도 생성형 AI를 자사 비즈니스 문서와 함께 사용하도록 지원한다.

 

객체저장소에서의 문서 검색, 파싱, 병렬화되고 최적화된 임베딩 생성, 벡터 저장소에 대한 임베딩 삽입 등 벡터 저장소와 벡터 임베딩 생성을 위한 모든 과정이 자동화돼 있으며 데이터베이스 내에서 수행되면서 히트웨이브 벡터 저장소의 활용을 보장한다.

 

RAG용 벡터 저장소는 이 모델들이 보다 정확한 답변을 제공하도록 적절한 맥락을 바탕으로 전문 데이터를 검색하고 LLM의 환각 문제 해결에 도움을 준다.

 

확장 벡터 처리는 일정한 정확도를 유지하면서 신속한 의미 검색 결과를 제공할 수 있다. 히트웨이브는 새로운 네이티브 벡터 데이터 유형과 거리 함수의 최적화된 구현을 지원해 표준 SQL로 의미있는 쿼리를 작성하도록 한다.

 

인-메모리 하이브리드 열 형식 표현과 히트웨이브의 확장 아키텍처는 벡터 처리가 니어 메모리 대역폭에서 실행되고 최대 512 히트웨이브 노드에서 병렬화 될 수 있게 한다.

 

이를 통해 사용자의 질문에 대한 답을 빠르게 제공하고 사용자는 의미 검색, 기타 SQL 연산자를 결합해 여러 테이블을 다양한 문서로 조인하고 모든 문서 전반에서 유사성 검색을 수행할 수 있다.

 

히트웨이브 챗은 마이SQL 쉘용 비주얼 코드 플러그인으로 히트웨이브 생성형 AI를 위한 그래픽 인터페이스를 제공한다. 개발자는 자연어, SQL로 질문할 수 있으며 통합 레이크하우스 네비게이터를 통해 객체 스토리지로부터 파일을 선택하고 벡터 저장소를 생성할 수 있다.

 

또한 데이터베이스 전반에서 검색을 수행하거나 검색 영역을 폴더로 제한할 수도 있다. 히트웨이브는 질문 내역, 소스 문서 인용과 LLM 프롬프트를 바탕으로 컨텍스트를 유지, 관리한다. 

 

이를 통해 상황별 대화를 용이하게 하고 사용자가 LLM이 생성한 답변의 출처를 검증할 수 있게 한다. 컨텍스트는 히트웨이브에서 유지, 관리되며 히트웨이브를 사용하는 모든 애플리케이션에서 활용 가능하다.

 

 

 

 

 


관련기사

21건의 관련기사 더보기

배너

배너