“AI 안전성도 문화 맞춤 시대” 셀렉트스타, 레드티밍 자동 생성 프레임워크 공개

ICLR 2026 메인 트랙 논문 채택

 

[더테크 이지영 기자]  AI 데이터·신뢰성 평가 기업 셀렉트스타가 자체 개발한 AI 안전성 검증 기술로 세계 최고 권위 학회에서 연구 성과를 인정받았다. 셀렉트스타는 AI Safety팀의 논문 ‘CAGE: 문화 맞춤형 레드티밍 벤치마크 생성 프레임워크’가 오는 4월 브라질에서 열리는 ICLR 2026 메인 컨퍼런스에 채택됐다고 밝혔다.

 

ICLR은 AI·머신러닝 분야 최상위 학회로, 올해 약 1만9천 건의 논문 중 상위 28%만이 채택됐다. 특히 셀렉트스타 논문은 가장 핵심 세션인 메인 트랙에 선정되며 독창성과 기술 완성도를 인정받았다. 연구는 기획부터 구현·검증·논문 게재까지 외부 협력 없이 내부 인력만으로 수행된 성과라는 점에서도 의미가 크다.

 

핵심 기술은 국가별 문화와 법적 맥락을 반영해 AI 안전성 시험문제를 자동 생성하는 ‘레드티밍 벤치마크 생성’ 프레임워크다. 기존 AI 안전성 평가는 영미권 데이터셋을 번역해 사용하는 경우가 많아 각 국가의 실제 위험 상황을 충분히 반영하지 못한다는 한계가 있었다.

 

셀렉트스타는 이를 해결하기 위해 ‘시맨틱 몰드(Semantic Mold)’ 개념을 제안하고 문화 맞춤형 공격 질문을 자동 생성했다. CAGE가 생성한 시나리오는 사람이 만든 수준의 자연스러움을 보였으며, AI 모델의 방어율을 넘어 잠재 위험을 찾아내는 공격 성공률에서도 우수한 성능을 기록했다. 데이터가 부족한 캄보디아어 등 저자원 언어에서도 높은 성능을 입증했다.

 

논문에는 한국형 안전성 벤치마크 ‘KoRSET’도 함께 공개됐다. KoRSET은 단순 번역 기반 데이터셋보다 AI 취약점을 효과적으로 발견하며 한국 문화 기반 검증에 최적화된 성능을 보였다.

 

CAGE 기술은 이미 산업 현장에도 적용됐다. 셀렉트스타는 국내 주요 기업 AI 프로젝트에 해당 기술을 도입해 모델 취약점 점검과 운영 효율 개선 효과를 확인했다.

 

김민우 AI Safety 팀장은 “ICLR 채택은 셀렉트스타가 독자적 원천 기술을 보유한 AI 기업임을 입증한 사례”라고 밝혔다. 임용택 연구원은 “AI 경쟁의 핵심은 안전성”이라며 글로벌 기준 수립 의지를 강조했다.

 

셀렉트스타는 이번 성과를 기반으로 금융·공공 등 고신뢰 산업으로 AI 신뢰성 평가 솔루션을 확대할 계획이다. 논문은 3월 아카이브를 통해 공개될 예정이다.

 



배너