인공지능으로 미생물 유전자 기능 규명 속도 높인다

KAIST-UCSD, 공동연구팀

 

[더테크 이지영 기자]  유전자는 알고 있지만 기능은 모른다.” 미생물 연구 분야의 오랜 난제를 해결하기 위해 인공지능을 활용한 유전자 기능 규명 전략이 본격적으로 진화하고 있다. 대규모 실험의 한계와 복잡한 생물학적 상호작용으로 속도를 내지 못했던 기존 연구 방식에 대해, 인공지능이 새로운 돌파구가 될 수 있다는 분석이다.

 

카이스트는 생명화학공학과 이상엽 특훈교수 연구팀이 미국 캘리포니아대 샌디에이고 생명공학과 버나드 팔슨 교수 연구진과 함께 인공지능 기반 미생물 유전자 기능 발견 연구의 최신 흐름을 체계적으로 정리한 리뷰 논문을 발표했다고 12일 밝혔다.

 

2000년대 초 전장 유전체 해독 기술이 확산되며 생명체의 유전자 기능을 빠르게 규명할 수 있을 것이라는 기대가 컸다. 그러나 20여 년이 지난 현재까지도 미생물 유전체 내 상당수 유전자는 여전히 ‘기능 미상’ 상태로 남아 있다. 유전자 결실 실험, 발현량 조절, 시험관 내 활성 측정 등 다양한 접근이 시도됐지만, 대규모 실험에 따른 비용과 시간 부담, 실험실 결과와 실제 생체 환경 간 차이로 인해 한계가 뚜렷했다.

 

연구팀은 이러한 병목을 해소하기 위한 대안으로 전산생물학과 실험생물학을 결합한 인공지능 기반 접근법을 제시했다. 논문에서는 전통적인 서열 유사성 분석부터 심층학습 기반 최신 모델에 이르기까지, 유전자 기능 발견을 가속해온 다양한 계산 생물학 기법을 폭넓게 정리했다.

 

특히 단백질 3차원 구조 예측 기술의 발전이 중요한 전환점으로 평가됐다. 구글 산하 인공지능 연구 조직인 딥마인드가 개발한 알파폴드와 로제타폴드는 단순한 기능 추정을 넘어, 단백질이 실제로 어떻게 작동하는지에 대한 이해를 가능하게 했다. 더 나아가 생성형 인공지능은 특정 기능을 수행하는 단백질을 직접 설계하는 단계로까지 연구 범위를 확장하고 있다.

 

연구팀은 전사인자와 효소를 중심으로 유전자 서열 정보, 단백질 구조 예측, 메타유전체 분석을 결합한 다양한 응용 사례를 소개하고, 향후 연구 방향도 제시했다. 아울러 유전자 기능 발견 과정에서 발생하는 편향과 비효율을 줄이기 위해 인공지능이 실험을 주도하는 능동적 학습 기반 연구 프레임워크의 필요성을 강조했다.

 

능동적 학습은 인공지능이 불확실성이 높은 예측을 스스로 선별해 우선적으로 실험을 제안하고, 그 결과를 다시 학습에 반영하는 방식이다. 이를 통해 제한된 자원으로도 핵심 유전자 기능을 보다 효율적으로 검증할 수 있다. 연구팀은 이를 실현하기 위해 자동화 실험 플랫폼과 바이오파운드리 등 공동 연구 인프라의 통합, 그리고 실험적으로 검증되지 못한 실패 데이터의 공유가 중요하다고 밝혔다.

 

공동저자인 김기배 카이스트 박사는 “딥러닝 기반 예측 성능은 크게 향상됐지만, 예측 결과를 생물학적으로 설명할 수 있는 해석 가능한 인공지능 모델 개발은 여전히 중요한 과제”라며 “인공지능과 실험의 선순환 구조가 유전자 기능 연구의 패러다임을 바꿀 것”이라고 말했다.

 



배너