국내 연구진이 생성형 AI(인공지능)를 신약 설계에 활용할 가능성을 제시했다.
KAIST(카이스트)는 김우연 화학과 교수 연구팀이 단백질·분자 간 상호작용을 고려해 활성 데이터 없이도 표적 단백질에 적합한 ‘약물 설계 생성형 AI’를 개발했다고 18일 밝혔다.
신규 약물 발굴을 위해선 질병의 원인이 되는 표적 단백질에 결합하는 분자를 찾아내야 한다. 기존의 약물 설계 생성형 AI는 특정 단백질의 이미 알려진 활성 데이터를 학습에 활용하기 때문에, 기존 약물과 유사한 약물을 설계하려는 경향이 있다. 이는 신규성이 중요한 신약 개발 분야에서 약점으로 지적돼 왔고, 최초 표적 단백질의 경우 실험 데이터도 적어 기존의 생성형 AI 활용이 어려웠다.
연구팀은 이런 데이터 의존성 문제를 극복하기 위해 단백질 구조 정보만으로 분자를 설계하는 기술 개발에 주목했다. 표적 단백질의 약물 결합 부위에 대한 3차원 구조 정보를 주형처럼 활용, 해당 결합 부위에 맞는 분자를 주조하듯 설계하는 방식이다. 특히 연구팀은 신규 단백질에 대해서도 안정적으로 결합할 수 있는 분자를 설계할 수 있는 기술을 개발하는 데 초점을 뒀다.
연구팀은 설계한 분자가 단백질과 안정적으로 결합하기 위해서는 단백질·분자 간 상호작용 패턴이 핵심 역할을 하는 것에 착안했다. 연구팀은 생성형 AI가 이러한 상호작용 패턴을 학습하고, 분자 설계에 직접 활용하도록 모델을 설계하고 학습시켰다.
이에 따라 기존 단백질 구조 기반 생성형 AI 모델들은 10만개에서 1000만개의 가상 자료를 활용하는 반면 이번 연구에서 개발한 모델은 수천개의 실제 실험 구조만을 학습해도 높은 성능을 발휘했다.
논문 1저자인 정원호 KAIST 화학과 박사과정 학생은 “사전 지식을 AI 모델에 사용하는 전략은 상대적으로 데이터가 적은 과학 분야에서 사용해 왔다”라며 “이번 연구에서 사용한 분자 간 상호작용 정보를 약물 분자뿐 아니라 다양한 생체 분자를 다루는 바이오 분야 문제에 유용하게 적용할 수 있다”라고 말했다.
한국연구재단의 지원을 받아 수행된 연구결과는 국제 학술지 ‘네이처 커뮤니케이션즈(Nature Communications)’ 올해 3월 15호에 게재됐다.
댓글0