[인터뷰] 단백질 구조 예측 AI ‘로제타폴드’ 주인공…백민경 서울대 생명과학부 교수
“한국이 노벨상을 배출하려면 ‘원조(오리지널리티·originality)’격 연구를 키워야죠. 지금 당장 꽃 피우진 못하더라도 10년, 20년 뒤 토대가 될 작은 씨앗 연구를 지원해야 합니다.”
화학을 너무 좋아해 화학도가 됐지만 정작 화학 실험은 체질에 맞지 않아 대안으로 컴퓨터 프로그래밍을 독학했고 약 3년 후 단백질 구조 예측 AI(인공지능)인 ‘로제타 폴드(RoseTTAFold·RF)’를 세상에 내놓은 백민경 서울대 생명과학부 교수(34)의 이야기다.
그가 제1저자로 개발을 주도한 로제타폴드는 2021년, 국제 학술지 ‘사이언스’가 꼽은 ‘최고의 혁신 연구성과’로 등재됐다. 이런 성과를 이룬 건 한국인 중 백 교수가 처음이다. 그와 함께 로제타폴드를 연구한 데이비드 베이커 미국 워싱턴대 교수는 단백질 구조의 예측·설계 이론에 대한 성과를 인정받아 지난 9일 노벨화학상 수상자로 선정됐다.
백 교수는 10일 머니투데이와의 전화 인터뷰에서 “AI가 단백질 구조를 정확히 예측해낼 거라곤 처음엔 아무도 믿지 않았다”고 했다. 단백질은 신체를 구성하는 핵심 유기물로, 인체에 발생하는 대부분의 질병은 단백질의 구조와 상호관계를 분석해 원인과 해결책을 찾을 수 있다. AI가 등장하기 전까진 사람이 직접 실험과 계산을 통해 단백질의 구조를 분석했다. 하지만 수많은 아미노산이 복잡한 사슬로 얽혀있는 탓에 단 한 개를 분석하는 데에도 짧게는 6개월, 길게는 10년이 소요됐다. 백 교수가 개발한 로제타폴드는 이같은 과정을 ‘수 분’으로 단축했다. 예측 정확도는 90% 이상이었다.
백교수가 로제타폴드 연구를 위해 한 것은 ‘무작정 코딩 독학’이었다. AI를 신약 개발에 적용하려는 시도가 막 시작되던 시기여서 실현된 사례나 가이드라인이 전혀 없었기 때문이다. 백 교수는 “처음엔 일주일에 걸쳐 AI의 기초개념을 가르쳐주는 ‘AI 서머스쿨’ 프로그램에 등록했는데, 머신러닝이니 딥러닝이니 하는 것이 대체 신약 개발과 어떻게 접목되는지 모르겠더라”며 “독학이 유일한 길이었다”고 했다.
미국으로 건너가 데이비드 베이커 교수의 연구실에서 박사후연구원을 시작했을 때도 ‘외로운 배움’은 이어졌다. 백 교수는 “코딩을 하면서도 이게 맞는 방향일까, 다르게 할 방법은 없을까를 내내 고민했다”고 회상했다.
그러던 2020년, 또 다른 노벨화학상 수상자인 구글 딥마인드 연구팀이 단백질 구조 예측 AI ‘알파폴드2’를 공개했다. 10년 걸리던 단백질 예측을 30분으로 줄였다는 소식이었다. 백 교수는 당시 “온갖 생각이 다 들더라”라면서 “난 아직 아무것도 내놓지 못했는데, ‘내 일자리가 이대로 사라지는 건가’하는 위기감이 엄습했다”고 했다.
동시에 그들의 비법이 궁금했다. 그는 “알파폴드가 성공했으니 AI로 단백질을 해독하려는 내 접근이 최소한 틀리지는 않았다는 게 입증된 셈이었고, 그때부터 뒤도 돌아보지 않고 연구에 매진했다”고 떠올렸다. 그렇게 2020년 12월 백 교수와 베이커 교수를 포함한 3명의 연구자가 AI 개발에 본격적으로 달라붙었고, 4개월만에 학술지에 게재할 수준의 성과로 로제타폴드 첫 버전을 내놨다.
베이커 교수 연구실은 로제타폴드의 성공을 기반으로 2022년 단백질 구조 예측을 넘어 원하는 대로 단백질을 설계하는 AI ‘로제타폴드 디퓨전’을, 올 3월에는 생체 분자 대부분을 설계하는 AI ‘로제타폴드 올 아톰’을 공개했다. 그 기반에는 백 교수가 거친 지난한 독학의 시간과 고군분투가 있었다.
백 교수는 2022년 7월 한국에 돌아와 현재 서울대 생명과학부에서 학생들을 가르친다. 그는 “베이커 교수가 노벨화학상을 수상한 건 AI를 개발했기 때문이 아니라, 20여년에 걸쳐 단백질 설계 연구를 해 온 이 분야의 ‘원조’이기 때문”이라며 “노벨상은 여전히 어떤 연구의 원류(原流), 즉 ‘오리지널리티(originality)’를 가장 중요하게 생각한다”고 했다. 그러면서 “한국이 노벨상을 배출하기 위해선 아직 아무도 검증해본 적 없는, 가장 새로운 연구에 도전해야 한다”고 덧붙였다.
백 교수는 “한국의 연구 과제는 해외에서 이미 많이 하는 연구나, 이미 뜨기 시작해 활용 단계로 접어든 연구에 집중하는 경향이 있다”며 “짧은 시간 내에 성과가 나오지 않고 지금 당장 지원금이 적더라도 10년, 20년 뒤 연구의 토대가 될만한 ‘씨앗 연구’를 지원하는 환경이 돼야 한다”고 제언했다.
댓글0