“비행기처럼 보편적 도구가 된 인공지능(AI)이 신약 개발 분야에서 필수 기술이 됐지만 AI 성능을 좌우하는 데이터가 특히 바이오 분야에서는 제한적이라 성능 향상에 한계가 있다. 데이터 공유 체계가 필요하다.”
김화종 한국제약바이오협회 연합학습 기반 신약개발 가속화 프로젝트(K-MELLODDY·멜로디) 사업단장이 27일 서울 중구 더플라자호텔에서 아주경제신문 주최로 열린 ‘제14회 글로벌헬스케어포럼’에서 이같이 말했다.
김 단장은 ‘AI 기술과 신약 개발 변화’를 주제로 한 발표에서 신약 개발 분야에선 공유된 데이터가 제한적이라 초거대언어모델(LLM) 같은 파운데이션 모델의 성능을 높이는 데 한계가 있다고 지적했다. 그는 “AI 핵심은 컴퓨팅 역량이나 소프트웨어 자체가 아니라 데이터”라면서 “챗GPT와 같은 일반 LLM을 학습시키는 데이터는 이미 많이 개방돼 있지만 신약 개발 관련 데이터는 제약사들이 내놓지 않으면 접근할 수 없다”고 말했다. 바이오 AI 기술 성능을 높이려면 제약사들이 데이터를 공유하는 체계가 필요하다는 것이다.
그는 데이터 자체를 공유하는 것이 아닌 AI 모델을 공유하는 ‘연합학습’을 제안했다. 연합학습은 여러 기관이 보유한 데이터를 한곳에 모으지 않으면서 AI 성능을 개선하는 것으로, 데이터 공개가 어려운 업계 애로사항을 절충한 방안이다.
김 단장은 “바이오 분야 특성상 데이터 자체를 공개하기는 어렵기 때문에 데이터를 이동하지 않고 머신러닝 모델 파라미터를 각 기관에 이동시켜 데이터를 학습하는 연합학습 방법을 채택하고 있다”고 설명했다. 이어 “우리 정부도 관련 사업을 추진 중이고 이달 중 참여기관 선정 작업에 착수할 것”이라고 밝혔다. 보건복지부와 과학기술정보통신부는 공동으로 K-멜로디 사업을 추진 중이다. 관련 연구개발(R&D)에 5년간 총 348억원의 예산을 투입한다.
글로벌 빅테크 기업들이 AI를 활용한 신약 개발에 뛰어들고 있는 만큼 정통적인 개발 방식은 경쟁력이 떨어질 수 있다고도 경고했다. 알파고를 개발한 구글 딥마인드의 자회사 아이소모픽랩스는 최근 단백질 구조를 예측하고 만드는 ‘알파폴드 3’ 버전을 공개했다. AI칩 선두 주자인 엔비디아도 신약 개발을 위한 생성형 AI 플랫폼을 내놓았다. 신약 개발 전 과정에 AI 기술을 활용하면 개발 기간 단축 등 혁신 가능성이 무궁무진하다고 김 단장은 내다봤다.
이런 상황에서 국내 신약 개발이 활성화하려면 바이오 분야 AI 기술 혁신을 위한 산업계와 정부의 적극적 지원이 필요하다고 강조했다. 김 단장은 “비행기를 만드는 것과 항공·여행업이 별개인 것처럼 (빅테크에 맞서) AI 기술 자체를 개발하기보단 AI를 활용하는 서비스 개발이 중요하다”며 “AI 혁신에 따른 패러다임이 크게 전환되고 있는 시점인 만큼 기회를 잘 활용해야 할 때”라고 힘줘 말했다.
댓글0