top of page

[인간·공감·AI]①신종 감염병의 시대, AI가 데이터를 들여다보기 시작했다

기사 원본: http://dongascience.donga.com/news/view/34798

출처: 동아사이언스

신약 1종 개발에 10~15년, 연구비만 1조 넘어

신약개발, 질병 예측에 뛰어드는 AI

빅데이터 AI 기반 신약개발 플랫폼 공개

신약개발과 질병 예측, 생명과학 연구 풍경이 데이터와 인공지능(AI) 기술의 활발한 발전으로 크게 바뀌고 있다. 컴퓨터를 이용한 알고리즘을 개발하고 신약개발 전과정에 AI를 활용하기 위한 시도들이 늘면서 병원과 기업에서도 적극적으로그 결과를 활용하고 있다. 최근처럼 병의 진단이나 치료, 예방을 위한 기술이 급히 필요한 신종 감염병 시대에도 큰 활약을 할 것으로 기대된다. 사진은 AI 기술을 이용해 신약개발을 하는 남호정 광주과학기술원(GIST) 교수 연구실 연구원들이 컴퓨터로 연구를 하는 모습이다. 동아사이언스 제공

지난달 24일 방문한 광주과학기술원(GIST) 전기전자컴퓨터공학부의 연구실에는 책상마다 여러 대의 모니터와 노트북이 가득했다. 화면마다 데이터베이스나 코드가 빼곡했다. 전형적인 컴퓨터과학과의 연구실 같았다. 하나 다른 점이 있다면 이들이 다루는 코드나 데이터는 생명과학의 빅데이터인 아미노산 서열이나 게놈(유전체, 생명이 지닌 DNA의 총체) 등 생명정보였다는 점이다. 이들은 인공지능(AI)를 이용해 신약을 개발하거나, 질병을 예측하고 생명정보를 분석하는 알고리즘을 개발하고 있었다. AI가 보건과 의학, 생명과학 분야에 깊이 침투한 사례다. 남호정 GIST 전기전자컴퓨터공학부 교수와 이현주 AI대학원 교수의 연구실 풍경이다.

AI 기술이 활발히 발달하면서 일상 곳곳의 풍경을 크게 바꾸고 있다. 그 가운데 가장 큰 변화를 겪고 있는 분야 중 하나는 의생명과학 분야다. 시약과 배양액 냄새가 물씬 나는 실험실과 실험을 기다리는 동물을 돌보는 케이지, 흰 가운을 입고 장갑을 낀 연구원 등 전통적인 연구실이 아닌 곳에서도 연구가 활발히 이뤄지고 있었다. 빅데이터인 생명정보를 이용해 진단부터 신약개발까지 다양한 분야에 AI가 스며들면서부터다.

●지난한 신약 개발 과정, AI로 획기적으로 단축

지난달 28일 최기영 과학기술정보통신부 장관이 참석한 간담회에서 한국파스퇴르연구소와 한국화학연구원은 신종 코로나바이러스 감염증(COVID-19·코로나19)의 치료제를 발굴할 계획을 밝혔다. 파스퇴르연구소는 2500개 치료제 후보물질과 화학연의 화합물라이브러리가 제공한 2500종의 후보물질을 분석해 코로나19의 치료제를 찾아낼 계획이라고 밝혔다. 화학연 역시 시판되는 약물 1500개를 코로나19 치료에 활용할 수 있는지 분석할 계획이다.

이들은 기존에 이미 알려진 약물을 다른 새로운 병의 치료에 활용하는 ‘약물재창출’을 통해 전세계적으로 확산 중이지만 아직 백신과 치료제가 없는 코로나19에 대항하겠다는 계획이다. 약물재창출은 기존에 허가를 받았거나 임상시험 중인 약물에서 다른 효능을 찾는 신약 개발 기법으로, 심혈관 치료제로 개발되던 비아그라를 발기부전 치료제로 전환한 게 대표적인 사례다.

전통적으로 이 과정은 실험실에서 이뤄졌다. 질병을 제어하는 데 중요한 역할을 하는 표적 단백질을 찾고, 실제 화합물을 직접 결합시켜 봐야 치료제로 활용할 가능성이 있는 초기 화합물을 찾을 수 있다. 초기 화합물은 치료제 사용 가능성이 있는 일종의 후보물질로, 이 물질은 다시 구조를 최적화하는 과정을 거쳐야 한다. 이렇게 여러 과정을 거쳐 선별된 후보물질이 비로소 동물실험을 통해 안정성과 약효를 입증할 자격을 받는다. 동물실험을 통과하면 최소 세 번의 임상시험을 통해 사람에게 썼을 때 나타날지 모를 위험성을 점검하고 효과를 검증한다. 이 과정을 모두 통과하는 화합물은 극히 드물며 전체 과정은 10~15년이, 비용은 1조 원 이상 든다. 신약개발이 막대한 비용과 시간, 인력이 필요한 까닭이다.

이런 사실은 코로나19처럼 새로 등장한 감염병을 치료할 치료제를 개발할 때 특히 문제가 된다. 이 때문에 최근 컴퓨터과학자를 중심으로 새로운 기술이 시도되고 있다. 인공지능(AI)를 활용해 신약 후보물질을 찾거나 기존 약물의 용도를 재창출하는 기술이다.

신약개발 과정에 AI를 도입하는 연구를 하고 있는 남호정 GIST 교수가 대표적인 연구 결과를 보여주는 모니터 앞에 섰다. 단백질 FKBP12과 MAPKAPK2를 AI로 해석해 화합물이 더 잘 결합하는 지역을 예측했다. 붉은색으로 갈수록 결합이 강한 지역이다. 이 연구 결과는 한국화학연구원 등과 함께 빅데이터 및 AI 기반 신약개발 플랫폼으로 구축됐다. 동아사이언스 제공

남호정 광주과학기술원(GIST) 전기전자컴퓨터공학부 교수는 이 새 분야를 선도하는 대표적 학자 중 한 명이다. 남 교수는 “표적 단백질을 찾는 과정부터 초기 화합물을 찾는 과정, 최적화, 약물재배치 등 신약개발의 모든 단계에 각각 AI가 활용되는 시대”라며 “임상시험 통과 확률을 높일 수 있도록 최적의 임상시험군을 선별하거나, 여러 약을 동시에 복용했을 때 나타날 수 있는 약효의 변화를 예측하는 데에도 AI가 활용되고 있다”고 말했다.

AI 신약개발은 이미 일상에 바싹 다가서 있다. 해외에선 이미 AI 신약기업이 많이 등장했다. 존슨앤존슨이나 화이자 등 대형 제약사는 IBM 등과 신약개발 발굴에 사용되는 AI 개발에 나섰다. 미국 정부는 국립보건원(NIH)과 주도로 GSK 등 글로벌 제약사가 참여하는 ATOM 컨소시엄을 구축해 항암제 신약 후보물질 발굴기간을 1년 이내로 줄이는 연구를 2017~2019년 했다. 일본 역시 이화학연구소 중심으로 '라이프인텔리전스컨소시엄'을 2017년 만들어 AI 신약개발 프로그램을 개발 중이다. 일본제약공업협회는 AI 기술의 도입으로 신약개발 기간을 10년에서 3~4년으로, 비용은 1200억 엔(1조 3280억 원)에서 600억 엔(6640억 원)대로 줄일 수 있을 것이라고 내다보고 있다.

이번 신종 코로나바이러스(코로나19) 사태에서도 AI가 대응하고 있다. 영국의 버네벌런트AI는 임상시험 환자에게 코로나바이러스 환자에게 신약 후보물질이 효과가 있는지 확인하는 임상시험에 AI를 도입할 수 있다고 2월 밝혔다. 미국 기업 인실리코 메디슨은 AI를 이용해 코로나바이러스의 감염을 막기 위한 후보물질을 발굴했다고 발표했다.

국내에서도 지난해 AI 신약개발 개발회사로서는 최초로 코스닥에 등록한 신테카바이오가 있다. 이 회사는 AI를 이용해 단백질 표적과 잘 결합하는 화합물 후보를 발굴하고 최적의 임상시험군을 유전체 데이터를 기반으로 선별하는 기술을 보유하고 있다.

●단백질 구조 몰라도 서열정보만으로 신약 후보물질 선별...세계 최초 플랫폼도 공개

카르복시펩티데이스 B2 단백질과 상호작용할 것으로 예측된 화합물 정보가 AI 신약개발 플랫폼에 표시된 모습이다. 한국화합물은행 제공

남 교수 역시 다양한 분야에 AI를 활용하기 위해 연구하고 있다. 최근 가장 대표적인 성과 중 하나는 표적 단백질의 구조를 알 필요 없이 단백질을 구성하는 아미노산 염기서열 만으로 표적 단백질과의 결합력을 예측할 수 있는 AI다. 기존에는 단백질의 구조를 알아야 화합물과의 결합을 예측할 수 있었지만, 단백질 구조 파악에는 시간과 비용이 많이 들어 아직 밝혀지지 않은 표적 단백질이 많다는 한계가 있었다.

남 교수팀의 기술은 구조를 파악할 필요가 없어 기존에 구조가 밝혀지지 않은 단백질을 대상으로도 사용할 수 있다. 남 교수는 “화학자나 생명과학자들은 구조를 반영하지 않는데 이 기술이 제대로 작동할지 걱정도 많이 했다”며 “하지만 직접 화학자, 생명과학자와 검증한 결과 기존보다 월등한 정확도로 결합을 예측한다는 사실을 확인했다”고 말했다.

2만4000개의 약물 표적 데이터로 실험한 결과 예측 정확도는 80% 이상이었고 후보 물질 발굴 효율도 높았다. 예를 들어 많은 약이 표적으로 삼는 대표적 체내 단백질인 G단백질연결수용체(GPCR) 계열을 대상으로 데이터 상의 15만 종의 화합물을 결합시키며 초기 활성물질로서의 가능성을 예측한 결과, 이 가운데 43개를 추릴 수 있었다. 안진희 GIST 화학과 교수가 이들을 실험한 결과, 그 가운데 8개가 신약 후보물질이라는 사실을 확인할 수 있었다. 43개 중 8개면 약물 발굴 확률이 19%에 달한다. 남 교수는 “GPCR과 결합하는 후보 화합물을 찾는 기존 다른 기술의 발굴 확률인 0.1%를 크게 웃도는 수준”이라고 말했다. 그 외에 효소인 키나제 계열 단백질과 결합하는 후보약물 발굴 확률도 2% 수준에 이르는 등 높은 예측력을 발휘했다.

남호정 교수 연구실의 연구원이 한 자리에 모였다. 신약개발의 전 과정을 개선시킬 수 있는 다양한 AI 기술을 연구 중이다. 동아사이언스 제공

이 기술은 현재 화학연, 한국화합물은행, 경상대와 함께 ‘빅데이터 AI 기반 신약개발 플랫폼’으로 개발해 올해 초 공개한 상태다. 화합물의 효능과 독성 등 주요 연구데이터를 포함한 관계형 데이터베이스로, 여기에 기계학습과 인공신경망기술을 접목해 화합물 정보와 약물-표적 상호작용 예측, 독성 예측 등의 AI서비스를 제공한다. 화학연이 15만 종의 한국화합물은행 공개 화합물 활성실험 정보를 빅데이터 플랫폼으로 제공하고, 여기에 남 교수팀의 약물-표적단백질 상호작용 AI 학습 및 예측 기술과 이화여대 및 경상대의 독성예측 기술이 접목됐다.

누구나 15만 건 이상의 단백질 서열 정보를 활용해 단백질과 화합물 사이의 상호작용을 연구할 수 있다. 화합물이나 단백질 정보를 모아 놓은 단순한 데이터베이스는 해외에도 많이 있지만, 가능성 있는 후보 화합물을 추리도록 구축한 AI 기반 국가 플랫폼은 처음이다.

남 교수는 발굴한 초기 화합물을 최적화하는 과정에도 AI를 활용하는 연구를 하고 있다. 예를 들어 어떤 약의 경우 심장 부정맥을 발생시킬 수 있다. 화합물이 심장 독성을 지닌 경우인데, 기존에는 어떤 약물이 독성이 있는지 여부를 파악하는 수준이었다. 하지만 남 교수는 약물의 구조 정보를 이용해 약물의 어떤 부분이 독성을 일으키는지까지 구체적 구조까지 확인할 수 있는 딥러닝 기술을 개발했다.

컴퓨터과학자인 남 교수는 AI와 생명과학을 접목한 연구를 하는 국내 초창기 학자 중 한 명이다. 그는 “교수로 처음 임용된 2013년만 해도 AI를 접목한 연구를 낯설어 하는 한국의 의생명과학 분야 전문가들이 있었지만 최근 몇 년 사이에 인식에 큰 변화가 일어나 이제는 중요성을 많이 인식하고 있고 협업도 활발하다”고 말했다. 남 교수는 “의생명과학 분야에서는 AI가 활용할 각종 데이터가 확보되고 있다. 데이터의 성질을 활용해 어떤 문제를 풀어야 할지 문제의식이 있다면 그게 맞는 데이터를 확보해 다양한 결과를 낼 수 있다는 게 AI 연구의 장점”이라고 말했다.

bottom of page