변호사 전석진
오랜만에 시간이 나서 코로나바이러스에 관하여 글을 한편 쓰기로 했다. 작년 6월 경인가 보다. 친구들과 언제 코로나바이러스의 해결책이 나올 것인가를 이야기하다가 내가 2021. 말이라고 이야기한 것이 생각난다. 그때쯤 백신과 치료제가 나오리라는 것이 내 생각이었다. 이러한 판단의 근거는 빌 게이츠가 당시 백신 개발과 관련해서 “18개월 안에 최소 하나 이상이 준비될 것이라고 본다"라는 말이었다. 빌 게이츠 재단은 유망한 코로나19 백신 후보물질 7가지를 선정한 후 이에 지원하고 있었는데 이 7가지 중 하나가 성공할 것이라고 본 것이다. 하지만 항상 개발은 지연되기 마련이어서 나는 이 빌 게이츠의 예측에 6개월을 더하여 백신 개발 일정을 말한 것이었다. 물론 이때에는 일하느라 바빠서 깊은 연구를 하지 못하였었다. 그런데 백신 개발이 2020.11.경에 완성된 것이었다. 아마도 모두 놀랐을 것이라고 생각한다. 나도 깜짝 놀랐다. 나는 항상 생각한다. 모든 놀라움의 뒤에는 컴퓨터 기술이 있는 것이라고... 나는 컴퓨터 기술 발전과 코로나 백신과의 관련성을 찾아보았고 이번에도 마찬가지라는 사실을 발견하였다.
2. 백신 개발의 역사 백신을 개발하는 데는 일반적으로 수년 또는 수십 년이 걸렸다. 코로나 백신이 개발되기 전까지의 개발 속도 기록은 1960년 경의 유행성 이하선염 백신개발 기간이었다. 이 백신은 수집된 샘플이 얻어진 후 약 4년 만에 시판 제품으로 전환되었다.
만일 코로나19가 1960년대에 유행하였다면 백신 개발 기간이 4년 정도 걸렸을 것이고 이 기간 중에 인류는 멸망하였을 것이다. 국제 COVID-19 데이터 컨소시엄의 Penn Institute for Biomedical Informatics 소장인 Jason Moore는 코로나바이러스가 20년 전에 감염되었다면 세계가 파멸했을 것이라고 말했다. 가능한 일이다. 그런데 왜 지금은 백신 개발 기간이 이렇게 빨라졌을까? 그것은 인공 지능과 머신 러닝의 기술에 의한 것이다. 코로나 백신을 개발한 모든 제약 회사는 이러한 컴퓨터 기술을 사용하고 있다. 가. 예측 적중 코로나19가 발생했을 때 스위스 바젤 대학의 연구원들은 스위스 모델이라는 단백질 모델링 도구를 사용하여 코로나19 바이러스의 외부 표면에 있는 단백질의 구조를 예측했다. 그들의 예측은 나중에 바이러스의 실제 단백질 구조와 일치하는 것으로 나타났다. 마찬가지로 런던에 본사를 둔 AI 회사인 DeepMind(알파고 만든 회사)는 신경망인 AlphaFold를 적용하여 바이러스의 유전적 서열을 기반으로 SARS-CoV-2 단백질의 3차원 형태를 예측하고 있다. 그리고 이러한 예측들이 온라인상으로 공개가 되고 있는 것이다. 재미있는 것은 음성인식이나 자동 번역에 쓰이는 자연어 처리 기술이 백신 발견에 사용되고 있다는 것이다. 인공 지능이 백신 개발에서 사용되는 분야는 두 부분이다. 하나는 인공 지능이 100만 가지의 화합물을 학습하고 가상의 화합물을 만들어 치료제의 특성에 맞는지 탐구하는 것 등이다. 이런 방법으로 코로나바이러스의 단백질을 차단하는 화합물의 구조를 찾아낸다. 다른 하나는 코로나바이러스에 관한 논문 등을 인공지능이 연구하여 그 결과를 연구자들에게 알려주는 것이다. 세 번째는 코로나바이러스 테스트 키트에 인공지능 기술을 활용하는 것이다. 첫 번째도 중요하지만, 최근에는 두 번째, 세 번째의 중요성이 더 부각되고 있다. AI가 또 다른 첨단 기술과 손잡고 코로나 치료제를 개발하는 사례도 있다. 인실리코라는 신약 개발 업체가 AI로 신약 후보 물질의 분자 구조를 만들면 나노미가 가상현실(VR) 기술로 3차원 구조 형태로 구현해 보완 작업을 하는 것이 그런 것이다.
3. 엄청난 컴퓨터 성능 제공 인공 지능을 이용하여 백신과 치료제를 제시간에 만드는 데에는 엄청난 컴퓨팅 성능이 필요하다. 2020. 3월에 이미 백악관은 "치료 및 백신에 관한 과학적 연구를 신속히 발전"시키기 위해 공공 및 민간단체와 협력하여 전 세계 연구자들에게 가장 강력한 슈퍼컴퓨터에 대한 액세스를 제공할 것이라고 발표했다. 이에 의해 COVID-19 고성능 컴퓨팅 컨소시엄이라고 하는 것이 만들어졌다. 이 프로그램에는 미국 에너지국 국립연구소와 IBM 및 Hewlett-Packard Enterprise와 같은 여러 대학 및 민간 기업의 자원이 함께 제공되고 있다. 아마존 웹 서비스와 인텔도 이 컨소시엄에 컴퓨터 자원을 기부했다. 이 컨소시엄은 코로나19 치료제를 개발하는 프로젝트 87군데에 CPU(중앙처리장치) 코어 680만 개, GPU 5만 개, 600페타플롭(1초당 1,000조번의 수학 연산 처리를 뜻하는 말)의 컴퓨팅 성능을 제공하고 있다. 상상이 가지 않는 컴퓨터 성능인 것이다.
글로벌 IT 기업들도 AI 업체들의 신약 개발에 컴퓨터 자원을 지원하고 있다. 인터넷 가상 서버 업체인 구글 클라우드는 2020. 6월경 연구 회사인 슈뢰딩거에 1,600만 시간 상당의 엔비디아 GPU(그래픽처리장치) 계산용량을 기부했다.
COVID-19에 맞서고 있는 또 다른 슈퍼컴퓨터 기구는 C3.ai DTI (Digital Transformation Institute)이다. 이 기구는 인공 지능 회사 C3.ai와 다양한 학술 기관 및 민간 기업을 통합하여 연구하고 있다. 이 연구소는 공공 및 민간 부문에서 사용할 AI 기술을 발전시키기 위해 운영 첫 5년 동안 4,000억원 이상을 투자할 계획이고, 초기에는 COVID-19 억제에 초점을 맞출 것이라 한다. 이 연구에서 무언가 좋은 것이 나오지 않을 확률은 0이라고 C3.ai의 CEO이자 공동 창립자인 Thomas Siebel은 Times지에 선언하고 있다. 컴퓨터 기술에 관하여 상당한 자신감을 가지고 있는 것이다. 4. 인공 지능의 영역 가. 단백질 구조 찾아내기 백신과 치료제 개발에 사용되는 바이러스 단백질 구조 분석을 보다 빠르고 효율적으로 진행하기 위해 AI 기술을 활용함으로써 임상에 소요되는 시간과 비용을 절약한다.
나. 신약 물질 분자 구조 VR로 3차원으로 만듦 AI가 또 다른 첨단 기술과 손잡고 코로나 치료제를 개발하는 사례는 많다. 지난 3월 홍콩의 AI 신약 개발 업체인 인실리코 메디신(Insilico Medicine)은 미국 샌디에이고의 나노미(Nanome)와 손을 잡고 코로나 치료제 개발을 시작했다. 인실리코가 AI로 신약 후보 물질의 분자 구조를 만들면 나노미가 가상현실(VR) 기술로 3차원 구조 형태로 구현해 보완 작업을 하는 식이다. 다. 인공지능 논문 분석 Allen Institute는 COVID-19에 대한 130,000 개 이상의 학술 논문을 기계 판독 형식으로 제공하는 CORD-19라는 리소스를 개발했습니다. Kaggle 커뮤니티는 다른 그룹 중에서도 데이터 세트를 활용하여 연구원들이 문헌을 따라잡고 우선순위가 높은 연구 질문에 답할 수 있도록 여러 AI 시스템을 만들었습니다. AI는 바이러스성 단백질 구조를 파악해 백신 및 치료제의 성분을 제안하고, 의학 연구진들이 신속하게 수만 건의 관련 연구 논문을 스크리닝하는 것을 돕는 등 두 가지 측면에서 중요한 조력자 역할 수행한다.
인공 지능은 코로나바이러스에 관한 수만 건의 연구 논문을 해석하고, 이 과정의 결과를 시각적으로 접근하고 쉽게 분석하고 해석할 수 있는 형태로 생물학자들에게 제시하고 있다. 인공지능은 이점에 있어서는 본질적으로 컴퓨터 기반의 '독서 기계(reading machine)'이다. 라. 테스트키트에서의 인공 지능 기술 우리나라에서는 인공지능이 바이러스의 유전적 구성을 기반으로 한 테스트 키트를 설계하는 데 필요한 시간을 보통 2 ~ 3개월이 걸리는 것을 몇 주로 줄이는 데 도움이 된 것으로 알려졌다. 생명공학 회사인 Seegene은 자동 테스트 개발 시스템을 사용하여 테스트 키트를 개발하고 널리 배포했다고 한다. 5. 정보의 공유 이번 코로나바이러스 백신의 개발에 또 하나 크게 기여한 것은 정보의 공개이다.
가. 정보 온라인 저장소에의 공개 지난 10개월 동안 전 세계 환자에서 채취 한 수만 개의 COVID-19 바이러스 샘플이 유전적으로 서열화되어 독일의 인플루엔자 데이터 공유에 대한 글로벌 이니셔티브(GISAID)가 호스팅하는 온라인 저장소에 업로드되었다. 막대한 양의 정보가 공유되는 것이다.
팬데믹 시대에 안전하고 효과적인 COVID-19 백신에 대한 대처 방법이 그때그때 빠른 시간 내에 발견될 수가 있으려면 관련 정보들이 General Public License(GPL: 오픈 소스의 라이선스 방식)와 유사한 방식으로 정보의 라이선스를 받게 하는 것을 고려해야 한다. 일부 제약 회사, 중앙 정부, Bill & Melinda Gates Foundation과 같은 비영리 단체 및 백신 개발을 지원하는 Coalition for Epidemic Preparedness Initiatives와 같은 국제기구는 지적 재산 보호보다는 개방성과 공유를 포용하는 정책을 시행하고 있다. 이것이 올바른 방향의 정책이다. 물론 모더나 사의 경우와 같이 국가와 회사가 일정한 방식으로 특허권을 인정하는 것이 연구개발을 촉진할 것이라는 견해도 있을 수 있다. 나. 전례없는 속도로 공유 최근 들어 COVID-19 퇴치를 위한 연구 간행물, 소프트웨어 및 데이터는 전례없이 빠른 속도로 실시간으로 공유되고 있다 한다.
최근 케임브리지 대학교와 서울 대학교 간의 협력으로 완전한 스파이크 단백질의 최초의 전체 원자 모델이 탄생했는데 이것도 오픈 소스 방식으로 공개되었다. 다. 미국 모더나의 사례 예를 들어, 3상 시험에서 백신을 보유한 Moderna 회사는 약 1조원 상당의 계약을 체결했다. 이와 같은 계약은 일반적으로 기술을 공개하지 않고 발명 회사에 제품 특허에 대한 독점 라이선스를 부여하는 1980년 Bayh-Dole 법이 적용된다. 그러나 이 법은 또한 "합리적인 조건"에 따라 특허 발명품이 대중에게 공개되지 않을 경우 연방 정부가 독점 라이선스를 철회할 수 있는 보호 장치를 가지고 있다. 이는 정보 공개와 특허권에 의한 정보의 독점적 사용을 조화시키는 방식이다.
6. 인공 지능에 의한 백신 부작용 연구 백신에 관한 부작용 연구도 인공 지능에 의해 행해지고 있다. 가. 부작용 우려에 의한 정책 결정 영국에서 일찍 백신을 접종시키는 결정을 한 것은 AI의 도움이 컸다. 우리나라는 이러한 정보에 둔감했기 때문에 접종 시기를 늦게 잡은 것이다.
코로나 치료 발견의 핵심 측면은 안전성과 신뢰성이다. 백신 이상 반응보고 시스템 (VAERS)과 백신 안전 데이터뱅크 (VSD)는 백신의 안전성을 추적, 기록 및 예측하기 위한 가장 인기 있는 시스템이다. 이 시스템들로 인하여 백신의 안전성과 효능 평가 간의 균형을 크게 개선했다.
신약 개발의 경우 신약 개발과정에서 생산되는 최종 신약 후보는 사람이 섭취하기에 안전해야 한다. 이를 위해서는 약물의 부작용을 관찰하고 약물이 독성이 없음을 확인해야 한다. 이를 달성하기 위해 21세기 독성학 프로그램 (Tox-21)은 70개의 스크리닝 분석에서 10,000개 이상의 화합물을 스크리닝하여 독성 모델링을 용이하게 하는 데 사용할 수 있는 데이터베이스를 생성했다. 그리고 이러한 데이터베이스 자료를 인공지능이 사용하여 부작용을 예측하고 있는 것이다. 그 결과는 이번 백신들이 매우 낮은 거의 무시할 만한 부작용만을 가지고 있다는 것이다.
미국의 미국 질병통제예방센터(CDC)는 2020.12. 23. 미국 제약사 화이자와 모더나의 코로나19 백신을 접종한 미국인 190만명에 대한 자료를 공개했다. 이 중에서는 21명이 아나필락시스 반응을 보였다. 100만명당 11.1명 꼴로 경미한 부작용이 있었고 목숨을 잃은 사람은 없었다. CDC는 대부분의 사람에게 코로나19 백신의 위험은 낮다고 부연했다. 인공 지능에 의한 부작용 회피 백신 개발이 효과를 보고 있는 것이다.
영국의 의약청(Medicines and Healthcare products Regulatory Agency ;MHRA) 대변인은 Healthcare IT 뉴스에 다음과 같이 말했다.“I / II 상 시험에서 발표된 보고서에 따르면 현재 COVID-19 백신에 대한 특정 안전 문제를 예상하지 않고 있으며 일반 안전 프로필이 다른 백신과 유사할 것으로 예상한다고 하고 있다. 영국이 제일 먼저 백신을 배포한데는 안전성에 대한 확신이 컴퓨터 기술에서 보장된다는 점을 알았기 때문이다. 현 정부 놓친 것은 이번 백신들이 부작용 방지까지를 인공지능이 미리 감안하여 백신이 만들어졌다는 사실을 인식하지 못한 것이다. 부작용을 보아가면서 접종 시기를 결정하겠다고 하면서 조기 접종을 하지 않기로 한 것은 컴퓨터 기술의 최신 전개 사실을 감안하지 못한 정책의 실패이다.
인공 지능 기술은 암 백신분야에도 혁명을 가지고 왔다. 이번에 코로나바이러스 백신 개발에서 획득된 기술들은 빠른 시간 안에 암을 정복할 수 있게 할 것으로 예상된다.
7. 결론
인류는 코로나19로 엄청난 위기를 겪었다. 그러나 미래는 이 경험을 기초로 특히 이번 백신 개발과정에서 개발된 여러 가지 인공 지능 기술을 기반으로 훨씬 더 나아질 가능성이 있다. 인공 지능 기술은 최근 암 진단기술을 비약적으로 발전시키고 있다. 암 진단 기술과 이번에 코로나 백신 개발과정에서 개발된 기술에 의한 암의 정복은 생명공학이 죽음으로부터의 탈출 속도(Longevity Escape Velocity)를 달성하는 데 큰 기여를 할 것이다. 생명공학 기술이 위 속도에 다다를 시간은 (레이 커즈와일의 견해에 의하면) 이제 10년이 남았다.
Yorumlar