Evidence Generation에서 AI와 빅데이터의 역할
인공 지능과 빅데이터는 임상시험 방식을 크게 바꿔 놓을 수 있습니다. 의뢰자와 CRO는 AI와 첨단 분석 기술로 임상시험을 계획할 때 불확실성을 줄일 수 있습니다. 이는 곧 출시 기간 단축과 위험 저감, 비용 절감, 환자 부담 경감을 의미합니다.
이번 포스트에서는 AI와 빅데이터 그리고 임상시험과의 관계에 있어 주요한 질문들을 몇가지 해 보았습니다.
최근 1~2년 사이 데이터와 근거 생성은 어떻게 발전했습니까?
10년 전만 해도 “실제 임상 데이터”, 또는 RWD라는 말 자체가 없었습니다. 지금은 규제 당국이 나서서 (21세기 치료법과 같은 주요 입법을 통해) RWD를 이용해 질병과 치료제에 대한 이해도를 높이고 있는 상황입니다.1
AI가 중심이 된 신약 개발이 탄력을 받으면서 이제는 임상시험의 엄격함을 유지하고 전체를 관리하면서도 그 계획에 RWD를 어떻게 적용할 것인가가 해결 과제로 떠올랐습니다.
이것은 Medidata에서 지난 2년간 고민하던 문제이기도 합니다. Medidata는 코로나 기간에 환자별 임상시험 데이터와 RWD를 연계하는 솔루션 Medidata Link을 개발했습니다. 처음에는 이 제품을 코로나 백신 제조사에게 적용하여 시간이 지나도 백신이 안전하고 효과가 있을지 판단하는 목적으로 이용했습니다. 이 같은 장기 연구는 향후 임상시험 데이터 수집의 발전에 큰 기여를 할 것입니다.
그 외에 고품질 근거를 생성하는 데 장애물과 해결 과제가 있다면 무엇일까요?
가장 근본적인 애로사항은 데이터와 분석은 발전하고 있는데 기술과 규제가 따라오지 못하고 있다는 점입니다. 여러 치료 분야를 망라했을 때, 1상에서 승인 받을 확률은 10%도 되지 않습니다.2 이렇게 높은 실패의 원인은 효능을 입증할 임상시험 데이터가 없다는 점입니다. 규제 당국에서 말하는 결함 있는 연구 설계나 부적절한 통계 평가지표를 제출하는 기업이 부지기수입니다. 즉 시험에 검정력이 부족하며, 샘플이 너무 작아 귀무가설을 기각하지 못한다는 뜻입니다.
임상시험을 설계할 때에는 매우 많은 것을 고려해야 합니다. 일차 평가지표와 이차 평가지표는 무엇일까? 포함 기준과 제외 기준은 어떻게 선택할까? 대조약은 무엇으로 할까? 결과는 어떻게 해석해야 할까? 작용 메커니즘은 어떻게 해석해야 할까? 이 외에도 동시에 선택하고 결정해야 할 것들이 아주 많습니다. 이 때 대부분은 RWD에 의존합니다. RWD로 간극을 일부 메울 수는 있지만, 의뢰자가 고민해야 할 것도 많습니다. 데이터는 어떻게 수집할까? 어디서 왔는지 어떻게 검증할까? 이 데이터를 신뢰할 수 있을까?
Medidata는 RWD를 제대로 이용하는 법을 연구하면서 동시에 앞서 말한 임상 문제를 해결하고자 노력하고 있습니다. Medidata 플랫폼에서 진행된 28,000회가 넘는 임상시험에서 나온 임상시험 데이터세트를 이용해 RWD에 컨텍스트를 부여합니다. Medidata에서 살펴본 바로는 이 방식을 적용했을 때 환자가 치료에 어떻게 반응하는지 파악하고 데이터 중심의 시험계획서를 작성하기도 편리해 통계 분석이 개선되는 효과가 있었습니다.
업계에서는 어떻게 이 신종 데이터를 이용해 치료 속도와 효과를 높이고 있습니까?
Medidata는 세 영역에서 기업들이 이 신종 데이터를 이용하도록 돕고 있습니다. 첫째는 개발 프로세스 전역에서 과거 임상시험 데이터를 적용해 의사결정을 개선하고 6~12개월 시험 기간 연장으로 이어지는 시험계획서 수정을 지양하며 규제에 부합하는 높은 품질의 산출물을 도출하는 것입니다. 두 번째는 희귀 질환이나 단일군 시험 등에서 과거 임상시험 데이터를 이용하는 Synthetic Control Arm®으로 기존 대조군을 증강하거나 대체하는 것입니다. 세 번째는 Medidata Link로 임상시험과 현실 세계 간 간극을 메우는 것입니다.
일례로, Medidata는 안전성 문제가 자주 불거지는 키메릭 항원 수용체 T세포 치료(CAR-T) 분야에서 여러 기업과 협업하고 있습니다. CAR-T에서는 과거 임상시험 데이터세트를 적용하여 머신 러닝 알고리즘을 만든 후 이것으로 중대한 이상반응이 언제 발생할지 예측합니다. 최근에는 Cleveland Clinic과 함께 CAR-T 치료에서 환자를 사망에 이르게 할 만큼 심각한 이상반응으로 꼽히는 사이토카인 방출 증후군을 최대 90% 정확도로 예측할 수 있는 모델을 개발했습니다.3 이 데이터를 계기로 이상반응에 취약한 환자를 AI로 가려내는 법, 임상시험에서 불필요한 사망이나 이상반응을 예방하는 법 등 Medidata의 연구 분야가 크게 늘었습니다.