환자를 모집하고 임상시험을 진행할 때는 모집단을 최대한 정확하게 대표할 수 있게끔 대상자를 등록하는 게 좋습니다. 물론 말처럼 쉽지는 않습니다. 임상시험을 위한 환자를 모집하는 건 까다로운 일입니다. 다양성을 위해 실제 인구통계를 정확하게 반영하도록 대상자 집단을 구성하는 일은 더욱 어렵습니다. 임상시험에서 부적절한 인구 구성은 오랫동안 해결하지 못한 과제입니다(Tufts University, 2022). 시험군을 다양하게 구성하지 못하면 의약품 승인 가능성이 낮아지고, 개발 프로세스가 전체적으로 지연되거나 중단될 수도 있습니다.
생성형 AI로 구성한 합성 임상시험 데이터가 이러한 과제의 해결책이 될 수 있습니다. 라이프사이언슨 업체들은 생성형 AI와 합성 데이터를 활용하여 기존 데이터를 보강하고 다음과 같은 효과를 기대할 수 있습니다.
- 임상시험 샘플에서 대표성이 낮은 그룹을 합성 데이터로 업샘플링하고, 데이터 세트를 전체 모집단에 유사하게 보강하여 시험 결과를 일반화할 수 있도록 합니다.
- 더욱 빠르고 정확한 임상시험 프로그램을 생성하여 의뢰자의 비용을 절약하고 환자와 기관의 시험 부담을 줄입니다.
- 다양한 임상시험 시나리오와 설계를 모델링하여 가장 효과적인 방법으로 임상시험 프로그램을 진행합니다.
Medidata Simulants는 목적에 맞는 생성형 AI 알고리즘으로, 임상 개발을 위한 합성 데이터를 생성하며, 의뢰자에게 의약품의 효과에 대한 정보를 제공하는 한편, 환자와 의뢰자의 프라이버시를 보호합니다.
고충실도 합성 데이터를 이용하면 아직 의학적 요구가 충족되지 않았고 현실 데이터와 자료로는 적절하고 심층적인 정보를 확보할 수 없는 적응증에서 기존 데이터 세트를 보강할 수 있습니다. 기업들은 이러한 데이터 세트를 통해 어떤 대상자에게서 이상반응이나 기타 부정적 문제가 발생할지 선제적으로 파악할 수 있으며, 그에 맞는 조치를 취할 수 있습니다.
생성형 AI는 환자 차원의 데이터를 보강할 뿐만 아니라, 의뢰자의 데이터를 기반으로 유용한 인사이트를 제공합니다. 이제 정확히 어떤 기관을 선택하고 어떤 환자를 등록할지 파악하느라 시간과 비용을 낭비할 필요가 없다는 뜻입니다. 앞으로는 생성형 합성 데이터/보강형 데이터 세트로 시험기관, 환자 인구 구성 등에 대한 인사이트를 확보할 수 있기 때문입니다.
이미 임상시험에 생성형 AI를 도입하여 데이터를 성공적으로 보강한 사례가 있습니다. 또 어떤 혁신이 우리를 기다리고 있는지 더욱 기대되는 이유입니다(NIH, 2024).