생성형 AI를 활용해 오늘날의 임상시험을 가속화하는 방법
2024년에도 생성형 AI는 계속해서 전 세계적인 화두로 등장하고 있으며 점점 더 많은 산업에서 이 기술을 빠르게 도입하고 있습니다. 하지만 생성형 AI가 지닌 막대한 잠재력에도 불구하고 이 기술의 역량과 고유한 특성을 이해하지 못한 많은 이들에 의해 도입이 가로막히는 경우도 있었습니다.
헬스케어 및 생명과학 산업은 생성형 AI가 가장 큰 영향력을 발휘할 수 있는 영역에 속합니다. “MGI(McKinsey Global Institute)의 추정에 따르면 이 기술이 제약 및 의료 제품 산업에서 창출 가능한 경제적 가치는 연간 600억~1,100억 달러에 달합니다. 신약 후보를 위한 화합물 식별 프로세스를 가속화하고, 개발 및 승인 기간을 단축하며, 시판 방식을 개선하여 생산성을 높일 수 있다는 것이 주요 원인입니다” (McKinsey, 2024).
오늘날 생명과학 산업에서 활용할 수 있는 가장 강력한 단일 도구로는 합성 데이터가 있습니다. 합성 데이터는 환자의 개인정보를 보호하는 알고리즘에 의해 생성되는 고충실도 데이터입니다. 합성 데이터는 수 많은 적용 분야를 자랑합니다.
시험계획서(프로토콜) 설계 개선
합성 데이터와 생성형 예측 모델링을 이용해 시험계획서 설계를 개선하는 조직은 의사결정의 속도 및 품질을 향상시킴으로써 임상시험 일정을 단축하는 동시에 임상시험 성공 확률도 높일 수 있습니다. 또한 합성 데이터를 활용해 유사 계열 약물을 대상으로 실시한 과거 임상시험을 기반으로 각 환자 하위 집단의 결과를 시뮬레이션하여 환자 결과를 예측하고 해당 임상시험의 매개변수를 정제할 수 있습니다. 생성형 AI를 이용한 보다 강력하고 조정 가능한 시험계획서 설계는 임상시험의 안전성 및 효율성 증대로 이어져 궁극적으로 임상시험의 성공 확률을 높입니다.
합성 데이터와 생성형 모델링은 임상시험의 안전성 및 효율성 증대 외에도 평가지표의 공정한 판단을 통해 데이터 무결성 및 정확성을 개선하고 임상시험 내 잠재적 편향을 없애기 위한 프로세스인 평가지표 판정 개선에 도움을 줍니다. 합성 데이터세트를 이용해 이러한 프로세스를 간소화함으로써 의사결정 속도를 높이고 임상시험의 전반적인 효율성을 높일 수 있습니다.
데이터 강화
데이터 보강 또는 기존 임상시험 데이터세트의 강화를 통해 모델의 효과 및 일반화 정도를 개선하고 보다 균형 잡힌 데이터세트를 생성할 수 있습니다. 합성 데이터세트로 기존 데이터를 보강하여 임상시험 내 과소대표된 그룹을 효과적으로 “업샘플링”함으로써 실제 모집단을 보다 포괄적이고 다양하게 대표할 수 있습니다. 이러한 방식은 연구자가 시험계획서 설계를 개선하고 방대한 인구통계학적 환경을 반영하는 근거를 생성할 수 있도록 합니다.
왜곡된 참여자 인구통계의 한계를 해결하는 데 성공했다면 결과의 일반화 가능성을 높여 보다 강력한 결론을 도출하고 임상시험 결과의 전반적 타당성 및 적용성을 광범위한 개인으로 확장할 수 있습니다. 또한 제약회사가 합성 데이터를 이용하는 경우, 종종 임상시험 지연 또는 실패로 이어지는 적절한 시험기관 및 환자 탐색에 자원을 소비하지 않고 기존 임상시험 데이터에서 필요한 인사이트를 확보할 수 있습니다.
데이터 개인정보보호
예전부터 교차 의뢰자 과거 임상시험 데이터의 공유를 가로막았던 데이터 개인정보보호와 관련된 우려를 해소해야 합니다. 임상시험 데이터는 향후 임상 개발에 대한 정보를 얻을 수 있는 인사이트를 제공하는 가장 풍부한 소스입니다. 하지만 임상시험에서는 데이터 무결성을 유지하는 동시에 환자의 개인정보보호를 유지하는 것이 필수적이므로 이러한 데이터의 공유는 엄격하게 제한되고 있습니다. 실제로 많은 환자가 개인 건강 정보 제공을 망설이며, 이러한 행동에는 타당성이 있습니다.
얼리 어답터 및 헬스케어 기업들은 이미 헬스케어 산업 내에서 사용되는 생성형 AI가 환자 개인정보보호를 보장하기 위한 강력한 기술 및 보호 장치를 갖추고 있어야 함을 분명히 공표하고 있습니다 (Fierce Healthcare, 2023).
합성 데이터세트에는 환자 개인정보보호 및 데이터 무결성을 둘러싼 우려 중 상당수를 해소할 수 있는 능력이 있습니다. 이러한 데이터세트는 환자의 익명성을 보장하는 한편 데이터를 안전하게 보호하고 임상시험 데이터세트의 무결성을 보존합니다.
헬스케어 및 제약 산업에서 생성형 AI는 이제 걸음마 단계입니다. 여전히 생성형 AI와 관련한 많은 질문과 망설임이 존재하지만 환자와 기업 모두에게 유용하고 주요 우려를 해소할 수 있는 도구로서의 가치를 입증하고 있습니다. 2024년에는 생성형 AI의 확장세가 더욱 가속화되면서 보다 다양한 활용 사례를 목격할 수 있을 것으로 예상됩니다 (Fierce Healthcare, 2023).
생성형 AI의 전면 도입은 아직 이루어지지 않았지만 생성형 AI는 경제적 이점 측면에서 풍부한 가능성을 지니고 있는 것으로 보입니다. 하지만 이는 구체적으로 헬스케어용 AI 도구의 추가적인 개발과 병행되어야 합니다 (Forbes, 2023).
Simulants 소개
메디데이터 AI가 설계한 Simulants는 데이터세트의 특성 및 충실도를 보존하면서 환자 개인정보보호를 유지하는 방식으로 민감한 환자 데이터에 액세스하는 합성 데이터 도구입니다. 임상 개발자는 과거 임상시험 데이터세트에서 생성된 Simulants를 활용해 그동안 데이터 개인정보보호를 유지하면서 발견하기 어려웠던 인사이트를 확보할 수 있습니다.