AI/ML 및 자동화 활용을 통한 메디컬 코딩 및 데이터 검토 혁신
많은 생명과학 기업들은 AI(인공지능)/ML(머신러닝)과 같은 신기술을 활용하기 위한 방법을 모색하고 있습니다. 이러한 기술의 활용과 관련하여 기대에서 망설임까지 다양한 감정이 혼재되어 나타나고 있습니다. 고객이 효율성 개선을 통해 가장 중요한 일에 집중할 수 있도록 지원하는 것을 목표로 이와 관련한 과제와 이점을 자세히 살펴보겠습니다.
임상 연구의 토대가 되는 정확한 메디컬 코딩
임상 연구에서 정확한 코딩은 상당한 중요성을 지닙니다. 첫째, 이상반응(AE)과 같은 특정 데이터 세트의 적시 식별 및 평가를 통해 환자의 안전을 보장합니다. 예를 들어, 코딩 오류는 안전성 신호 감지의 누락 또는 지연을 야기할 수 있으며, 이로 인해 환자 보호를 위한 적절한 조치가 방해받고 잠재적으로 임상 시험의 유효성이 저해될 수 있습니다.
정확한 코딩은 기타 분석(예: 병용 약물), 리스크-이익 평가, 규정 준수 등 다양한 주요 임상 연구 기능의 성공을 뒷받침합니다. 또한 임상시험의 비교 가능성을 높이고, 결과물의 품질을 개선하고, 법률 및 책임 문제를 해결하며, 리소스 활용의 전반적인 효율성을 증대합니다.
표준화된 사전과 관련해 발생하는 코딩 문제
WHODrug 및 MedDRA와 같이 표준화된 임상시험용 메디컬 코딩 사전은 AE, 병력, 시술, 병용 약물 등의 개념이나 상태에 표준 코드를 할당합니다. 이러한 리소스는 다양한 의학적 상태, 약물 관련 개념 및 AE를 포괄하는 방대한 수의 용어를 포함합니다. 이러한 용어의 올바른 이해 및 적용을 위해서는 의학 용어와 관련한 강력한 지식이 필요합니다.
동일한 개념이나 상태를 설명하는 다양한 의학 용어가 존재할 수 있기 때문에 가장 적절한 용어를 선택하는 데 어려움이 발생합니다. 또한 지역별로 나타나는 언어 및 문화 차이, 의료 관행의 다양성도 고려해야 합니다.
코딩 사전은 새로운 용어와 개념을 포함시키기 위해 정기적으로 업데이트됩니다. 대량의 의료 데이터를 수동으로 코딩하는 작업은 많은 시간과 리소스가 소모됩니다. 따라서 이처럼 진화하는 표준을 따라잡고 코딩의 일관성을 보장하는 것에도 어려움이 따를 수 있습니다.
AI/ML 도입의 장애물
여러 가지 장애물이 의뢰자가 임상시험에 AI/ML 기술을 도입하는 것을 방해할 수 있습니다. 주된 우려 사항 중 하나는 AI/ML 모델 생성의 데이터 집약적 특성입니다. 이러한 특성은 지나치게 광범위하고 특이성이 부족한 모델을 초래할 수 있습니다. 소규모 의뢰자는 특정 치료 영역 및 요구 사항에 적합한 모델을 필요로 하는 경우가 많은 반면, 대형 의뢰자는 일반적인 모델을 선호할 수 있습니다.
규제 관련 장벽도 AI/ML 도입을 망설이게 하는 요소 중 하나입니다. 이는 특히 데이터 프라이버시 및 AI/ML 알고리즘 사용과 관련한 우려와 관련이 있습니다. 하지만 전 세계 규제기관은 이러한 기술이 책임 있고 규정을 준수하는 방식으로 원활히 도입될 수 있도록 가인드라인 및 규정을 계속해서 발표하고 있습니다.
AI/ML과 메디컬 코딩 프로세스의 통합은 변화를 요구합니다. SOP, 정책 및 교육의 업데이트에는 시간, 비용 및 노력의 상당한 투자가 필요할 수 있으므로 기존의 방식에 익숙한 의뢰자(즉, “구관이 명관이다”는 관점)는 어려움을 느낄 수 있습니다.
마지막으로 일부 의뢰자는 AI/ML 기술의 새로움과 데이터 품질(예: 입력 데이터 품질에 좌우되는 결과물)에 대한 우려를 지니고 있습니다. 하지만 수동 검토가 코딩 프로세스에서 여전히 중요한 역할을 하기 때문에 이러한 우려는 대체로 근거가 없습니다. 이와 같은 인간의 감독은 의뢰자가 AI/ML 기술을 통합한 후에도 데이터 출력물의 타당성에 대해 높은 확신을 유지할 수 있도록 보장합니다.
코딩 분야에서 AI/ML의 향후 적용 범위
이러한 장애물을 넘어 AI/ML은 코딩 프로세스에 상당한 개선을 가져올 준비가 되어 있습니다. 주요 이점 중 하나는 데이터를 직접 분석하여 의식적, 무의식적인 코더의 편향을 제거할 수 있다는 것입니다. 이를 통해 수동 작업이 줄어들어 입력 원문 용어 검토 및 SOP, 정책, 교육 프로토콜 업데이트 등 우선순위가 더 높은 작업에 리소스를 재할당할 수 있습니다.
앞서 언급했듯이 일관성은 메디컬 코딩의 주요 과제이며 AI/ML을 통해 상당한 개선이 가능합니다. 이러한 기술은 임상시험 도중 또는 이후에 발생하는 코딩 차이를 표시하여 불일치를 줄일 수 있습니다. 향후 AI/ML 시스템이 이러한 불일치를 ‘저위험’ 또는 ‘고위험’으로 분류하도록 발전하면 메디컬 코더는 가장 중요한 데이터 포인트에 집중할 수 있게 됩니다.
AI/ML은 과거 지식을 활용하여 보다 구체적인 코딩 옵션을 제공할 수 있습니다. AI/ML은 과거 코딩 관행을 기반으로 코딩 사전의 복잡하고 다양한 옵션의 범위를 좁힐 수 있습니다. 이렇게 하면 코더가 조사 및 수동 개입에 사용하는 시간이 줄어듭니다. AI/ML 기술이 더욱 광범위하게 도입되고 더 많은 훈련 데이터가 제공되면서 특정 기업, 지역, 치료 영역 또는 임상시험 단계를 위한 맞춤형 AI/ML 모델을 개발할 수 있습니다.
마지막으로 향후 AI/ML의 지속적 발전에 따라 코딩 프로세스는 더욱 간소화될 수 있습니다. 향상된 알고리즘은 자동 코딩의 적중률을 개선하여 동의어 목록을 제거할 가능성이 있습니다. 이러한 모델이 검토 프로세스를 통해 계속 학습하면 코딩 전문가의 수동 승인이 필요한 항목도 줄어들 것입니다. 전반적으로 수동 프로세스의 감소는 리소스 계획에 할애하는 시간의 증가로 이어지며 데이터 정확성 보장에 필요한 영역에 집중할 수 있도록 합니다.
Rave EDC의 자동화된 메디컬 코딩 워크플로의 진화
Medidata Rave Coder+는 WHODrug 및 MedDRA 사전을 사용하여 영어와 중국어로 임상시험용 메디컬 코딩을 제공하는 솔루션입니다. 메디데이터 플랫폼에 구축된 Rave Coder+는 Rave EDC에 입력된 원문 용어의 코딩을 위한 연결된 자동화 메디컬 코딩 워크플로를 제공합니다.