서울의대·국립암센터 연구팀, 머신러닝 기반의 폐암 사망예측 모델 개발

서울대병원 윤영호 교수, 국립암센터 심진아 교수(사진 오른쪽)
서울대병원 윤영호 교수, 국립암센터 심진아 교수(사진 오른쪽)

[메디칼업저버 박선재 기자] 서울의대와 국립암센터 연구팀(심진아, 김영애 박사, 윤영호 교수)이 폐암 치료 후 암 생존자들의 생활습관 및 삶의 질 정보를 활용해 머신러닝 기반의 사망예측 모델을 개발했다.

또 이를 통해 5년 후 암 생존자의 사망을 보다 정확하게 예측하는 데 성공했다.

연구팀은 2001년부터 2006년 사이 국립암센터와 삼성서울병원에서 수술 후 완치를 판정받은 폐암 환자 809명을 대상으로, 2006-2007년도에 걸쳐 생활 습관 및 삶의 질 자료를 수집했다. 이를 바탕으로 5년 후의 사망을 예측했다.

연구팀은 잘 알려진 폐암 예후 인자(연령, 성별, 병기요인, 종양의 특성 등)외에도 삶의 질과 생활습관 정보(불안, 우울, 삶의 질, 긍정적 성장 및 과체중)들이 실제로 암 생존자들의 5년 이후의 생존예측력을 높일 수 있는지를 중점적으로 연구했다. 또 이에 대한 예측정확도를 높이고자 머신러닝 알고리즘을 적용했다.

그동안 폐암 환자를 대상으로 삶의 질과 사망 위험 간의 상관성을 장기간에 걸쳐 분석하여, 머신러닝 및 AI등의 알고리즘을 적용하여 사망 예측모형으로까지 만든 연구는 거의 없었다.

이에, 폐암 생존자들의 사망률을 평가하기 위해 컴퓨터가 예제를 통해 학습하는 데 도움이 되는 지도학습 알고리듬 중, 하나의 모델을 학습시켜 사용하는 의사결정나무(decision tree), 로지스틱회귀분석(logistic regression)과 가능한 임의의 결과를 반영하는 여러 개의 나무 모양 모델을 결합한 랜덤포레스트(random forest), 배깅(Bagging), 아다부스트(Adaptive Boosting)등의 다섯 가지 유형의 머신러닝 알고리즘을 테스트했다. 그런 다음, 각각의 모델에 대한 예측 성능을 비교했다.

연구팀은 폐암 치료 후 암 생존자들의 생활 습관 및 삶의 질 정보를 활용해 개발 된 사망 예측 모형은 기존의 잘 알려져 있는 예후 요인인 연령, 성별, 종양의 특성 등만 활용한 모델의 사망 예측보다 훨씬 더 정확했다고 밝혔다.

또한, 다양한 머신러닝기법을 적용함으로써 암 사망에 대한 예측력을 보다 높일 수 있다고 밝혔다.

모든 수치계산이 완료되었을 때, 암 생존자들이 기존의 예후인자들만 고려한 랜덤포레스트 (Random Forest) 모델과 아다부스트(Adaptive Boosting) 모델은 암 생존자들의 5년 생존 여부를 약 69.1% 와 71.3%만 정확하게 예측하는 수준인 반면, 삶의 질 및 생활습관을 고려한 랜덤포레스트 알고리즘 및 아다부스트 모델은 폐암 생존자 5년 생존여부의 94.1% 와 94.8%를 정확하게 식별해 보다 정확한 예측을 제공했다.

심진아 박사는 "머신러닝기술을 이용한 암 생존자들의 생존 예측 시 기존의 임상정보에 삶의 질 및 생활습관 정보를 추가했을 때 5년 생존율을 훨씬 정확하게 예측할 수 있음을 확인했다" 며 "이러한 삶의 질 요인을 포함한 예측모형은 ICT 기술과 융합되어, 실제 생존자들의 자가 관리를 도울 수 있으며, 향후 유전자 분석을 기반으로 한 정밀의학에서도 삶의 질 정보가 신중히 고려돼야 한다"고 말했다.

윤영호 교수는 “암 치료 후 재발 감시뿐 아니라 운동, 식이 등과 함께 삶의 질을 평가하고 체계적으로 관리할 수 있도록, 사망 예측 및 관리 모형을 포함한 통합케어 시스템을 갖추는 것이 시급하다. 그리고 이에 대한 보험수가 인정 등 국가 차원의 지원이 반드시 이뤄져야 한다.”고 밝혔다.

이 연구 결과는 Nature 계열의 권위 학술지인 ‘Scientific Report' 최근호에 게재했다.

저작권자 © 메디칼업저버 무단전재 및 재배포 금지