연대 장혁재 교수 "전통적 질환 예측 방법보다 정확도 높아…불필요한 의료비 절감 기대"

▲ 2일 강남세브란스병원에서 열린 '헬스케어 컨퍼런스'에서 연세의대 장혁재 교수는 '빅데이터 기반 건강관리 및 질병 예측'을 주제로 발표했다.

인공신경망에 빅데이터를 결합한 '딥러닝(deep learning)'으로 심혈관질환, 당뇨병 등의 질환을 예측해 불필요한 의료비를 절감할 수 있다는 제언이 나왔다.

연세의대 장혁재 교수(심장내과)는 "현재 임상에서는 질환을 예측하는 검사를 통해 질환이 의심된다면 확진을 위해 환자에게 더 비싼 검사를 권유하며, 이중 단 일부만이 확진을 받는다"며 "전통적인 질환 예측 방법보다 딥러닝을 이용해 질환을 예측하는 것이 예방 정책이나 관리전략을 고안하는 데 더 효과적이며, 불필요한 의료비를 절감할 수 있다"고 2일 강남세브란스병원에서 열린 '헬스케어 컨퍼런스'에서 강조했다. 

먼저 그는 전통적인 질환 예측 방법의 문제점을 지적했다. 현재 임상에서는 건강검진 시 혈액검사 결과 또는 위험인자 평가를 통해 수검자들을 질환 발병 고위험군, 중등도 위험군, 저위험군으로 판정한다. 예로 심혈관질환은 나이, 성별, 흡연 등의 심혈관질환 위험인자에 대해 가중치를 적용 후 통계적인 방법으로 질환 위험도를 산출한다. 

그런데 통계적인 방법에서 위험인자와 질환 발병과의 상관관계가 선형(linear)이 아니라는 문제가 있다. 통계적인 방법에서는 고령일수록 질환 위험이 높다고 가정하고 있지만, 실제 질환 예측에 적용되는 위험인자에서는 같은 10년이 지났을지라도 10세 소아·청소년이 20세 성인이 됐을 때와 60세 고령이 70세가 됐을 경우의 질환 위험도가 선형으로 증가하지 않는다는 것이다. 

게다가 혈압, 체중, 혈당, 콜레스테롤 등은 정상 범위에 있어야 건강하다고 할 수 있으며, 너무 높거나 낮아도 위험하기 때문에 위험인자와 질환 위험은 비선형(non-linear) 관계에 있다고 봐야 한다. 

이에 그는 질환 예측에 쓰이는 전통적인 방법인 콕스비례위험(Cox hazard regression) 모델과 딥러닝을 기반으로 한 알고리듬을 이용해 심혈관질환 예측 정확도를 비교한 데이터를 제시하며 전통적인 예측 알고리듬의 문제점을 지적했다. 콕스비례위험 모델은 일반적인 모델과 시계열 정보를 반영한 모델로 나눠 평가했다. 

분석에는 건강검진코호트DB(NHIS-HealS)에 등록된 40~79세 성인 8만 2000여 명이 포함됐다. 심혈관질환 예측 정확도는 AUC(area under curve) 지표를 이용했다. AUC 수치가 높을수록 질환이 있는 사람을 질환자로 판별하는 민감도, 질환이 없는 사람을 비질환자로 판별하는 특이도가 모두 높다는 것을 의미한다. 

분석 결과, 시계열 정보를 반영하지 않은 콕스비례위험 모델에서 AUC 수치는 △남성 0.727 △여성 0.760, 시계열 정보를 반영한 모델에서는 △남성 0.813 △여성 0.837로 나타났다. 그러나 딥러닝을 기반으로 한 알고리듬의 AUC 수치는 △남성 0.897 △여성 0.908로, 콕스비례위험 모델보다 AUC 수치가 1에 더 가까웠다. 이는 국민건강보험 표본코호트DB(NHIS-NSC) 또는 로테르담 연구(Rotterdam Study)에 포함된 성인을 대상으로 비교한 결과에서도 유사하게 나타났다.

게다가 당뇨병을 예측할 수 있는 평가도구가 없는 상황에서, 딥러닝을 이용해 당뇨병을 예측할 경우 AUC 수치는 0.94로 높은 정확도를 보였다. 

일각에서는 딥러닝을 이용해도 AUC 수치가 1이 아니기에 질환 예측 정확도가 100%가 아니라는 지적이 나온다. 그러나 이는 질환자와 비질환자를 나누는 기준값(cut-off)에서 질환자 중 일부가 건강하다고 분류되는 위양성이 존재하기 때문이라는 게 그의 설명이다. 

그는 "전체 건강보험 지출액 중 불필요한 검사 비중이 20~50%를 차지한다. 딥러닝을 이용해 질환을 예측함으로써 이 같은 비용을 절감할 수 있다"며 "딥러닝은 진료 수준 저하 없이 의료비를 줄일 수 있는 새로운 대안이 될 것"이라고 제언했다. 

저작권자 © 메디칼업저버 무단전재 및 재배포 금지