AI기반 당뇨병 예측 시스템 알고리즘 논문 발표한 장혁재·이상열 교수

[메디칼업저버 박선재 기자] 인공지능이 다양한 분야에서 힘을 발휘하고 있다.

최근 국내 연구팀이 건강검진 결과를 바탕으로 딥러닝을 이용해 제2형 당뇨병을 예측할 수 있는 알고리즘을 개발해 눈길을 끌고 있다. 

이 연구는 세브란스병원 장혁재 교수(심장내과, 교신저자)와 경희대병원 이상열 교수(내분비내과, 제1저자)팀이 진행했는데, 기존 콕스회귀모델을 이용한 분석보다 예측 정확도가 뛰어나 관심을 모으고 있다.

이 논문은 최근 대한당뇨병학회 학술지인 dmj 2월호에도 게재됐는데, 이 연구가 갖는 의미와 AI 기반 질병 예측 프로그램의 전망에 대해 들어봤다. . 

세브란스병원 장혁재 교수와 경희대병원 이상열 교수(사진 오른쪽)
세브란스병원 장혁재 교수와 경희대병원 이상열 교수(사진 오른쪽)

-이번 연구의 디자인을 간략하게 설명한다면?

이상열 교수(이하 이) : 국가 건강검진을 받은 사람 중 제2형 당뇨병이 얼마나 발생할지 알아보기 위해 인공지능의 한 학습방식인 RNN-LSTM을 이용해 데이터를 딥러닝시켰다. 이후 딥러닝 모델(DL모델)과 콕스회귀을 사용해 비교분석했다.

여기에 대상자의 나이, 성별, BMI, 흡연 여부, 몸무게 등 변수를 기반으로 조작적 정의를 했는데. 이는 변수마다 당뇨병 발생에 어떤 영향을 미쳤는지 알아보기 위해서였다. 

- 이번 연구가 갖는 의미는? 

장혁재 교수(이하 장) : 당뇨병 진단력이 없는 건강한 대상자의 정보를 기반으로 미래의 시점별 예측을 위해 인공지능 기법을 적용했다는 점이다.

또 예측 결과에 따라 당뇨병 발생 가능성을 떨어뜨려 건강을 유지하게 할 수 있다는 부분이다.

경희대병원 내분비내과 이상열 교수 ⓒ메디칼업저버 고민수 기자
경희대병원 내분비내과 이상열 교수 ⓒ메디칼업저버 고민수 기자

- DL모델이 콕스회귀모델보다 예측능력이 뛰어났다고 발표됐는데, 구체적으로 설명한다면. 

이 : 10년 동안의 예측능력(AUC)을 봤을 때 초기 5년 동안은 AI가 콕스회귀모델보다 훨씬 뛰어난 예측능력을 보여준다. 하지만 5년이 넘으면 예측능력 차이가 점차 좁혀진다.

세부적으로 5년 콕스회귀모델 AUC는 0.842(95% CI, 0.832~0.852), DL모델은 0.877 (95% CI, 0.869~0.885)이었다. 그런데 10년 AUC는 각각 0.807, 0.827이었다. 

- 시간이 지날수록 예측능력이 떨어진 이유는?

장 : 주어진 검진 데이터의 양은 정해져 있고, 대상자마다 동일한 시간을 추적하지 않는다. 따라서 시간이 멀어질수록 실제 결과를 확인할 수 있는 대상자 수는 감소한다.

다시 말해 가까운 시점보다 먼 시점의 모델링을 하기 위한 대상자가 줄어 파워가 떨어진다고 볼 수 있다. 하지만 예측력 감소 크기가 큰 것은 아니라고 생각한다.

멀리 있는 시점을 예측하는 것보다 2년마다 검진을 받는 시스템에서는 충분히 활용 가치가 있는 알고리즘이라 본다. 

세브란스병원 심장내과 장혁재 교수ⓒ메디칼업저버 
세브란스병원 심장내과 장혁재 교수ⓒ메디칼업저버 

- 제2형 당뇨병 발생에 가장 영향을 많이 미치는 변수로 콕스회귀모델에서는 당뇨병 히스토리와 나이, 심장질환 순이었다. 그런데 DL모델에서는 FBG, 나이, ALT 순이었다. 이유는 무엇인가?

장 : 연구에서 사용한 콕스회귀모델은 여러 요인(변수) 간 상관관계를 고려하지 않은 모델이다. 검진 항목이 많고, 또한 대상자별로 여러 시점간의 관계를 포함하여 복잡한 데이터 구조라 전통적인 모델보다는 DL 모델을 적용한 것이다.

DL 모델은 이러한 복잡한 요인 간 상관관계뿐만 아니라 여러 시점 간 관계까지도 계산해줄 수 있는 모델이다. 중요한 요인 간 순서는 다를 수 있다.

- 이번 연구 결과를 바탕으로 국민들이 직접 자신의 제2형 당뇨병 발생에 대한 예측 결과를 볼 수 있다고 들었다.  

이 : 그렇다. 국민건강보험공단 건강 in에 로그인하고 들어가 당뇨병예측을 클릭하면 자신의 당뇨병 발병에 분석결과를 볼 수 있다. 보통, 주의, 경고, 위험, 고위험 등의 단계로 분석 결과를 볼 수 있다. 또 체질량지수와 수축기혈압, 공복혈당, 총콜레스테롤 등에 대한 수치들도 구체적으로 볼 수 있다.

이외에도 당뇨병에 영향을 미치는 주요 건강검진 항목에 대한 결과도 일목요연하게 볼 수 있다. 

- 인공지능 알고리즘을 실 환자 진료에도 연계할 수 있을까? 

장 : 물론이다. 다만, 실제 질병이 발생해 치료를 받는 환자보다는 질병 발생의 위험성을 인지하고 예방을 위한 여러 가지 활동을 하는 일차 진료나 건강검진 상황에서 더 유용하게 사용할 수 있을 것으로 보고 있다.

-딥러닝 알고리즘을 이용한 연구를 더 많이 진행되려면, 교수와 정부는 각각 어떤 노력을 해야 할까?

장 : 현재 다양한 분야에서 보건의료 데이터가 수집되고 개방되고 있어 긍정적이다. 실생활에 활용할 수 있는 딥러닝 솔류션이 개발되려면 이들 개별데이터가 연계된 형태의 연계 통합데이터가 쉽게 활용될 수 있도록 해야 한다. 이를 위해서는 정부와 관련 기관의 적극적인 의지가 뒷받침돼야 한다.

저작권자 © 메디칼업저버 무단전재 및 재배포 금지