미국 연구진 DDW 2018서 발표, AI 이용 종양 더 많이 발견
진단 정확도 96%, AUC 0.99

 

대장내시경 검사에서 인공지능(AI)을 이용하면 종양 식별 능력을 더 높일 수 있는 것으로 나타났다.

약 8600개 이미지로 기계 학습한 AI로 종양을 진단한 결과 AI를 사용하지 않은 경우와 비교해 종양을 더 많이 찾아냈으며, 진단 정확도는 96%인 것으로 나타났다.

미국 캘리포니아의대 William Karnes 박사가 수행한 이 연구는 6월 2일 미국소화기국제학술대회 DDW 2018에서 발표됐다.

연구진은 CNN(convolutional neural network)이라고 부르는 비디오 기반 인공지능 모델에 기계 학습을 시켰다. 훈련에는 종양이 포함된 이미지 4100개, 포함되지 않은 이미지 4500개가 사용됐다. 이미지로는 게실(diverticuli)나 잔해(debris) 같은 무작위적인 특징을 보이는 다양한 샘플이 고려됐다.

연구는 일반 대장내시경 검사로 발견한 종양 28개를 제외한 종양을 추가로 찾아내는 방식으로 진행됐다. 선종발견율(Adenoma Detection Rate, ADR)이 50% 이상인 네 명의 대장내시경 전문의는 AI를 이용한 군과 이용하지 않은 군으로 나뉘어 종양을 탐지했다. AI는 ‘비디오 오버레이(overlay)’를 이용해 종양을 식별해 영상에 작은 녹색 상자로 알려주는 원리로 작동했다.

연구결과 AI를 사용하지 않고, 전문가 분석으로만 탐지했을 때는 종양이 36개가 확인됐으나, AI를 사용할 경우 종양이 45개가 확인됐다. AI를 이용한 경우 찾아낸 종양 개수가 9개 더 많은 것으로 나타난 것이다.

▲ AI 사용 여부에 따른 종양 탐지 개수 비교 ⓒDDW 2018

구체적으로 AI를 사용한 경우는 추가로 1~3mm 크기의 종양을 5개, 4~6mm 3개, 7~9mm 1개 더 발견한 것으로 나타났다.

AI 모델의 진단 정확도는 96%였으며, 모델 성능 평가지표로 사용하는 곡선하면적(area under the curve, AUC) 역시 0.99라는 높은 수치로 나타났다.

또한 검사에서는 양성이지만 실제로 질병이 없을 확률을 뜻하는 ‘위양성률(a false-positive rate)’이 7%, 음성예측도(negative predictive value, NPV)는 99.5%로 나타났다. 이는 곧 위장병 전문의가 병리 결과를 기다리지 않아도 된다는 것을 의미한다.

Karnes 박사는 “AI 모델로 전문가가 발견한 모든 종양을 확인하고 9개의 종양을 추가로 발견할 수 있었다”면서 “종양 탐지와 선종발견율을 개선할 수 있는 잠재력을 가지고 있고, 특히 실시간으로 대장내시경 검사를 할 때 도움이 될 것”고 말했다.

이어 “AI가 궁극적으로 중간 대장암(interval colorectal cancer) 발병률을 낮추기를 바란다”면서 “환자 중 50-80%가 진단에서 종양을 놓쳤기 때문”이라고 밝혔다. 중간 대장암은 대장내시경 검사 후 추적기간 3~5년 이내에 대장암을 진단받은 경우를 말한다.

한편 그는 일부 내시경 전문의가 일자리를 잃을 지도 모른다는 우려에 대해서는 "AI는 대장내시경 전문의의 일을 더 쉽게 해주고, 환자들에게 더 많은 시간을 줄 수 있다"고 설명했다.

저작권자 © 메디칼업저버 무단전재 및 재배포 금지