루닛 김효은 박사팀, 3개국 5개 기관의 17만여 건 유방촬영술 분석
민감도, 인공지능 88.8% vs 영상의학과 의사 75.3%
T1유방암 진단과 림프절 비전이 유방암 진단에도 의사보다 뛰어나

[메디칼업저버 박선재 기자] 유방암 진단에 있어 인공지능(AI)이 영상의학 전문의보다 더 뛰어난 실력을 보였다는 연구논문이 또 발표됐다. 

현재 유방촬영술(Mammography)은 유방암 진단에 있어 가장 기본적인 검사로 알려졌다. 

이에 의료인공지능 기업인 루닛의 김효은 박사팀은 유방촬영술이 유방암 진단에 활용되는 알고리듬을 개발하고, 영상의학과 전문의가 정확하게 유방암을 진단하는 데 어떤 역할을 하는지 알아보기 위해 연구를 진행했다. 

그 결과 의사가 유방촬영을 판독할 때 AI를 활용하면 능력이 향상된다는 결과를 얻었다.
 
이번 연구 결과는 2월 6일 란셋 디지털 헬스(The Lancet Digital Health) 온라인에 게재됐다. 

AI, 민감도에서 의사보다 더 앞서

위의 사진은 우측 유방에 침습성 소엽 암종이 있는 49세 여성의 유방 촬영 모습이다. AI에 의해 우측 유방에 미세 석회화가 있는 작은 덩어리가 96% 이상의 점수로 정확히 검출되었다. 14명의 영상의학과 전문의가 판독한 결과, 7명(유방 영상의학과 전문의 4명, 일반 영상의학과 전문의 3명)만이 해당 암종을 발견했다. 하지만 인공지능의 도움을 받은 후, 14명의 영상의학과 전문의 모두 암종을 정확하게 검출할 수 있었다.
우측 유방에 침습성 소엽 암종이 있는 49세 여성의 유방 촬영 모습이다. AI에 의해 우측 유방에 미세 석회화가 있는 작은 덩어리가 96% 이상의 점수로 정확히 검출되었다. 14명의 영상의학과 전문의가 판독한 결과, 7명(유방 영상의학과 전문의 4명, 일반 영상의학과 전문의 3명)만이 해당 암종을 발견했다. 하지만 인공지능의 도움을 받은 후, 14명의 영상의학과 전문의 모두 암종을 정확하게 검출할 수 있었다.

후향적, 다기관, 관찰자-맹검 등으로 진행된 이번 연구는 서울, 미국, 영국 등 3개 국가 5개 기관에서 17만 230명의 유방촬영술을 한 데이터를 분류하고, AI 알고리듬을 개발했다.

국내 세브란스병원, 서울아산병원, 삼성서울병원의 데이터를 분석했다. 

연구에 사용한 데이터 중 3만 6468건은 조직검사에서 암이었고, 5만 9544건은 양성(benign) 또는 관찰 중인 이미지였고 7만 4218건은 정상으로 판독된 데이터였다.

또 14명의 영상의학과 전문의가 판독자로 참여해 악성일 가능성(LOM), 암의 위치, 환자를 기억해야 할 필요성 등을 처음에는 AI 도움 없이, 이후에는 도움을 받은 후 평가했다. 

연구결과 AI의 독립적인 수행결과 정확도는 0·959 (95% CI 0·952~0·966)였고, 서울 데이터셋의 정확도는 0·970 (0·963~0·978), 미국 데이터셋은 0·953 (0·938~0·968), 영국 데이터셋의 정확도는 0·938 (0·918~0·958)였다.

AI의 도움을 받기 전과 후의 판독 정확도 변화 그래프 (ROC 커브), 이미지 출처: 루닛
AI의 도움을 받기 전과 후의 판독 정확도 변화 그래프 (ROC 커브), 이미지 출처: 루닛

의사가 AI 도움받았을 때 민감도 증가

또 유방암 검출 정확도 측면에서 인공지능은 88.8%의 민감도를 보인 반면, 영상의학 전문의는 75.3%의 민감도를 보였다.

하지만 전문의가 AI의 도움을 받았을 때 민감도가 84.8%로 크게 향상됨을 확인할 수 있었다

리더연구(reader study)에서 AI의 수행 수치는 0·940(0·915~0·965)였고, AI 도움을 받지 않은 영상의학과 의사보다 유의미하게 높았다(0·810, 95% CI 0·770~0·850; p<0·0001).

AI의 도움을 받은 의사의 판독능력은 0·881(0·850?0·911; p<0·0001)이었다. 

특히 AI는 영상의학과 의사보다 덩어리(mass)와 암, 왜곡(distortion)과 유방의 비대칭성 등을 더 잘 판독하는 특징을 보였다. 

이외에도 T1 유방암 환자를 찾는 데도 AI가 더 뛰어났고, 림프절 비전이 유방암도 의사보다 나았다. 

연구팀은 "AI의 높은 정확도는 진단이 어려운 조기 침윤성 유방암의 검출에 더욱 뛰어났다"며 "영상의학 전문의의 경우 T1 암 및 림프절 비전이 암 각각에 대해 74%의 민감도를 보인 반면, AI는 각각 91% 및 87%의 민감도를 보였다"고 설명했다.

유방밀도에서도 차이를 나타냈다. AI가 유방 밀도의 영향을 덜 받았던 것. 

치밀 유방에 대한 전문의의 민감도는 73.8%로, 치밀 유방이 아닌 경우에 대한 민감도 79.2%보다 현저히 낮았다.

하지만 AI의 도움을 받을 경우, 전문의의 치밀 유방 판독 민감도가 85.0%로 크게 향상됐다. 

루닛의 최고 제품 책임자(CPO)이자 논문의 공동 1저자인 김효은 이사는 "이번 연구에 사용된 3만 6000건의 유방암 데이터는 이전에 행해진 유사 연구의 악성 데이터 수보다 7배 이상 더 많은 양"이라고 소개했다.

이어 "인종에 따라 유방조직의 특성이 다르고 영상 장비와 촬영 환경에 따라 판독 정확도가 달라질 수 있는데, 이 점을 모두 고려한 양질의 데이터와 지난 4년간 루닛이 개발한 독자적 알고리듬의 결합 덕분에 의미 있는 결실을 맺었다"고 말했다.

연구를 총괄한 세브란스병원 김은영(영상의학과) 교수는 "유방촬영영상 판독에 있어 큰 어려움 중 하나는, 판독에서 놓치는 병변을 줄이기 위해 추가 검사를 하는 것인데 이 중 적지 않은 부분이 불필요한 검사일 수 있다"며 "우리의 연구에 따르면 인공지능은 위양성에 대한 재검사율 (false positive recall rate) 증가 없이 더 많은 유방암을 찾을 수 있도록 도움을 준다. 특히 조기 유방암의 발견에 도움을 줄 수 있는 가능성을 확인했다"고 강조했다.

관련기사

저작권자 © 메디칼업저버 무단전재 및 재배포 금지