루닛 김효은 박사팀, 3개국 5개 기관의 17만여 건 유방촬영술 분석
민감도, 인공지능 88.8% vs 영상의학과 의사 75.3%
T1유방암 진단과 림프절 비전이 유방암 진단에도 의사보다 뛰어나
[메디칼업저버 박선재 기자] 유방암 진단에 있어 인공지능(AI)이 영상의학 전문의보다 더 뛰어난 실력을 보였다는 연구논문이 또 발표됐다.
현재 유방촬영술(Mammography)은 유방암 진단에 있어 가장 기본적인 검사로 알려졌다.
이에 의료인공지능 기업인 루닛의 김효은 박사팀은 유방촬영술이 유방암 진단에 활용되는 알고리듬을 개발하고, 영상의학과 전문의가 정확하게 유방암을 진단하는 데 어떤 역할을 하는지 알아보기 위해 연구를 진행했다.
그 결과 의사가 유방촬영을 판독할 때 AI를 활용하면 능력이 향상된다는 결과를 얻었다.
이번 연구 결과는 2월 6일 란셋 디지털 헬스(The Lancet Digital Health) 온라인에 게재됐다.
AI, 민감도에서 의사보다 더 앞서
후향적, 다기관, 관찰자-맹검 등으로 진행된 이번 연구는 서울, 미국, 영국 등 3개 국가 5개 기관에서 17만 230명의 유방촬영술을 한 데이터를 분류하고, AI 알고리듬을 개발했다.
국내 세브란스병원, 서울아산병원, 삼성서울병원의 데이터를 분석했다.
연구에 사용한 데이터 중 3만 6468건은 조직검사에서 암이었고, 5만 9544건은 양성(benign) 또는 관찰 중인 이미지였고 7만 4218건은 정상으로 판독된 데이터였다.
또 14명의 영상의학과 전문의가 판독자로 참여해 악성일 가능성(LOM), 암의 위치, 환자를 기억해야 할 필요성 등을 처음에는 AI 도움 없이, 이후에는 도움을 받은 후 평가했다.
연구결과 AI의 독립적인 수행결과 정확도는 0·959 (95% CI 0·952~0·966)였고, 서울 데이터셋의 정확도는 0·970 (0·963~0·978), 미국 데이터셋은 0·953 (0·938~0·968), 영국 데이터셋의 정확도는 0·938 (0·918~0·958)였다.
의사가 AI 도움받았을 때 민감도 증가
또 유방암 검출 정확도 측면에서 인공지능은 88.8%의 민감도를 보인 반면, 영상의학 전문의는 75.3%의 민감도를 보였다.
하지만 전문의가 AI의 도움을 받았을 때 민감도가 84.8%로 크게 향상됨을 확인할 수 있었다
리더연구(reader study)에서 AI의 수행 수치는 0·940(0·915~0·965)였고, AI 도움을 받지 않은 영상의학과 의사보다 유의미하게 높았다(0·810, 95% CI 0·770~0·850; p<0·0001).
AI의 도움을 받은 의사의 판독능력은 0·881(0·850?0·911; p<0·0001)이었다.
특히 AI는 영상의학과 의사보다 덩어리(mass)와 암, 왜곡(distortion)과 유방의 비대칭성 등을 더 잘 판독하는 특징을 보였다.
이외에도 T1 유방암 환자를 찾는 데도 AI가 더 뛰어났고, 림프절 비전이 유방암도 의사보다 나았다.
연구팀은 "AI의 높은 정확도는 진단이 어려운 조기 침윤성 유방암의 검출에 더욱 뛰어났다"며 "영상의학 전문의의 경우 T1 암 및 림프절 비전이 암 각각에 대해 74%의 민감도를 보인 반면, AI는 각각 91% 및 87%의 민감도를 보였다"고 설명했다.
유방밀도에서도 차이를 나타냈다. AI가 유방 밀도의 영향을 덜 받았던 것.
치밀 유방에 대한 전문의의 민감도는 73.8%로, 치밀 유방이 아닌 경우에 대한 민감도 79.2%보다 현저히 낮았다.
하지만 AI의 도움을 받을 경우, 전문의의 치밀 유방 판독 민감도가 85.0%로 크게 향상됐다.
루닛의 최고 제품 책임자(CPO)이자 논문의 공동 1저자인 김효은 이사는 "이번 연구에 사용된 3만 6000건의 유방암 데이터는 이전에 행해진 유사 연구의 악성 데이터 수보다 7배 이상 더 많은 양"이라고 소개했다.
이어 "인종에 따라 유방조직의 특성이 다르고 영상 장비와 촬영 환경에 따라 판독 정확도가 달라질 수 있는데, 이 점을 모두 고려한 양질의 데이터와 지난 4년간 루닛이 개발한 독자적 알고리듬의 결합 덕분에 의미 있는 결실을 맺었다"고 말했다.
연구를 총괄한 세브란스병원 김은영(영상의학과) 교수는 "유방촬영영상 판독에 있어 큰 어려움 중 하나는, 판독에서 놓치는 병변을 줄이기 위해 추가 검사를 하는 것인데 이 중 적지 않은 부분이 불필요한 검사일 수 있다"며 "우리의 연구에 따르면 인공지능은 위양성에 대한 재검사율 (false positive recall rate) 증가 없이 더 많은 유방암을 찾을 수 있도록 도움을 준다. 특히 조기 유방암의 발견에 도움을 줄 수 있는 가능성을 확인했다"고 강조했다.