서울대병원 박창민 교수팀, 루닛 인사이트 CXR 이용해 검진에서 성능 우수성 보여
AI, 83% 민감도 보여

[메디칼업저버 박선재 기자] 건강검진에서 AI를 활용해 폐암 유무를 판단하는 날이 빨라질 것으로 보인다.  

서울대병원 박창민 교수팀(영상의학과, 이종혁·선혜영)이 2008-2012년 건강검진을 받은 5만70명의 흉부X선 사진을 활용해, 진단시스템의 성능을 검증한 결과를 19일 발표했다.

그림 1. 건강검진으로 촬영 한 흉부X선 사진. 우측 폐 상부에 폐암이 의심 되는 음영이 있고 (좌), 이는 흉부 전산화 단층촬영상에서도 폐암이 의심됨 (가운데). 인공지능 시스템은 이 병변의 존재와 위치를 식별하여 폐암으로 판정함 (우).
그림 1. 건강검진으로 촬영 한 흉부X선 사진. 우측 폐 상부에 폐암이 의심 되는 음영이 있고 (좌), 이는 흉부 전산화 단층촬영상에서도 폐암이 의심됨 (가운데). 인공지능 시스템은 이 병변의 존재와 위치를 식별하여 폐암으로 판정함 (우).

수집된 자료는 총 10만 576장이며 실제 폐암은 98장이었다. 이 중, 흉부 X선만으로는 폐암인지 확인이 어려운 51장을 제외한 뒤, 진단시스템의 성능을 측정했다.

그 결과, 인공지능 진단시스템은 약 97%의 진단정확도를 보이며 우수한 성능을 입증했다. 또한 약 83%의 우수한 민감도를 보였다. 민감도는 검사법이나 예측도구의 성능을 잘 나타내는 지표이다. 특히, 매우 뚜렷하게 보이는 폐암에선 100%의 민감도를 보였다.

표1. 연구결과 요약표
표1. 연구결과 요약표

이번 연구는 건강한 일반인 대상 실제 건강검진 상황에서 시스템의 진단능력을 검증했다는 의의가 있다.

이전 연구를 통해 인공지능 진단시스템의 성능은 검증됐으나, 질병의 빈도가 낮은 일반인에게 적용했을 때 결과는 알려지지 않았다. 이번 연구는 총 50,070명의 수검자 중 폐암 빈도가 약 0.1% 수준으로 매우 낮았다.

실험 결과, 진단시스템은 실제 상황에서도 높은 정확도를 보이며 성능을 증명했다.

박창민 교수는 “이번 연구를 통해 인공지능시스템이 대규모 건강검진 상황에서 폐암을 찾는데 유용하다는 사실을 확인했다”며 “인공지능이 연구실 수준을 넘어, 실제 환자나 일반인들에게 실질적인 도움이 될 수 있도록 연구 개발을 지속할 것”이라고 밝혔다.

그림 2 건강검진 흉부X선 상 폐암 진단에 대한 인공지능시스템과 영상의학과 전문의의 진단능 비교 그래프. 인공지능시스템의 진단능 그래프(청색)가 영상의학과 전문의의 진단능을 나타내는 점 (적색) 위에 위치하고 있고, 이는 더 나은 진단능을 나타냄.
그림 2 건강검진 흉부X선 상 폐암 진단에 대한 인공지능시스템과 영상의학과 전문의의 진단능 비교 그래프. 인공지능시스템의 진단능 그래프(청색)가 영상의학과 전문의의 진단능을 나타내는 점 (적색) 위에 위치하고 있고, 이는 더 나은 진단능을 나타냄.

이번 연구는 서울대학교병원 집중육성연구 지원으로 시행됐으며, 서울대학교병원과 ㈜루닛이 공동개발한 루닛인사이트 CXR 인공지능을 활용하였다. 연구 결과는 영상의학 분야 최고권위 학술지인 ‘방사선학(Radiology)’ 온라인판에 게재됐다.

저작권자 © 메디칼업저버 무단전재 및 재배포 금지