무작위 대조군 연구서 승리해야 임상 적용

 

인공지능(AI)이 인간의 두뇌를 이길 수 있다는 사실은 바둑 천재 이세돌과 알파고의 대결을 통해 확인한 바 있다. 이런 정보기술을 이용 환자를 진단, 치료하는 시대가 서서히 열리고 있다.

IBM사가 개발한 인공지능 왓슨(Watson)이 그 주인공이다. 환자 정보가 담긴 전자차트 내용을 지금까지 축적된 임상 성적, 다양한 논문의 결과를 대입해 최적의 치료 옵션을 제시하는 것이다.

인간의 두뇌로는 불가능한 분석을 인공지능에게 맞겨 치료를 결정한 사례도 속속 나오고 있다. 얼마전 국내에서도 나온데 이어 최근 미국학회에서도 비슷한 사례가 소개되면서 왓슨이 이름을 알리는데 성공했다.

국내 사례는 가천대 길병원에서 나왔다. 대장암 환자에게 재발방지용 보조치료를 하는 과정을 왓슨에게 물어본 것인데, 대다수 의료진이 예상한 화학요법(FOLFOX 혹은 CapeOX)을 최종 답변으로 내놨다.

다양한 화학요법간의 조합이 존재하는 상황에서 어떤 조합의 최적의 효과를 이끌어낼 수 있는가를 컴퓨터가 찾아낸 것이다.

길병원 인공지능기반 정밀의료추진단 백정흠 기획실장은 "의료진과 왓슨 모두 혹시 모를 잔여 암세포를 제거하고 재발 방지를 위해서는 항암화학요법이 필요하다고 생각한 부분에 의견이 일치했다"면서 "특히 이후 항암치료를 위해 제안된 방법도 의료진의 판단한 결과와 같았다"고 말했다.

다만 이번 국내 사례는 환자 한 명을 대상으로 진행한 결과라는 점에서 여러 제한점을 가지고 있다. 하지만 슈퍼컴퓨터를 활용한 정밀 맞춤형 의학의 가능성을 열어준 첫 사례로 기록된다.

해외 사례도 속속 발표되고 있다. 인도 마니팔 종합암센터에 근무하는 S. P. Somashekhar 박사(센터장)는 얼마 전 성료된 전 세계 최대 유방암 관련 학회인 미국 샌안토니오유방암심포지엄(SABCS)에서 왓슨을 이용한 새로운 연구를 발표했다.

628명의 유방암 환자를 왓슨 프로그램에 입력한 것인데 그 결과, 센터 종합종양위원회 소속 전문의 판단과 상당수 일치한 것으로 나온 것이다. 특히 고려 또는 권고 등의 구제적 판정이 종양전문가들과 90% 일치했다.

이 사례는 대규모의 환자를 이중맹검 방식으로 적용해 왓슨과 종양전문가의 평가를 처음으로 비교했다는 점에서 역사적인 연구로 남을 전망이다.

이처럼 왓슨을 이용하면 환자들의 임상진단 능력뿐만 아니라 치료시간도 단축시킬 수 있을 것으로 보고 있다. 특히 암처럼 복잡한 질환이고, 치료 알고리즘이 다양할수록 유용하다는 게 전문가들의 한결같은 목소리다.

유방암 연구를 진행한 Somashekhar 박사는 "암은 매우 복잡한 질환이다. 다학제 회의를 하는 이유도 그 때문이다. 또한 치료를 결정하는 과정도 오래 걸린다"며 "반면, 왓슨은 이번 판단을 내리는데 1분 밖에 걸리지 않았다"고 말했다.

"정확도는 아직 좀 더 연구 필요"

이처럼 왓슨을 이용한 치료 결정이 주목을 끌고 있는 가운데 한편으로 정확도에 대해서는 아직은 좀 더 지켜봐야한다는 반응도 나오고 있다.

SABCS에서 발표된 유방암 연구 결과는 겉으로 볼 때는 매우 높은 일치율을 자랑하지만 실상 면밀히 뜯어보면 100% 인공지능의 결과는 아니다.

실제로 해당 연구에서는 종양전문의가 먼저 보정을 한 후 왓슨이 결정을 내렸다. 첫 번째 과정에서 왓슨과 종양전문가들의 일치율은 73%였으며, 두 번째 과정에서야 90% 일치를 보인 것이다.

게다가 비전이성 유방암의 경우 79% 일치했고 전이성 유방암인 경우에는 46%만 일치하는 등 아직은 일관적이지 않은 부분도 있다. 삼중음성 유방암도 68%, HER2 음성 유방암은 35% 만 일치했다.

기존의 다른 연구도 임상적 활용할 가치보다는 가능성에 무게를 둔 사례가 대부분이다. 따라서 정확도와 일관성은 왓슨이 해결해야할 역할이다.

전문가들은 이러한 부분은 지속적인 학습을 통해 해결될 수 있을 것으로 보고 있다.

그 배경에는 컴퓨터는 거의 무한한 양의 새로운 데이터를 통합 할 수 있지만 인간의 뇌는 한계가 있다는 근거 때문이다. 또 학습능력 기능으로 정보가 쌓을수록 정확도는 높아질 것으로 기대하고 있다.

그럼에도 의사는 대체할 수 없을 것으로 전망했다.

Somashekhar 박사는 "인공지능의 판단이 의사의 판단과 거의 같아지더라도 본질적인 환자 와 의사의 관계를 대체 할 수 없을 것"이라고 말했다.

그런 의미에서 왓슨이 병원에 도입되더라도 임상 현장에 적용하는 것은 참고적인 수준이 될 것이라는 반응이 높다.

능력 평가 무작위 대조군 연구 필요

또한 왓슨이 임상에 널리 활용되고, 가이드라인에 까지 들어가려면 넘어야할 산도 많다.

우선 왓슨과 의사판단의 무작위 대조군, 연구를 통해 환자들의 생존율 개선효과를 입증해야한다. 인간의 생명을 기계에 맞겨야하는 윤리적인 문제도 해결해야한다. 왓슨의 평가를 임상에 어느정도 반영해야하는 질평가도 아직은 정립된 것이 없다.

길병원 인공지능기반 정밀의료추진단 이언 단장(신경외과)은 "임상은 어렵다. 아직까지는 진단과 치료에 대한 의문과 궁금증을 해소하고 이로 인해 발생할 수 있는 사회경제적 문제를 해소하는 역할에 초점이 맞춰질 것"이라고 말했다.

장점과 단점 그리고 윤리적 문제와 환자 이해가 혼재하고 있는 상황에서 왓슨이 보수적인 성향이 강한 의학계에 연착륙할 수 있을지 주목된다.

저작권자 © 메디칼업저버 무단전재 및 재배포 금지