빅데이터 임상활용연구회 김헌성 회장
"의료진은 '빅데이터' 아이템 어떻게 활용할지 판단하는 의학적 능력 갖춰야"

빅데이터 임상활용연구회 김헌성 회장. ⓒ메디칼업저버 김민수 기자
▲빅데이터 임상활용연구회 김헌성 회장. ⓒ메디칼업저버 김민수 기자

[메디칼업저버 박선혜 기자] 최근 보건의료 분야의 중요한 연구 트렌드로 자리 잡은 것이 '빅데이터'다.

우리나라는 빅데이터 연구에 활용할 수 있는 건강보험심사평가원의 진료비 청구자료, 국민건강보험공단의 검진자료 등 많은 데이터가 데이터베이스로 구축됐다는 장점이 있다. 보건의료 분야에서는 이러한 빅데이터를 적극적으로 활용해 과학적인 근거를 쌓아가는 중이다. 

빅데이터 연구로 의학적 정보(information)가 만들어지자, 이제는 정보를 임상에서 어떻게 활용해야 할지에 대한 구체적인 논의 단계로 넘어가고 있다. 

그 과정에서 의료진들의 적극적인 개입이 중요하다는 데 의료정보 전문가들의 중지가 모여, 지난해 1월 의료진들을 중심으로 한 '빅데이터 임상활용연구회'가 발족했다.

빅데이터 연구에 관한 의료진의 역량을 연구회가 만들어 주겠다는 취지로 설립돼 지난 1년 동안 두 달 간격으로 정기 세미나를 개최했다. 

연구회 김헌성 회장(가톨릭대 서울성모병원 내분비내과 교수)을 만나 1년간 성과와 앞으로의 계획 그리고 빅데이터 연구 과정에서 해결해야 할 문제점 등을 들어봤다. 

정기 세미나에 비의료진 참석 늘어… 올해부터 소모임 교육 시작

연구회는 지난해 1월 첫 세미나를 시작으로 약 1년간 총 7회 세미나를 열었다. 연구회 발족 당시 '의료 데이터를 잘 아는 사람은 의료진'이라 언급하며, 의료진의 연구회 참여를 독려했다. 그런데 예상보다 비의료진들의 관심도 상당해 시간이 지날수록 세미나에 참석하는 비의료진이 늘었다고. 

김 회장은 "첫 세미나 참석자는 약 200명이었고 지난달 열린 7차 세미나에는 약 340명이 참석했다. 누적 참석자만 1900여명"이라며 "처음에는 의료진들을 위주로 연구회를 운영해 의료진이 연구회에 많이 참여할 수 있도록 독려했다. 하지만 실제 운영하면서 의료진과 비의료진의 참석 비율이 5:5가 됐다. 비의료진들도 연구회에 많은 관심을 보이고 있다"고 설명했다.

세미나 참석자가 늘자 연구회는 2달마다 개최하는 정기 세미나와 함께 한 달에 1회 교육을 진행하는 소모임을 만들었다. 연구회의 주된 활동은 세미나이지만, 그 외에 부족한 부분을 채우기 위해 올해부터 소모임을 운영 중이다. 소모임 활동은 1년간 진행할 예정으로 최근 1차 소모임을 가졌다. 소모임의 운영에 필요한 교육비는 연구회가 지불한다. 

그는 "연구회 윤덕용 부회장이 데이터 과학자(data scientists) 교육을, 제가 디지털 치료제(digital therapeutics) 교육을 진행한다"며 "소모임에는 임상의사·간호사뿐 아니라 IT 회사의 대표이사, 변호사들도 다수 포함돼 있다. 신청자가 많아 경쟁률도 상당히 높아서 감히 선별하는 데 어려움을 겪었다. 인재 양성 측면에서 소모임 교육을 진행하고 있다"고 설명했다. 

정제되지 않은 데이터로 연구하는 것은 '어불성설'

연구회가 가장 중점을 두고 있는 교육은 데이터 질 관리(quality management)와 조작적 정의다. 질 관리나 조작적 정의가 제대로 되지 않은 연구 결과는 실제 임상에 적용하기 어렵다는 이유에서다. 

우리나라는 심평원, 건보공단, 각 병원의 전자의무기록(EMR) 데이터 등 빅데이터 연구에 사용할 수 있는 데이터베이스가 구축됐다. 데이터베이스를 분석해 '정보'를 만들고 이를 의학적으로 활용할 수 있는 '지식(knowledge)'으로 발전시키는 게 이상적인 과정이다. 

하지만 정보와 지식을 추출하기 위해서는 의료진들의 의학적으로 타당한 데이터 질 관리와 조작적 정의가 필요하다. 이 부분이 제대로 이루어지지 않으면 신뢰할 수 있는 정보와 지식을 얻기 어렵다. 

빅데이터 임상활용연구회 김헌성 회장. ⓒ메디칼업저버 김민수 기자
▲빅데이터 임상활용연구회 김헌성 회장. ⓒ메디칼업저버 김민수 기자

그는 "정제되지 않은 데이터로 연구하는 것 자체가 어불성설이다. 또 이 데이터를 인공지능에 활용하는 것 역시 잘못됐다"며 "그래서 연구회에서 가장 중점을 두고 있는 게 데이터 질 관리 교육이다. 의료진이 잘못된 데이터를 제대로 정제한 뒤 분석해야만 올바른 정보를 얻을 수 있다"고 피력했다.

이에 김 회장은 앞으로 빅데이터 연구 결과를 임상에 유용하게 활용하기 위해 지금부터라도 표준화된 데이터 구축이 필요하다는 데 무게를 둔다. 

그는 "데이터 질 관리 문제를 해결하려면 지금부터 데이터를 잘 쌓아가는 것이 중요하다. 이는 모든 의료정보 전문가들의 공통된 의견"이라며 "이런 이유로 데이터 표준화가 가장 중요하다"고 강조했다. 

데이터 질 관리와 함께 결과 분석과 해석에도 주의가 필요하다. 그는 결과 분석 및 해석 과정에서 나타날 수 있는 편향(bias)을 줄이기 위해서는 의료진의 역할이 중요하다고 강조한다. 

그는 "과거 당뇨병 환자 중 스타틴 비복용자는 인슐린 투약 시기가 늦어진다는 후향적 코호트 연구가 있었다"며 "하지만 이 연구는 스타틴과 인슐린 투약 시기의 연관성을 봤다고 할 수 없다. 스타틴 비복용자는 인슐린도 투약하지 않겠다고 할 가능성이 높기 때문이다. 즉 이 연구는 스타틴과 인슐린 투약 시기의 연관성이 아닌, 환자 성향에 대한 연구로 이해해야 한다"고 설명했다.

이어 "하지만 이러한 오류는 의료진이 아니면 알지 못한다. 그래서 의료진 없이 비의료진이 분석한 연구 결과를 어느 정도 신뢰할 수 있느냐라는 문제가 생기는 것"이라며 "현재 연구 목적의 빅데이터 연구는 가능하다. 그러나 이 결과가 실제 진료 현장에 어떻게 도움이 될지는 다른 이야기다"고 지적했다.

"연구회는 통계 프로그램 사용법을 교육하지 않는다"

빅데이터 연구에서 의료진의 역할이 중요하다면, 모든 의료진이 꼭 빅데이터를 배워 전문가가 돼야 할까? 이에 대한 김 회장의 답은 '아니다'다. 

의료진의 본분은 의료에 있으므로 우선 의료 분야의 전문가가 되는 것이 더 중요하다는 것. 여기서 어설프게 빅데이터 전문가까지 되려 한다면 오히려 두 가지를 모두 놓칠 수 있다고. 이 때문에 의료진은 빅데이터 연구의 최신 트렌드를 익히는 것만으로도 충분하다는 게 그의 생각이다. 

그는 "의료진이 통계를 잘해도 통계학 전문가를 이길 수 없다. 의료진의 본분은 의료에 있으며, 의료진은 빅데이터 연구 트렌드를 우선 익히는 게 중요하다"면서 "이에 연구회에서는 의학 통계에 활용하는 'R 프로그램'을 교육하지는 않는다. 그러나 이 프로그램으로 무엇을 할 수 있을지 알려준다"고 설명했다.

이어 "의료진이 프로그램으로 무엇을 할 수 있을지 알게 되면, 다음 단계로 통계 전문가 혹은 데이터 전문가를 만나면 된다. 우리가 원하는 방향은 바로 이것"이라며 "연구회가 의료진이 통계 등 빅데이터 관련 전문가를 만날 수 있도록 도와주되, 의료진은 이들과 만나 소통할 수 있을 정도의 실력을 갖추고 있어야 한다. 즉 의료진은 '빅데이터'라는 아이템을 어떻게 활용해야 할지에 대한 의학적 능력을 갖추면 된다"고 강조했다.

관련기사

저작권자 © 메디칼업저버 무단전재 및 재배포 금지