▲ 박상준 기자

우리나라는 국가가 환자의 정보를 모두 갖고 있는 세계에서 몇 안되는 나라다. 단일 보험제도를 채택하고 있기 때문이다. 게다가 IT(정보기술) 인프라도 잘 발달돼 있어 이를 축적하고 공유할 수 있는 클라우드 기술력도 세계적으로 손꼽힌다.

특히 이 정보를 질병 역학에 활용할 경우 그 파급력은 실로 엄청나다. 특정 질환의 유병 특성은 물론이고 이를 토대로 예방까지 가능해지기 때문이다. 신약도입이 많은 우리나라는 외국에서도 검증하기 어려운 안전성 평가도 가능하다.

이처럼 정보의 활용 가능성을 인지한 정부는 수 년전부터 국내 학회와 협력제휴를 맺고 환자정보를 무상으로 제공하고 있다. 이를 통해 각종 역학 및 특성화 연구에 활용하라는 것이다.

그러나 최초 의도와 달리 흥미로운 연구 결과가 나왔다는 소식은 수 년째 들리지 않고 있다. 영국의 UKPDS 연구와 같이 20년간의 축적 데이터를 통해 당뇨병 환자의 사망률을 분석한 자료라든지, 암환자들의 유병 특성 등에 대한 데이터도 없다.

또 최근 늘어나는 간질환에 대한 치료성과 및 간암예방 효과에 대한 국내 데이터도 아직 요원하다. 최근 문재인 정부의 공약사항인 치매도 빅데이터 분석을 통한 역학 데이터도 나올법하지만 없다.

왜 그럴까? 기자가 우연히 빅데이터 연구자의 업무를 들어다본 결과 그럴수 밖에 없다는 생각이 든 것이다. 빅데이터연구의 실체를 본 순간 연구 자체의 어려움보다는 데이터가 너무 복잡해 연구의 의지를 꺾는 느낌이다.

빅데이터라고 하면 흔히 이름, 성별, 나이, 기저질환, 유병기간, 치료약물명, 투약기간, 신기능, 간기능, 혈압, 지질 등 다양하고 수많은 정보가 일목요연하게 엑셀표로 정리돼 있는 것을 상상하지만 실제로는 환자별로 복잡한 알고리즘으로 되어 있는 형태로 받게 된다.

따라서 연구자들은 이러한 알고리즘을 보고 필요한 정보만 엑셀 형태로 일일이 바꿔야하는 작업을 해야 한다. 이렇다보니 전수조사는커녕 100만명의 모집단 분석도 어려운 현실이다.

최근 빅데이터 연구를 진행 중인 한양의대 전대원 교수는 "빅데이터를 활용하는 연구보다 데이터를 재정리하는 업무가 복잡하다"며 "또 원하는 데이터를 골라 쓰는 형태가 아니라 일일이 만들어야하기 때문에 최초의 연구 목적을 잘 정의해야 한다"며 조언했다.

잘 정리된 데이터를 제공받는다고 해도 연구의 신뢰성과 정확성을 확보하기 위해 기준 프로토콜정립에 심혈을 기울여야하는 입장에서 임상의들이 빅데이터를 활용한다는 것은 결코 쉽지 않는 적업이다.

이런 문제 때문에 많은 학회가 건강보험공단과 빅데이터 제휴를 맺고 있지만 이러다할 성과는 내지 못했던 것으로 추측된다. 게다가 더 아쉬운 점은 정보제공 기관이 이런 현실을 잘 모른다는 데 있다.

따라서 정부가 앞으로의 빅데이터를 활용한 의학연구 성과를 기대한다면 정보의 제공형태를 바꾸는 노력이 필요하다. 특히 모든 연구자들의 애로가 담긴 부분인 만큼 진정한 빅데이터 활용을 원한다면 한번쯤 고민해볼 부분이다.

다만 이런 정보가 한순간 뚝딱 만들어지는 것은 아닌 만큼 연구자들의 노력도 필요하다. 슈퍼컴퓨터를 사용해도 수일이 걸리고 데이터 용량도 엄청난 만큼 학회 또는 연구자들도 정보 요청시 명확한 기준을 제공할 필요가 있다.

저작권자 © 메디칼업저버 무단전재 및 재배포 금지