한국인 37만 명의 심전도 결과와 임상자료가 포함된 데이터베이스(ECG-ViEW’)가 구축돼 처음으로 공개됐다. 이에 따라 우리나라에서는 한 번도 공개되지 않은 대규모 임상의학 자료로 의학연구의 새 지평을 열 것으로 기대되고 있다.

아주의대 의료정보학과 박래웅 교수팀(박만영·윤덕용 박사과정)이 시스템바이오정보의학 국가핵심연구센터 김주한 교수, 서울의대 예방의학교실 박병주 교수팀과 공동으로 연구한 ECG-ViEW는 1994년부터 2011년까지 17년 간 아주대병원에서 진료를 받은 환자 및 정상인 37만 명에서 얻은 심전도 데이터 71만 건과, 성별, 나이를 비롯하여, 심전도 측정 1년 전부터 측정 후 한 달 사이에 발생한 모든 진단명과 약처방 정보 3700만 건, 검사결과 300만 건 등 다양한 임상 데이터가 포함돼 있다.

심전도 데이터가 포함된 대량의 데이터베이스 공개는 전 세계적으로 처음 시도된 것. 임상시험 검사결과를 모아 공개하거나 대학기관별로 임상데이터를 공개한 외국사례는 있어도 생체 데이터인 심전도 데이터가 대규모로 포함된 경우는 한 번도 없었다.

따라서 임상의학 데이터가 필요한 보건의료 분야는 물론 정보통신, 체육 등 다양한 분야에서 이 데이터베이스를 이용한 연구가 활발히 이뤄질 것으로 전망된다. 일례로 체육계에서는 자료에 포함된 정상인 자료 12만 건을 이용하여 그동안 알려지지 않았던 한국인의 정상 심장계측치를 구해 참고치로 활용하거나, 제약계에서는 특정 약물이 심장에 부정맥을 유발하는지 유무를 가리는데 활용할 수 있으므로 파급효과가 클 것으로 보인다.

연구팀에 따르면 이번 임상 데이터베이스 구축에서 두 가지 핵심 문제를 해결했다. 즉, 임상자료에서 개인을 식별할 수 없도록 개인정보를 보호하는 문제와 생체신호인 심전도에서 필요한 데이터를 추출해 내는 것이었다.

먼저 개인정보 보호에 대해서는 기초자료에서 개인을 식별할 수 없도록 개인 식별 정보를 모두 삭제하고, 민감한 진단명이나 민감한 약처방, 매우 높거나 낮은 값을 제거하고, 날짜 정보를 일정한 범위 내에서 무작위로 변경하는 등 개인을 식별할 수 있는 가능성을 모두 제거함으로써 문제를 해결했다.

그리고 심전도 데이터는 웹파싱(web parsing) 기술을 이용하여 상용시스템 내에 저장된 데이터를 순차적으로 모두 추출하거나, 광학문자인식(Optical character recognition, OCR) 기술을 적용하여 종이에 기록된 심전도결과지에서 측정값을 추출했다.

박래웅 교수는 "최근 건강에 대한 관심 증가로 다양한 분야에서 의학 데이터를 이용한 연구가 시도되고 있으나, 그동안에는 법적 제약이나 기술적 한계 등으로 사용할 수 있는 데이터가 없어 연구 활성화가 어렵다"며, "이번 ECG-ViEW 데이터베이스가 심전도 결과를 위주로 구축된 데이터베이스라는 한계가 있지만, 환자 정보, 처방 정보 및 검사결과 정보를 포함하고 있기 때문에 다양한 보건의료분야 및 정보통신 연구에서 유용하게 쓰일 것"으로 기대했다.

이번에 공개된 ECG-ViEW 데이터베이스 및 자료추출 프로그램, 프로그램 소스는 학술연구 목적으로만 공개되며, www.ecgview.org에 접속하여 비밀유지 서약 등의 절차를 밟아 신청하면 이용할 수 있다. 비용은 무료다.

이번 연구결과는 네이처에서 발간하는 "임상약학 및 치료학지(Clinical Pharmacology & Therapeutics)" 7월 온라인판에 게재됐다.
저작권자 © 메디칼업저버 무단전재 및 재배포 금지