한국인 및 아시아인 특이적 표준 유전체 구축 통해 정밀의학 실현 선도

인간 유전체 분석은 부작용 없는 치료제 개발로 이어질 수 있어 각국에 도전하고 있는 학문인데, 가장 완벽한 유전체 분석을 한국이 완성했다.

현존하는 유전체 정보 중에 가장 완벽한 인간 표준 유전체가 지도가 완성됐다.


현재까지 인간 유전체 분석은 과학적 신뢰도와 호환성을 확보하기 위해 미국 국립보건원 산하의 국립생물정보센터(NCBI, National Center for Biotechnology Information)에서 제공하는 서양인을 중심으로 하는 'GRCh38'을 전세계 공통 표준으로 하여 진행되어 왔다.


그러나 이 표준 유전체에는 한국인을 포함한 아시아인이 가지고 있는 특이적인 유전자 정보가 반영되어 있지 않아 질병연구 또는 신약개발 시 이러한 유전적 특이성과 직접적으로 연관된 사항들이 충분히 고려되지 못했다. 따라서 정상적인 한국인이나 아시아인에서 질병 관련 유전자 변이 또는 유전자 기능 변이가 있는 것으로 보고되는 사례가 빈번했다.

서울의대 유전체의학연구소는 이러한 서양인 중심의 표준 유전체의 한계를 극복하기 위해서 아시안 표준 유전체 프로젝트(Asian Reference Genome Project)를 수행해 왔다. 그 첫 번째 연구성과로 2009년 7월 북방계아시아인의 전형으로서 한국인 'AK1'의 유전체를 분석하고 그 결과를 네이처에 발표했다.

연구소는 국제 표준 유전체와 비교하여 분석을 진행하는 기존 방법 대신 롱 리드 시퀀싱(long read sequencing) 등 최신 서열분석 기술들과 신생 조합(de novo assembly) 알고리즘을 사용하여 한국인을 대상으로 최고 완성도의 아시아인 표준 유전체를 완성하게 됐다.
네이처지는 전세계 언론에 배포한 논문 보도자료에서 "이번에 발표된 한국인 표준 유전체는 현존하는 유전체 중에 가장 완벽한 표준 유전체이며 동시에 인종 특이적인 최초의 표준 유전체이다. 아시아인 표준 유전체로써 미래 정밀의학에 사용할 수 있는 의학용 표준 유전체이다."라고 소개했다.

현재의 인간 표준 유전체 GRCh38에서는 기술적 한계로 인해 확인이 불가능한 190개의 DNA 영역(DNA region)을 공백 상태로 남겨 두고 있어서 표준 유전체로서의 활용도에 한계가 되고 있는 것으로 지적되고 있다.

서울의대-마크로젠 공동연구팀은 이번 연구를 통해 기존 표준 유전체에 존재하는 총 190개의 공백 중 105개(55%)를 완벽하게 밝혀냈고, 부분적으로 해결된 72개까지 포함하면 93%의 공백을 밝히는 데 성공한 것이다. 이것은 최초의 표준 유전체가 발표된 2003년 7월부터 2016년 GRCh38까지 지난 14년 동안 기술적으로 해결되지 못하고 공백으로 남아 있던 190개의 지역이 대부분 본 연구팀에 의해서 해결되면서 완성도를 높였다.

또한 770만 개의 염기에 해당하는 1만개 이상의 전혀 새로운 삽입형(insertion) 구조 변이를 발견하여 인종 간의 차이를 밝혀냈다. 그 중 54개의 구조 변이는 유전자 발현이 일어난다는 점을 확인했고, 137개의 변이는 단백질 구조를 변화시킨다는 것을 확인했다.

특히 기술적 한계로 인해 표준 유전체에 누락되어 있던 800개의 인류 공통 구조 변이를 새롭게 찾아냄으로써 공동연구팀의 표준 유전체가 기술적으로 한 단계 진일보하였음을 증명했다. 더 나아가 연구팀은 POU2F3, HRASLS2 등을 포함한 다수의 새로운 아시아인 특이적인 구조 변이를 밝혀냈다.

이번 연구성과가 주목을 받고 있는 것은 15년전인 2001년 한국인 유전체 지도 초안 작성을 위해 서울의대 유전체의학연구소와 마크로젠이 공동 구축한 10만 개의 박테리아 인공 염색체(Bacterial Artificial Chromosome) AK1 BAC 클론을 사용하여 불분명한 구조 변이를 검증하고 부모의 유전체를 분리시키는 페이징(phasing)을 가능하게 하였기 때문이다.

페이징은 부모로부터 각각 받은 염색체로 구성된 한 사람의 유전체를 보다 정확하게 분석하기 위해서 이를 각각 분리하여 분석하는 방법으로 기존 유전체 염기서열 분석 기술로는 이러한 분석이 어려웠다.

공동연구팀은 각기 다른 유전체 분석 플랫폼인 PacBio RS II, HiSeq 등을 통해 확보한 유전체 데이터와 10x 지노믹스에서 제공한 연결성 정보(linked read), 그리고 BAC 클론의 염기서열 정보를 활용하여 유전자 변이들의 염색체 상의 위치를 정확히 확인하여 페이징을 구현하여 매우 정밀하게 유전형을 파악하는 데 성공했다.

공동연구팀은 독자적으로 수립한 이러한 새로운 접근법을 통해 최대 6500만 염기 이상 떨어져 있는 유전적 변이 간의 관계까지 규명하는 것은 물론 그 정확도 역시 97%까지 끌어올림으로써 이전 연구들보다 탁월한 성과를 달성할 수 있었다.

또한 공동연구팀은 부모로부터 받은 양쪽 염색체의 유전체 정보를 파악하는 것이 가장 어려웠던 구간 중 하나인 장기이식검사에 사용되는 조직적합항원 유전자를 재구성하는 데 성공하였다.

공동연구팀은 약물 대사 속도를 결정하는 CYP2D6 유전자의 유형을 정확히 규명하는 데에도 성공했다. 따라서 향후 각 개인의 약물 대사 속도를 정확하게 예측하여 약물 과용에 따른 부작용을 최소화할 수 있는 길이 열린 셈이다.

서울의대 유전체의학연구소 서정선 소장은 "이번 고정밀도 아시아인 표준 유전체의 완성은 아시아 정밀의학 계획을 수행하는 데 필수적인 기반을 확보한 것이다."라면서 "아시아 국가/민족별 표준 유전체 프로젝트에서 한국이 기술 주도권을 확보함으로써 향후 45억 아시아인을 위한 정밀의료를 선도할 수 있게 되었다는 데에 큰 의미가 있다."고 말했다.

서울의대 유전체의학연구소와 마크로젠은 이번 연구를 통해 확보한 표준 유전체 구축 기술을 '지놈아시아 100K 이니셔티브(GenomeAsia 100K Initiative)'의 연구 프로젝트에 핵심기술로 사용할 계획이다. 두 기관이 주도적으로 참여하고 있는 지놈아시아 100K 이니셔티브는 지난 2월 출범하여 향후 3년 동안 1,200억원을 투자, 아시아인 10만명에 대한 유전체 정보 분석 프로젝트를 추진하고 있다.

이 프로젝트는 남아시아 12개 국가와 동북아시아 7개국이 참여하여 50~100개 규모의 아시아인 표준 유전체를 구축하고, 미국의 정밀의학 이니셔티브(Precision Medicine Initiative), 영국 지노믹스 잉글랜드(Genomics England)의 100,000 게놈 프로젝트(100,000 Genomes Project) 등과 같은 서양인 중심의 대규모 유전체 분석 프로젝트와 연구성과를 공유하여 정밀의학 실현을 앞당기는 것을 목표로 하고 있다.

저작권자 © 메디칼업저버 무단전재 및 재배포 금지