카이스트 전산학과 박종철 교수팀, 300만건 정보 쉽게 검색 가능

국내 연구진이 암 관련 유전자를 보다 빠르고 정확하게 찾을 수 있는 특화된 검색엔진을 개발했다. 메드라인에 탑재된 300만 건에 육박하는 암 관련 유전자에 대한 연구문헌을 통해 암-유전자 관련성에 대한 정보를 빨리 검색할 수 있다는 설명이다.

카이스트(KAIST) 전산학과 박종철 교수팀이 지스트(GIST) 이현주 교수와 함께 수행한 이번 연구는 언어학, 컴퓨터공학, 생물학 및 의학을 포괄적으로 연계하는 융합연구로 미래창조과학부가 추진하는 중견연구자지원사업의 지원으로 수행됐고, 연구결과는 생물학 분야 학술지 핵산연구(Nucleic Acids Research) 온라인판 5월 9일자에 게재됐다. 

암은 수천 개 이상 유전자의 비정상적 변화와 그에 따른 신호전달 체계 교란이 주요 원인으로, 암의 원인을 이해하고 치료하기 위해서는 유전자의 변화와 암과의 연관성을 이해하는 것이 중요하다.

연구팀은 의학 및 생물학 연구문헌에서 유전자의 발현량 변화와 유전자 변화에 따른 암 상태 변화를 기술하는 문장을 찾아내는 검색엔진 온코서치(OncoSearch, http://oncosearch.biopathway.org)를 개발했다.

온코서치는 텍스트마이닝 기술인 사건 정보 추출 시스템과 엔트로피 분류기를 사용해 문장의 구조를 심도 있게 분석, 유전자 발현량의 증감 및 암의 진행상태를 파악하도록 했다.

기존의 암 관련 유전자 정보 수집 기법들과는 달리, 암 관련 유전자 역할에 대한 명시적인 표현(oncogene, tumor suppressor 등)이 없어도 관련된 정보를 파악할 수 있다.

또한 메드라인에 등재된 모든 논문에서 1700종 이상의 악성종양과 7500개 이상의 유전자에 관한 문헌정보를 빠르고 정확하게 검색, 정보를 쉽게 수집할 수 있게 됨에 따라 암 연구의 질적향상에 기여할 것으로 연구팀은 기대했다.

박 교수는 “온코서치가 첨단 텍스트마이닝 기술을 사용해 연구문헌에서 자동으로 수집한 암 관련 유전자 정보를 검색가능하게 한다. 향후 자동 추론기술 등을 통해 암 연구를 위한 새로운 도구로 활용될 수 있다”고 의의를 밝혔다.

저작권자 © 메디칼업저버 무단전재 및 재배포 금지