경희대 신수용 교수, AI과 정밀의료 발전 위해 필요한 기술 10가지 소개
목적을 갖고 누군가 인공지능을 오동작하게 하게 만들 수 있어 이에 대비하는 기술을 준비해야 한다는 목소리가 커지고 있다.
6일 삼성융합의과학원과 국가표준코디네이터실 주관으로 열린 '정밀의료·헬스케어 인공지능 세미나'에서 경희대 컴퓨터공학과 신수용 교수는 인공지능을 악용(Abusing)하려고 할 때를 대비해야 한다고 발표했다.
신 교수는 "인공지능, 특히 머신러닝 시스템 오동작을 유발할 수 있는 적대적 기술에 대응하는 기술이 필요하다"며 "안전한 학습 알고리즘이나 인공지능 기만에 대응할 수 있도록 변조된 데이터를 학습시켜야 하고, 어떤 데이터에 취약한지 분석하는 인공지능 취약성 분석 기술 등도 연구해야 한다"고 주장했다.
이날 신 교수는 앞으로 개발해야 할 10대 선정기술을 소개했다. 10대 선정기술을 보안·데이터·성능평가·유전체·학습으로 분류됐고, 정부가 '정밀의료·인공지능 국제표준 로드맵' 발간을 앞두고 있다.
첫 번째 기술은 인공지능 방지 기술이고, 두 번째는 학습데이터 보안기술이다.
인공지능이나 머신러닝에서 학습데이터와 학습모델이 노출됐을 때 프라이버시나 지적재산권 침해 등의 위협에 대응하는 기술을 개발해야 한다는 것.
세 번째는 Knowledge network 생성과 분석 기술이다. 사용자들이 데이터를 지식화하고, 지식화된 정보를 네트워크를 구성해 손쉽게 활용할 수 있는 기술을 개발해야 한다는 것이다.
신 교수는 "원천데이터를 지식화해 네트워크를 생성할 수 있는 기술과 생성된 지식 네트워크를 분석할 수 있는 그래프 마이닝 기술 등이 필요하다"며 "기존의 온톨로지 유사하지만 보다 고도화된 기술이 필요하다"고 말했다.
또 "비정형 데이터를 정형화하고 심층분석이 가능하도록 태깅하고 용어를 분류하고 사전화하는 기술도 중요하다"며 "미국 등은 잘하고 있지만 우리나라는 아직 공백으로 남아 있다"고 우려했다.
보안기술 |
AI악용(abusing)방지 학습데이터 보안 |
데이터기술 |
Knowledge network 생성/분석 비정형데이터 정형화 및 사전화 데이터 공유를 위한 Open data 표준화 |
성능평가기술 | 헬스케어 인공지능 평가 및 표준화 기술 |
유전체기술 |
신규 인간참조유전체 표현기술 유전체 분석 및 변이 표현 표준화 기술 |
학습기술 |
의료AI API 표준기술 의료 AI 학습과정 / 모델공유기술 |
다섯 번째 선정기술은 데이터 공유를 위한 Open data 표준화다. 데이터 공유를 위해 이종의 데이터를 표준화해 외부에 공개하는 기술을 말한다.
여섯 번째 기술은 헬스케어 인공지능 평가 및 표준화 기술이다. 헬스케어 인공지능에 사용되는 데이터의 종류와 범위에서부터 활용되는 알고리즘 유형과 성능에 이르기까지 전반적인 기준을 마련해야 한다는 것이다.
일곱번째와 여덟 번째는 유전체 기술이다.
신 교수는 "신규 인간참조유전체를 보다 다양한 정보를 표현할 수 있는 형태로 표현방법을 개발하고 표준화해야 한다"며 "NGS 게놈 해독기를 통해 해독된 인간 게놈 원시 데이터의 전처리 분석 방법을 표준화해야 하고, 최종적으로 정밀의료에 활용되는 유전자 변이 표현도 표준화해야 한다"고 주장했다.
또 "의료지능에 기반한 다양한 기능들을 의료시스템 개발에 이용할 수 있도록 제공되는 표준인터페이스 개발이 필요하고, 개인정보를 보호하면서 학습중간 결과물이나 학습된 모델을 공유하는 기술도 필요하다"고 말했다.
현재 정부는 급속하게 발전하는 정밀의료와 인공지능 분야에 정부도 국제표준 로드맵 발간을 하는 등 행보를 서두르고 있다.
최근 정부는 정밀의료·인공지능을 포함한 9대 국가전략프로젝트선정, 빅데이터 및 인공지능 기술이 적용된 의료기기 허가 ·심사가이드라인(안) 마련, 전자의무기록 외부보관허용, 산업엔진 맞춤형 웰니스 표준화 로드맵 및 정밀의료·인공지능 국제표준 로드맵 발간 등 분주하게 움직이고 있다.
특히 정밀의료와 인공지능은 사업 예비 타당성이 통과돼 각각 746억원과 1704억원이 책정돼 있다. 올해엔 정밀의료 35억원, 인공지능사업에 85억원 예산이 잡혀 있다.