뷰노, 인터스피치2020서 AI 음성인식 연구 발표

국내 의무기록 데이터 검증해 활용도 입증...AI 음성인식 모델 제시

[메디칼업저버 양영구 기자] 뷰노(대표 김현준)는 인공지능(AI) 기반 음성인식 관련 연구논문 2편을 인터스피치2020에서 발표했다고 28일 밝혔다.

뷰노는 이번 컨퍼런스에서 뷰노메드 딥ASR의 음성인식 엔진을 고도화하는 연구개발의 일환으로 착수한 2편의 논문을 발표했다.

두 연구 모두 음성인식 분야 연구 주제인 E2E(end-to-end model, 딥러닝 모델만으로 입력된 음성 전문을 즉시 문자화하는 방식)을 기반으로 음성인식 성능을 강화하는 내용을 담고 있다.

첫 번째로 발표된 연구는 E2E 모델을 기반으로 국문뿐 아니라 국영문을 혼용한 음성에서도 높은 성을 보이는 서브워드를 도출했으며, 자모음, 음절 조합, 바이트 등 다양한 국영문 음성인식 모델을 비교 분석했다.

그 결과, 문자 오류율, 단어 오류율, 문장 오류율을 현저하게 감소시켰다.

또 국내 병원의 의무기록 데이터를 기반으로 검증, 국내 의료환경에서의 활용도도 확인했다.

또 다른 연구는 자동 음성인식(ASR)에 신경망 구조 탐색(NAS) 기술을 적용한 새로운 음성인식 방법인 EST(Evoled Speech-Transformer) 모델을 고안하는 내용이다.

이 모델은 기존 방식 대비 낮은 단어 오류율로 높은 정확도를 기록하는 한편, 메모리 사용량은 최대 30%, 학습시간은 약 4% 줄여 성능을 입증했다.

이 연구의 성능 검증은 영문 데이터셋과 국문 데이터셋을 기반으로 진행, 향후 EST 모델이 국내 의료환경에서도 높은 성능을 보일 수 있을 것으로 기대된다.

뷰노 김상기 음성인식본부장은 “이번 인터스피치 연구 발표로, 뷰노의 인공지능 의료 음성인식 기술을 입증해 기쁘다”며 “이러한 뷰노의 기술력이 집약된 뷰노메드 딥ASR도 국내뿐 아니라 세계 최고 수준의 성능을 자랑한다”고 말했다.

이어 “이번 연구성과를 기반으로 뷰노메드 딥ASR을 고도화해 의료현장의 효율성을 효과적으로 높일 수 있도록 기여하겠다”고 말했다.

상단영역

본문영역