‘빅데이터‘라는 단어가 일상 속에 자리잡았다. 기업에서는 데이터를 활용, 분석해서 경영전략 수립에 적극적으로 활용하고 나섰다.
성공적인 비즈니스 분석을 위해 예측기법 등을 사용하면 또다른 고객과 새로운 시장을 발견해낼 수 있다는 기대에서다. 8일 SAS포럼코리아 주최 ‘빅데이터 활용전략’에서 발표된 다양한 사례를 소개한다. 

빅데이터, 분석하고 활용하기 나름 

금요일 오후 마트에 아기 기저귀와 맥주가 함께 잘 팔린다는 분석이 나왔다. 그 이유는 무엇일까? 마트에서는 어떻게 전략에 활용해야 할까?

 

카이스트 장영재 교수는 ‘빅데이터 이제 기업의 전술에서 전략으로’ 주제 발표를 통해 기업에서 빅데이터는 필수적인 수단이라고 설명했다.

그러나 아직까지 기업 내부에서도 필요성을 체감하지 못하는 경우가 많다.

분석결과에 대한 실무진의 반응은“와 정말 신기하다”,  “그런데 우리보고 어쩌라고?” 등으로 압축된다. 따라서 조직 전체로 빅데이터에 대한 이해를 구하고 활용방안을 논의해야 한다. 

빅데이터는 구체적인 의사결정 지원을 시스템화하는 장점이 있다. 분석팀이 분석결과를 현장과 공유하고 책임지도록 해야 한다. 

예를 들어 해외물류업체 UPS는 화물 운송 노선을 최적화하기 위해 텔레메틱스 센서 데이터를 활용한 배송시스템을 변경, 최적화했다. 4만6000대 이상의 화물 운송 차량에 부착된 센서 데이터를 수집해 운행속도, 방향, 제동, 동력 전달 성능 등을 분석했다. 불필요한 배송은 줄이고 넘치는 배송은 노선을 늘렸다. 

배송기사 1명이 매일 1마일 운행노선 단축 시 3000만 달러의 절약 효과가 있었다. 또한 매일 2000여건에 달하는 항공기 운항의 효율성을 높일 수 있었다.

올랜도 매직 NBA 시즌 티켓도 빅데이터를 활용해 수익성을 높였다. 내부 매출 데이터인 회원권, 스포츠상품, 시즌 경기 티켓 등과 외부 데이터인 온라인 시장 분석을 통해 모델을 개발했다.

시즌 티켓은 의사결정 트리 모델을 적용해 고객별 구매 이력과 재구매 패턴 분석으로 그룹화했다. 티켓 판매 데이터, 시장 트렌드 데이터를 토대로 수요 예측과 경기를 분석하고, 티켓 가격을 최종적으로 정할 수 있었다.

장 교수는 “의사결정에 필요한 정보는 분명히 기업 내부 어디엔가 있다. 이제 이런 복잡한 정보를 어떻게 의사결정에 활용할수 있는지가 관건”이라고 제언했다. 


마이크로 세분화하고 고객을 리딩하라

고객은 이제 다양한 경로로 온라인 채널에 접근하고 있으며, 기업은 지금보다 더 세분화한 마이크로 세분화에 나서야 한다.

GS홈쇼핑 배순성 부장은 고객 경험을 토대로 한 새로운 데이터 관리의 중요성을 역설했다. 우선 과거보다 고객 이용행태가 매우 복잡해졌다. 우수고객채널, 신규고객을 별도로 분석해야 한다. 최근에는 모바일로의 유입 비중이 높아지고 있는 것이 특징이다.

고객을 더 세분화하기 위해  과학적 데이터가 중요하다고 보고 있다. 상품 방문 경로를 보거나 구매경험 중심으로 타게팅이 필요하다. 이메일, SMS, DM, 모바일 등으로 경로방법을 정하고 맞춤 마케팅도 가능하다. 

홈쇼핑에서는 모바일과 PC를 독립적으로 운영하고, 기존처럼 대량판매가 아닌 다품종 소량으로 이동하고 있다. 고객경험에 따라 보여지는 페이지가 다르도록 운영하고, 소형화, 개인화를 추천하도록 하고 있다. 특히, 모바일에서의 푸시메시지는 강력한 채널로 활용할 수 있다.

배 부장은 “마케팅에서의 빅데이터는 개별 고객을 인식하는 것이다. 푸시 마케팅 전략을 구사해 제품 추천을 실시간으로 보여주도록 하고 있다. 기존처럼 수동적인 것이 아니라 먼저 고객을 리딩할 수 있도록 해야 한다”고 주문했다.
 

병원의 빅데이터, 질병예측과 연구 활성화 

병원에서도 활용하면 어떨까? 일단 환자들의 데이터를 분석해 질병예측을 해볼 수 있고, 연구 활성화도 가능하다. 

삼성서울병원 손희정 교수는 대장선종 발견 예측 작업에 나섰다. 수검자 중 대장선종이 발생할 가능성을 구해본 것으로, 최초 대장경 수검 이후 3년 내에 대장내시경을 다시 받은 환자 정보를 토대로 수집했다. 

전체 25만명 정도에서 대장경 비수검자, 수검자를 나누고 2003년 이전 수검자, 2003년 이후 수검자를 또 나눴다. 그리고 3년 이내 한 번 더 한 사람 중에 용종의 개수, 나이, 성별, 위험요인 등을 구했다. 최종적으로 분석대상자 5만8660명이 나왔고, 대장암 위험요인의 특성을 구할 수 있었다. 

이런 과정을 거쳐 용종에 대한 진단, 약처방, 조직정보, 분석 마트를 만들 수 있었다. 임상연구 데이터를 생성하거나 각자 조건에 의한 자료를 모았다.

손 교수는 “1차 변수를 선택해 성별, 나이 등을 추렸다. 용종의 개수, 사이즈, 모양 등이 위험요인으로 들어간다. 다른 검사결과로는 허리둘레, 체질량 지수, HDL 콜레스테롤을 나눴고, 흡연, 음주 등의 위험요인을 분석했다”고 부연했다.

최종적으로 환자의 질병예측 모형과 환자 스코어가이드를 만들 수 있었다. 용종의 개수, 위치, 모양 등은 데이터 분석 전에는 알 수 없었던 것이다. 즉, 빅데이터 시대에는 빠른 시간 내에 더욱 간편한 데이터를 활용할 수 있다고 해석했다.
 
손 교수는 “빅데이터 활용이 이어지면 연구 데이터 준비시간을 단축할 수 있다. 삼성병원에서도 데이터 분석의 편의성을 높이고 있으며, 파일럿 이후의 본격적인 데이터 구축에 나서고 있다”며 “연구자 주도의 임상연구 환경을 마련할 수 있고, 다양한 연구를 토대로 수검자들에도 질병 위험예측과 비율을 수치로 설명해줄 수 있을 것”으로 내다봤다.


심평원 청구자료로 병원마케팅, 산업 수요예측  

향후에는 건강보험심사평가원 청구자료를 활용한 병원 마케팅도 가능할 것으로 보인다.

건강보험심사평가원 김록영 부연구위원은 17일 개소하는 심평원 의료정보산업 지원센터를 소개하고, 현재 심평원이 가지고 있는 정보를 민간에오픈하겠다고 밝혔다.

특히 정부기관이라 하더라도 전국 단위의 전국민 대상 자료가 있는 곳은 많지 않다. 정부기관의 데이터를 오픈하는 ‘정부 3.0‘이 화두가 되면서 이들 기관의 데이터 활용방안이 논의되고 있다.

심평원은 건강보험청구자료가 있고, 국립암센터에는 중앙암등록자료, 한국보건사회연구원은

 
영아모성사망조사와 전국 다문화가정 실태조사, 통계청은 사망원인 자료, 신생아 자료 등이 있다. 안전행정부는 거주지 및 사망자료, 국세청은 소득수준 자료를 가지고 있다.

현재 심평원이 가지고 있는 정보는 총 60여종, 약 200억건, 용량으로는 52TB에 달한다.

구체적으로는 요양급여비용 청구명세서, 요양기관현황, 질병통계, 요양기관 종합 정보, 병원 평가정보, 환자 평가표 등이 포함돼있다.

심평원은 현재 센터를 통해 정보를 쉽게 오픈하는 방안을 모색 중이다. 지금처럼 정보공개를 청구하면 해당 데이터를 수작업으로 가공하는 것이 아니라, 홈페이지나 지원센터에서 언제든 자료를 꺼내갈 수 있도록 한다는 것.

다양한 요양기관의 정보를 가지고 있는 만큼 의료경영분석에도 충분히 활용가능할 것으로 내다봤다. 병원 정보 서비스 앱인 메디라떼, 굿닥, 닥닥 등과 함께 창업 지원이나 병원마케팅 서비스를 위해서도 공동작업을 시도해보고 있다.

나아가 제약, 의료기기 등의 연관산업에도 기여할 것으로 기대했다. 김 위원은 “처방빈도나 평소 질병 패턴을 통해 수요예측이 가능하고 제약이나 의료기기산업군에도 산업 확대나 신시장 발굴에 도움이 될 것”이라며 “조만간 업계와의 간담회를 통해 정보를 활용하는 방안을 함께 모색해보겠다”고 강조했다.   
  

저작권자 © 메디칼업저버 무단전재 및 재배포 금지