세계 최초 의료용 AI 왓슨 '찬밥'..한국도 미국도 "수련이 부족해"

허지윤 기자 입력 2018. 11. 24. 06:02 수정 2018. 11. 24. 09:58
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

세계 최초의 의료용 인공지능(AI)을 내놓으며 큰 관심을 모았던 IBM의 '왓슨(Watson)'이 세계 의료 시장에서 한계를 드러낸 분위기다. 국내에서는 2016년 12월을 시작으로 최근까지 일부 병원들이 ‘왓슨’을 잇따라 도입하고 있지만, 정작 IBM의 ‘홈 그라운드’라고 할 수 있는 미국 의료 현장에서는 외면받고 있다.

블룸버그 제공

22일 국내·외 의료계에 따르면, 미국 병원들과 의료진들 사이에서 왓슨의 기능을 놓고 회의론이 커지면서 세계 의료 시장을 겨냥한 IBM의 왓슨 헬스 사업의 성적은 좋지 않다.

실제 지난달 말 미국 IBM 본사는 왓슨 헬스(Watson Health)를 이끌어온 데보라 디산조(Deborah DiSanzo) 수석 부사장이 물러났다고 발표했다. 5~6월에도 미국 IBM이 왓슨 헬스 사업 조직 인원을 줄이는 구조조정을 실시한 것으로 알려진 바 있다. 왓슨 포 온콜로지(Watson for Oncology) 등 의료용 AI 사업이 당초 구상과 달리 실패했다는 평가가 내부에서 나온 것이다.

거대 IT기업이 의료용 AI를 신사업 분야로 노리고 남들보다 먼저 발을 내딛었지만 결국 보건의료 분야의 높은 벽을 넘지 못한 셈이다. IBM의 왓슨이 최근 시장에서 고전하는 이유는 무엇일까.

외과 전문의이자 미국 듀크대학교 의료용 AI 개발에 관여하는 에릭 세닌 황 듀크대병원 교수는 최근 기자와 만나 "미국 병원들 사이에서 IBM 왓슨에 대한 열기는 이미 식었다"며 "IBM이 기존 일반 소비자를 대상으로 한 기술과 의료인을 대상으로 한 기술·문화적 차이를 반영하지 못한 것이 주요 실패 원인"이라고 말했다.

‘왓슨 포 온콜로지(Watson for Oncology)’는 IBM이 개발한 의료용 인공지능 클라우드 기반 플랫폼이다. 암 환자 데이터를 입력하면 과거 임상 사례를 비롯해 선진 의료기관의 자체 제작 문헌과 290종의 의학저널, 200종의 교과서, 1200만 쪽에 달하는 전문자료를 바탕으로 △강력 추천 △추천 △비추천 등 3가지로 나눠 치료 방법을 의료진에게 제시한다. 의료진은 이 중 ‘강력 추천’과 ‘추천’을 환자에게 권장한다.

앞서 IBM은 왓슨을 시장에 내놓으면서 미국 텍사스대 엠디앤더슨 암센터와 미국 메모리얼슬론케터링(MSK) 암센터 등 유수 병원들을 핵심 협력사로 강조해왔다.

하지만 이와 달리 IBM이 왓슨을 개발하는 과정에서 의료현장과 긴밀하게 협력, 융합하지 못했다는 지적이 나온다.

실제 IBM과 엠디앤더슨 암센터는 약 700억(6200만달러)를 투입해 종양학 전문 지침(Oncology Expert Advisor)을 개발 중이었지만, 작년 초 엠디앤더슨 암센터가 계약을 해지하며 파열음을 냈다. 그 이후 병원들은 IBM과의 협력 계약을 거의 맺지 않았다. 12개 이상의 IBM 파트너 및 고객이 왓슨의 종양 관련 프로젝트를 중단하거나 축소한 것으로 알려졌다.

에릭 세닌 황 교수는 "IBM과 병원 간의 협력은 성공적인 협력이 아니었다"며 " IBM과의 프로젝트에 참여한 의료진 말로는 IBM 측에서 한달에 한번씩 병원에 나타났다 사라지는 식이였다"고 했다.

결과적으로는 저마다 다른 의료현장에서 ‘왓슨’이 정확성(일치율)과 효용성 등 장점을 크게 발휘하지 못하는 한계를 보였다.

미국 시장에서는 대형병원과 의료진이 IBM 왓슨 도입 필요성을 느끼지 못한다는 것이 문제다. 병원 특성상 다수의 의료진-환자 간 워크플로우(Workflow)를 중요하게 여기는데, 왓슨이 의료진과 환자 사이에서 얼마나 유기적으로 상호작용할 수 있는가를 따져보면 비용 대비 효용성이 떨어진다는 게 미국 의료계의 현재까지 평가다.

신뢰성 문제도 있다. 2015년 말 왓슨 포 온콜로지를 도입한 인도 마니팔병원이 앞서 공개한 3년간 IBM왓슨의 진료 성적을 보면, 유방암, 대장암, 직장암, 폐암 등 4가지 암 환자 1000명에 대한 왓슨의 판단은 실제 의료진(다학제 진료팀) 진단과 차이를 드러냈다. 직장암의 경우 왓슨의 치료 권고안과 의사 판단과 일치하는 비율이 80%로 높았지만 폐암은 일치율이 17.8%에 그치는 등 암종별로도 큰 차이를 보였다.

인천 가천대 길병원 인공지능 암센터 다학제진료실에서 의료진이 암 환자와 가족들에게 인공지능 ‘왓슨(Watson)’이 제시한 치료 과정을 설명하고 있다. /조선DB

가천대 길병원이 작년 왓슨 도입 1주년을 맞아 당시 발표한 연구결과에서 의료진과 왓슨의 의견 일치율은 55.9%였다. 4기 위암 환자에 대한 의견 일치율은 40%에 그치는 수준이다. 4월 건양대병원이 공개한 유방암 환자 100명에 대한 연구에서도 일치율은 48%에 머물렀다.

왓슨과 의료진의 치료법에 대한 의견 일치율이 높을수록 왓슨 결정에 대한 신뢰도가 높은데 그 결과가 나라·암종마다 다르고 성적이 저조한 것이다.

서준범 서울아산병원 인공지능 의료영상사업단장도 "아직 왓슨의 암환자 진료 정확성이 검증되지 않았다"고 지적했다.

백정흠 길병원 외과 교수는 "IBM의 왓슨은 미국 병원 등 서구 데이터를 기반으로 하고 있어 한국 의료 현장에 맞는 현지화가 필요하다"고 설명했다.

IBM 측도 인종, 나라마다 다른 질병 양상 및 의료체계, 문화 등으로 인해 낮은 일치율을 보이는 것이라고 밝히며 더 많은 데이터를 축적·학습시켜 기능과 정확도를 향상시키겠다는 의지를 내비쳐왔다.

국내에서는 지난 2016년 12월 국내 최초로 가천대 길병원이 왓슨을 도입한 이후, 부산대병원, 건양대병원, 계명대동산병원, 대구가톨릭대병원, 조선대병원, 전남대병원, 중앙보훈병원, 지샘병원 등 지방 병원들이 잇따라 도입했다. 길병원의 경우 홍보 효과를 톡톡히 본 데다 왓슨 도입에 따른 환자 만족도가 90%를 넘어서는 등 긍정적인 결과를 보기도 했다.

반면 ‘왓슨 도입을 전혀 고려하고 있지 않다’고 밝힌 서울 소재 한 대학병원장은 "왓슨의 진단이 의료진을 뛰어넘을 만큼 혁신적인 수준도 아닌데, 국내 병원들이 줄줄이 이를 도입하는 현상은 한국 특유의 냄비근성이 작용한 것"이라면서 "한편으로 수도권으로 환자 쏠림 현상이 이어지면서 이를 해결해보려는 지방 병원들의 어려움이 반영된 현상"이라고 말했다.

IBM 왓슨의 위기는 의료용 AI 개발에 나선 국내외 기업과 의료계에도 시사하는 바가 크다.

현재 마이크로소프트, 올림푸스, 메드트로닉 등 외국계 기업과 미국 듀크대, 스탠포드대학 등 해외 학계에서 저마다 ‘의료용 AI’를 개발 중이다. 우리나라에서는 과학기술정보통신부가 주도하고 국내 대형병원 25곳이 참여하는 ‘닥터 앤서’ 개발 프로젝트를 착수했다. 모두 ‘왓슨’의 한계를 뛰어넘는데 도전하고 있는 셈이다.

국내 의료용 AI 개발 기업 김현준 뷰노 대표는 "IBM의 왓슨 포 온콜로지는 좋은 시도였고 좋은 기술이라고 생각한다"며 "시행착오도 필요하지 않겠느냐, 좀 더 지켜봐야 한다고 본다"고 말했다.

에릭 세닌 황 교수는 "AI는 결국 매스(수술용 칼)와 같은 것"이라며 "의료현장의 실제 전문가와 얼마나 긴밀하게 협력하느냐가 의료용 AI 솔루션의 성패를 가를 것이라고 생각한다"고 말했다. 이어 그는 "단순히 기업의 좋은 기술을 시연하는 것에서 그치지 않고, 실제 의료 시스템에서 효과적으로 사용될 수 있는지가 중요한 요소"라면서 "개발 단계에서부터 간호사, 의사, 사회복지사, 약사, 환자 등이 모두 긴밀하게 협력해 어떤 기술 개발에 중점을 둘지 분석, 평가해야 한다"고 강조했다.

- Copyright ⓒ 조선비즈 & Chosun.com -

Copyright © 조선비즈. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?