[사이언스프리즘] 월 317억분의 비밀, 유튜브 알고리즘

황온중 입력 2019. 1. 23. 23:17
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

'세대불문' 월 3122만명이 이용 / 10대 86억분, 50대 79억분 시청 / AI로 맞춤형 추천 서비스 제공 / 편리함 속 '정보 편식' 우려도

최근 연예 오락과 정치 분야에서 유튜브와 관련된 뉴스가 쏟아져 나왔다. 유튜버라고 불리는 유튜브 크리에이터의 소득이 일반인의 상상을 초월할 정도로 많아 큰 주목을 끌었고, 유명 정치인의 유튜브 진출이 또한 화제가 됐다. 유튜브는 이제 단순히 하나의 동영상 사이트가 아니다. 유튜브는 정치, 경제, 사회, 문화, 국제관계 등 우리가 살아가는 거의 모든 영역에 관련돼 있을 정도로 범위와 영향력 면에서 이전의 어떤 미디어와 비교가 불가능하다.

유튜브가 이렇게 광범위한 영향력을 끼치고 있다는 것은 데이터가 보여준다. 유튜브는 전 세계 91개국에서 매달 19억명이 로그인을 하며 50억개의 비디오 영상을 보는, 구글 다음으로 가장 큰 검색 엔진이다. 1분마다 300시간 분량의 고선명 비디오를 포함해 400시간 분량의 비디오가 업로드되고 있으며, 현재 약 13억개의 비디오가 저장돼 있는 것으로 알려졌다. 이와 같은 인기는 국내에서도 별반 다르지 않다. 2018년 11월 기준, 10대는 물론 50대 이상 등 모든 세대에서 유튜브는 가장 오래 사용된 앱으로 나타났다. 앱분석 업체인 와이즈앱에 따르면, 유튜브는 3122만명이 총 317억분을 이용한 것으로 분석됐는데, 10대가 86억분으로 가장 오래 사용했으며, 50대는 79억분을 기록하며 2위에 올라 유튜브가 젊은 층의 전유물이 아니라는 것을 보여줬다.
정동훈 광운대 교수 인간컴퓨터상호작용학

유튜브의 성공 원인은 추천 알고리즘이다. 내 취향을 잘 분석해 내가 좋아할 만한 콘텐츠만 추천해 주기에 계속해서 유튜브에 머물게 된다. 모바일앱 데이터 제공업체인 모바일인덱스에 따르면 국내 이용자들은 하루 평균 약 1시간 동안 유튜브를 이용해 네이버 25분, 카카오톡 17분보다 압도적으로 많은 시간을 보내는 것으로 알려졌다. 주 이용층인 10대는 70분을 넘게 사용하고, 60대 이상도 55분 이상을 사용함으로써 20~40대보다 더 높은 시청시간을 보였다.

사용자가 좋아하는 영상이 제공될 수 있는 것은 인공지능(AI)을 활용한 추천 서비스 때문이다. 유튜브 동영상의 70%를 AI가 추천하는 것으로 알려져 있는데, 이로 인해 동영상 하나를 보고 나면 또 다른 눈길을 끄는 동영상이 연이어 나와 계속 영상을 보게 되는 식이다. 이 추천 서비스 기술은 구글 브레인 팀이 개발한 ‘텐서플로’라는 오픈소스 라이브러리에 의해 개발됐는데, 유튜브 모델은 약 10억개의 매개 변수를 배우고 수천억개의 예제로 훈련하며 개발됐다.

유튜브 추천 시스템은 크게 두 개의 신경망으로 구성된다. 먼저 추천을 하기 위해 수백만개의 비디오에서 고른 수백개의 후보 비디오군을 만들고, 이후 이 수백개의 후보군에서 10여개의 비디오를 순위를 매겨 제시하는 단계이다. 수백개의 영상을 고르는 단계에서는 크게 사용자의 특성과 비디오의 특성이 정의되는데, 이 단계의 학습과정에서는 사용자가 비디오를 끝까지 본 경우를 좋은 사례로, 그리고 스킵을 했을 경우를 부정적인 사례로 훈련시킨다. 비디오의 특성 분석도 중요하다. 무엇보다도 시간에 대한 훈련이 가장 중요하다. 상대적으로 오래전에 업로드된 동영상이 많이 노출되기에 비디오의 나이를 설정해 오래된 아이템이 더 자주 추천되는 것을 방지한다.

순위를 매기는 단계는 더욱 복잡하다. 수백개의 특성을 분석하는 데 가장 중요하게 평가되는 것은 사용자의 과거 사용 경험이다. 사용자가 이 채널에서 몇 개의 동영상을 보았는지, 이 주제에 대한 동영상을 마지막으로 본 시간은 언제인지 등을 분석한다. 물론 동영상 역시 정교화된다. 그동안 추천됐는데도 시청하지 않은 동영상은 순위를 뒤로 밀고, 감상시간이 길어질수록 가중치를 더 부여하기도 한다. 추천 시스템의 장점은 내가 좋아하는 콘텐츠에 지속적으로 노출됨으로써 ‘알아서 다 해주는’ 편리함을 누릴 수 있다는 것이다. 그러나 문제는 이것이 정치나 사회 문제와 같은 ‘가치관’과 연관이 될 때는 자신의 관점과 다른 콘텐츠에는 노출되지 않는 ‘필터 버블’에 갇힐 수 있다는 점이다.

유튜브는 대중의 인기를 얻었지만 동시에 가짜뉴스와 편향된 추천 알고리즘 시스템이라는 비판을 받고 있다. 기술은 이러한 문제를 해결할 수 있을 것인가. 기술은 정말 가치중립적일까. 기술을 만드는 인간의 혜안이 더욱 필요해 보인다.

정동훈 광운대 교수 인간컴퓨터상호작용학

Copyright © 세계일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?