<유튜브의 뉴미디어 1위 달성의 의미, 그리고 영상 매체의 미래>

<유튜브의 뉴미디어 1위 달성의 의미 >

Category: Technology


빅토르 마이어 쇤버거는 그의 책 '빅데이터가 말하는 세상'에서, Sampling은 전수조사 한계의 산출물이라고 말한다. 즉, 통계 조사에 있어서 Sampling이 정확하기 때문에 표본조사를 시행하는 것이 아닌, 전수조사가 불가능에 가까웠기 때문에 대신 표본조사를 수행했다는 것이다. 이와 유사하게 텍스트나 이미지 검색은 영상 / 4D / VR 및 AR수준 경험의 한계로부터 나온 산출물이었(던 경우가 많)다. 우리는 직접 볼 수 없으니 설명을 들어왔고(텍스트) 눈앞에서 볼 수 없으니  사진을 참고해왔다. 

최근 영상 컨텐츠 플랫폼인 유튜브가 각종 기타 SNS와 뉴미디어를 제치고 1위에 올랐으며, 이것이 의미하는바는 단지 영상이 소비하는 컨텐츠로써뿐만이 아니라 소통과 정보의 검색 수단으로써도 충분한 수준을 갖추었다는 점이다. 

사진출처: Pew Research Center
(http://www.pewinternet.org/2018/03/01/social-media-use-in-2018/)



영상 매체의 진화

온라인 상에서, 과거에는 ‘영상’이라는 매체의 공유와 소비에 있어 많은 한계가 있었다. 영상자료를 처리하고 공유, 저장할 만큼 처리능력과 저장능력이 받쳐주지 않았고, 따라서 온라인상에서 쉽게 소비할 수 있던 영상들은 환경에 맞추어 열화된 영상들이었다. 그러나 지금은, 몇 년 사이에 모바일기기와 온라인 환경에서 소비하고 공유할 수 있는 영상컨텐츠의 차원이 바뀌었다. HD에서 FHD, 그리고 QHD로 진화하고 전문 동영상 사이트가 아닌 페이스북과 같은 플랫폼도 720P 해상도는 기본적으로 지원한다. 유튜브에서는 4K해상도의 영상을 소비할 수 있으며 1시간이 훌쩍 넘어가는 동영상도 자유롭게 소비되는 환경이 마련되었다.

과거엔 영상으로 소비했다면 더 정확하고 좋았을 정보들을 기술적 한계로 인해 글로 표현했고, 고품질의 사진을 처리할 수준의 기술이 받쳐주기 시작하자 이미지가 이를 대체하기 시작했다. 온라인 쇼핑을 할 때, 원하는 상품을 찾을 때, 가보고 싶은 여행지를 찾을 때 우리는 보통 ‘사진’을 찾는다. 이제, 우리는 때로 정보를 찾기 위해 유튜브를 이용한다. 물론 영상을 이용해 정보를 검색한다는것에는 감수해야 할 단저미 있다. 첫번째로 영상이 짜여진 시간 순서에 따라 영상이 끝날 때 까지 감상해야 하고, 따라서 상대적으로 시간이 많이 소요되며 여기에서 컨텐츠/정보의 ‘제작자(혹은 유통자)’의 몫이 상당히 커진다는 점이다. (어떻게 영상을 구성하고 편집하느냐가 소비자의 정보 검색/소비에 상당히 많은 부분을 미친다는 것이다.) 그러나 유튜브만 봐도 수많은 리뷰영상이 수천 수만 좋아요(like)와 구독을 받고, 각종 정보를 소개하는 고품질의 영상이 증가하는 추세이며 이는 이제 영상이라는 매체가 단순히 소비하기위한 콘텐츠를 넘어서 정보를 얻기 위한 수단으로  발돋움하고 있음을 보여준다. 이제 더 이상 ‘영상'은 디지털 기기 위에서 ‘무겁지’않다.  

그렇다면 앞으로 동영상 서비스는 어떠한 길을 나아가게 될까? 첫번째는 너무나도 뻔한 이야기지만 기술의 발전에 관한 이야기이다.  디지털/온라인상의 생활패턴은 기존의 텍스트위에 이미지, 동영상이 더해지는 방향으로 흘러왔으며, 처리속도/저장기술은 점점 발전하고있다. 지금의 텍스트/사진을 보내는 것 만큼 동영상의 처리가 ‘instant’해지게 되면 동영상은 우리의 모바일 세상에서 더 이상 ‘무겁지’ 않게 된다. 이는 동영상이라는 매체의 사용이 더 가볍고 손위워진다는 이야기이다. 과거 스마트폰이 등장하기 전 페이스북에 사진을 올리기 위해서 우리는 USB  Type A 케이블과 변환 젠더를 사용해 작고 무거운 휴대전화기를 연결해야 했고, 컴퓨터로 사진을 전송하고 페이스북에 업로드하기까지 수많은 시간이 걸렸다. 사진을 보정하기 위해서는 추가적인 번거로운 작업이 따랐다. 그러나 이제 우리는 클릭 한번으로 사진을 보정을 물론 업로드까지 할 수 있으며, 모바일기기에 내장되어있은 얼굴인식 AI 소프트웨어가 자동적으로 사진 속 인물이 누구인지 (혹인 인물인지, 사물인지) 구별해 태그까지 달아준다. 물론 지금도 동영상이라는 매체가 ‘무겁다’라고 할 수는 없기에 ‘대체 이 사람은 2018년에 무슨 소리를 하는건가? 요즘시대에 동영상을 업로드하고 소비하는게 번거로운 작업이라는건가?’ 라고 생각할지도 모르겠지만, 내가 이야기하는 동영상의 ‘가벼움’이란 지금 모바일기기로 텍스트 내지는 사진을 처리할 때 체감하는 정도 수준의 가벼움을 말하는 것이다. 동영상 매체가 더 instant하고 가벼워진다는 것은 더 많은 동영상이 쉽게 소비될 수 있음을 말하며 전문 장비를 갖추지 않은 일반적인 end user들도 손쉽게 (지금은 복잡한) 작업을 수행할 수 있음을 말한다. AI와 같은 기술을 접목시키는 것 역시 쉬워질 것이다. 빅데이터와 머신러닝은 이미 영상 분석의 영역으로 뻗어가고 있다. (IBM Watson은 CT/MRI영상을 분석하여 정확한 진단을 하려는 노력을 진행중이다.) 


가까운 미래 

구체적인 (가까운)미래를 한번 그려보자. 유튜브가 인기를 끄는 이유 중 하나는 수많은 고품질의 영상 정보가 넘쳐나기 때문이다. 그러기 위해서는 많은 구독자, 시청자를 끌어모으기 위해 양질의 영상을 업로드할 동기가 필요하다. 구글에 유튜브가 인수된 이후 적용된 광고 수익창출 모델은 이를 성공시켰다. 그렇지만 이에는 한 가지 부작용이 있다. 영상 조회수와 광고 노출 정도가 수익에 비례하기 때문에 시청과 클릭을 일단 유도하게 만드는 (하지만 정작 내용이 부실하거나, 부적절하거나 제목과 상관 없는) 컨텐츠들 (이를 정크 컨텐츠라고 부르겠다)이 양질의 컨텐츠들만큼이나 많아졌다. 나는 실제로 이런 정크 컨텐츠들이 수많은 댓글과 조회수를 기록하고 있음에 놀랐고, 그들이 이로 큰 수익을 올리고 있을 거라는 생각을 하자 고민하지 않을 수 없었다. 우리는 원하는 정보/컨텐츠와 관련된 검색어를 입력한다. 우리의 검색어와의 연관성 정도에 따라 유튜브는 영상을 노출시킨다. 나에게 노출된 이 영상이 실제로 내가 검색하고자 했던 내용에 부합하는지 어떻게 알 수 있을까? 가장 확실한 방법은 영상을 끝까지 시청하는 것이다. 내가 원하는 영상이었다면 나는 like를 누를 것이고, 그렇지 않다면 불만을 표하며 다시 다른 동영상을 클릭할 것이다. 구글이 발전시킨 검색 알고리즘은 ‘전혀 관계없는’검색어가 노출되는것을 꽤 효과적으로 방지하고 있다 (‘고양이’를 검색했더니 경기도 고양시가 나온다던지). 그렇지만 만일 많은 조회수로 수익을 올리고싶어하는 유튜버가, 고의적으로 교묘하게 정크 컨텐츠가 일정 검색어에 노출되도록 유도했다면 어떨까? 이를 피하기 위한 가장 확실한 방법은 영상의 내용을 보는것이다. 그러나 아마 아주아주 가까운 미래에, 우리는 영상을 끝까지 볼 필요가 없다. 영상은 충분히 ‘가벼워’지고, 한때는 범죄과학 수사실에서 고가의 소프트웨어를 통해서만 할 수 있었던 영상분석이 단순한 동작만으로도 당신의 스마트폰 안에서, 단 몇 초 만에 완료될 것이다. 심지어 과거의 수준의 평면적 영상분석이 아닌, 영상의 내용과 컨텐츠, 맥락, 그리고 당신의 흥미와 부합하는지 여부까지 기계학습을 통해 알아서 분석해줄 것이다. 이러한 시스템은 양질의 영상을 남기고, 정크 컨텐츠는 알아서 떨어져나가게 만드는 효과를 가지기 때문에 온라인상의 영상 컨텐츠의 수준이 전체적으로 향상되는 선순환을 일으킨다. 더 많은, 더 나은 데이터(영상)은 또 다시 더 나은 알고리즘을 만들어낸다. 어쩌면 영상을 끝까지 시청해야만 하는 패러다임도 어떠한 미래의 알고리즘으로 인해 바뀌게 될 지도 모른다. 

매체에 우리의 현실을 그대로 반영하고자 하는 인간의 욕구는 2D에서 3D, 그리고 4D로 나아가는 자연스러운 움직임을 만들어냈다. (물론 여기서 말하는 4D는 4차원의 세상을 이야기하는 것이 아니라 디지털 미디어에서 흔히 말하는 4D를 말하는 것이다. 단순히 3차원의 이미지를 넘어 매체를 통해 시각 이상의 감각을 전달해 주는 것) 2D애니메이션에서 3D애니메이션으로, 사진에서 영화로, 그리고 이제는 4D영화도 보편화되었다. 언젠가는 ‘영상'이 이 움직임의 ‘끝’인 것처럼 보였다. 문명의 탄생 이래 사람들은 약 5천년간 종이위에 표현하고자하는 것을 그려왔다. 19세기부터는 사진이 보편화되었고, 사진을 찍기 시작한지 200년도 채 안되서 작은 손 안의 화면에서는 사람들이 살아 움직인다. 영상은 마치 현실을 그대로 담은 것처럼 보였다. 그렇지만, 여전히 영상은 화면이라는 벽 속 안에 같혀있다는 한계가 있다. 적어도 우리가 디지털 도구를 사용해 구현한 모든 것은 화면 안에 같혀있었다. 




그러나 이제 우리는 영상을 넘어 VR, 그리고 AR을 향해 나아가고 있다. 어쩌면 현재의 영상매체는 화면을 벗어나지 못한 매체의 마지노선을 지키고 서있는지도 모른다. 우리는 여전히 텍스트, 사진, 그리고 동영상 매체를 사용하겠지만 그것들은 지금은 상상도 하지 못할 정도로 ‘가벼운’작업이 될 것이다. 유튜브는 벌써부터 발빠르게 VR 도구를 사용해서 간접적인 VR 경험을 할 수 있는 영상 콘텐츠를 취급하고있다. 이런 유튜브라면 이미 현실에 더 가까운 경험을 제공하기 위한 영상매체 이후의 패러다임까지 고려하고 있음에 틀림없다. 다시 말하지만 우리가 지금 소비하는 텍스트, 사진, 영상 모두 상위 단계의 경험(텍스트>이미지>영상>VR>현실)에 대한 한계의 산출물이다. AR 과 VR experience는 현실 경험의 바로 아래 단계에 위치하고 있을까? 아니면 현실 경험을 더 가까이 반영하기 위한 사이의 새로운 단계가 등장하게 될까? 그리고 그 때의 사진, 영상처리기술은 얼마나 더 가벼워져있을까?





---
참고자료:

Youtube 상승세 관련 기사:
http://www.pewinternet.org/2018/03/01/social-media-use-in-2018/
http://www.segye.com/newsView/20180316000326
http://www.cine21.com/news/view/?mag_id=89680


댓글

이 블로그의 인기 게시물

[Python mini projects] Python을 활용한 텍스트 속 유의미한 통계 산출하기 -1

Kaggle competition 간단후기

(2부) 플랫폼 비즈니스,그리고 카카오의 수익모델에 대한 idea