데이터, 작은 것이 아름답다
데이터, 작은 것이 아름답다
  • 더피알 (thepr@the-pr.co.kr)
  • 승인 2014.09.25 11:19
  • 댓글 0
이 기사를 공유합니다

데이터 분석 오해로 인한 마케터의 오류

[더피알] 1~2년 전부터 ‘빅데이터’가 거대한 유행을 만들어 내고 마치 만병통치약인 것처럼 얘기되고 있지만, 실상 그 안에 포함된 것은 기술적인 방법론이 대부분이다. 즉 ‘대용량 데이터를 어떻게 빠르게 처리할 수 있는가?’에 대한 이야기들만 넘쳐나고 있다. 데이터 분석에서 중요한 것은 데이터의 크고 작음이 문제가 아닌데 말이다.

‘작은 것이 아름답다’는 독일의 경제학자 에른스트 슈마허의 주장이다. 지금의 데이터 분석에 대한 접근을 보면 ‘작은 것이 아름답다’라는 이 개념이 얼마나 필요한지 깨닫게 된다.


데이터 분석 자체는 오래된 일이다. 따지면 기원전의 인류도 다양한 형태로 데이터를 활용했다. 다만 상대적으로 마케팅 · 홍보·광고 분야에서 새롭게 중요성이 부각되는 것일 뿐이다. 특히나 인터넷 시대에 들어서면서 사용자 행동을 추적할 수 있는 기술이 뒷받침돼 점점 정확성이 강조되고 의존도가 높아져가는 모양새가 되고 있다. 그렇다면 마케팅·홍보 분야에서는 어떻게 데이터 분석을 해야 할까? 혹은 어떤 규모로 데이터 분석을 해야 하는 것일까?

데이터 분석의 오해

영화 <머니볼>은 이러한 의문에 약간의 힌트를 줄 수 있다. 미국 메이저리그 오클랜드 애슬래틱스 빌리 빈 단장을 모델로 한 이 영화는 데이터 분석에 대한 많은 인사이트를 던져준다. 다음의 대화를 한번 보자.

피터 브랜드  다들 야구라는 게임에 대해 잘못 알고 있어요. 때문에 메이저리그 팀을 운영하는 사람들은 선수들에 대해 잘못된 판단을 하고, 팀을 잘못 이끌고 있죠. 죄송해요 (*빌리 빈도 역시 구단주다.)
빌리 빈  괜찮아.
피터 브랜드  단장들은 선수를 사는 일만 신경 쓰죠. 중요한 건 선수가 아닌 승리를 사는 거예요. 승리하려면 득점을 해야 하구요.


그래서 이들의 선수 평가는 OPS(On base percentage Plus Slugging percentage, 출루율+장타율)로 통일한다. 야구는 안타를 치든 볼넷을 고르든 출루를 해야 하고, 3개의 베이스를 거쳐 홈으로 돌아와야 득점을 올리는 경기다. 때문에 출루율과 장타율은 득점을 올릴 수 있는 확률을 말해 준다.

WHY’에서 출발

데이터 분석은 방법론이다. 데이터를 어떤 식으로 보고 어떻게 조합해서 서로 연관시켜 하나의 이야기를 만들어 내는 작업이다.

하지만 데이터 분석 자체가 ‘왜’에 대한 답을 주지는 않는다. 데이터 분석은 ‘왜 데이터 분석을 해야 하는가?’에서 출발해야 한다. 다시 말하면 무엇이 알고 싶은가를 규정하는 데서 출발한다. 그러면 어떤 데이터를 수집해야 하는지에 대한 답을 찾을 수 있다. 데이터의 종류와 크기도 이러한 과정에서 자연스럽게 결정된다. 영화 머니볼의 예를 적용해 보면 다음과 같다.


여기까지가 데이터 분석의 전반전이다. 출루율이 높은 선수들로 팀을 꾸렸다 해서 실제로 팀이 이기는 지는 검증해야 할 것이다. 데이터 분석이 내놓는 결과는 ‘확률’이다. 즉 높은 가능성을 내 놓는 것일 뿐이지 이것이 그대로 이루어지는 것은 아니다. 어찌되었든 2002년 오클랜드 애슬레틱스는 20연승 기록을 작성했고, 시즌 전체 동안 105승을 달성했다. (물론 이론의 여지는 많다.)

마케터의 오류

데이터 분석의 중요한 목적 중 하나는 예측이다. <아래 표> 선수의 기록을 보자. 이 선수의 생애 통산 타율은 0.294이며, 현재 0.326의 타율을 기록하고 있다. 따라서 이 선수의 타율은 앞으로 내려갈 가능성이 더 높다고 할 수 있다. 과연 그럴까? 아주 초보적인 방법으로 연간 타율을 가지고 분석해 보자.


엑셀 프로그램에서 추세선을 통해 2년 후의 결과를 예측해 보니, <그래프1>에서는 약 2년 후 0.25 정도로 하락할 것으로 나타났다. 그런데 2004년과 2005년의 결과 편차가 너무 크다. 신인 시절 경험을 쌓기 위해 출장한 기록이니 이번에는 해당 데이터를 빼고 다시 한 번 동일한 방법으로 예측해 보았다.

그랬더니 0.350 수준으로 향상되는 것으로 결과가 <그래프2>로 나왔다. 만약 이 선수의 신인 시절을 제외한다면 이 선수는 아직 전성기를 달리고 있고, 앞으로도 타율이 올라갈 수 있는 가능성이 크다는 결론이다. 신인 시절의 결과를 포함할지 안 할지는 선택의 문제다. 만약의 최근 5년의 결과만 놓고 본다면 더 높은 상승폭을 그릴지도 모른다.

▲ 클릭하면 크게 볼 수 있습니다.

데이터 분석 시 알고 싶은 ‘무엇’이 작고 구체적일수록 필요한 데이터를 수집하는 작업은 수월해지고, 결과는 더욱 정교해 진다. 마케팅 영역에서 가장 많이 범하는 오류가 이것이다. ‘우리 캠페인이 얼만큼 성공적이었는지 알고 싶어요’라고 했을 때, 필요한 데이터는 어마어마해질 뿐만 아니라 모호해지게 된다. 결과 역시 부정확한 예측이 될 가능성이 높다. 하지만 캠페인 홈페이지에 얼마나 많은 사람들이 방문했는지 알고 싶어요’라고 하면 결과는 한결 명확해진다. 한마디로 작게 생각하면 아름다워진다.

퍼블리시티 효과 분석

작년에 퍼블리시티(보도자료 배포)가 어떤 효과가 있는지에 대한 고민이 있었다. 아마도 모든 홍보 담당자들의 고민일 것이다. 당연히 이를 제대로 분석하기 위해서는 엄청난 시간과 비용, 그리고 기술이 필요하다.

하지만 생각의 틀을 바꿔보자. 어떤 미디어에 보도가 되든 결국 사람들이 관심을 갖게 되면 하는 일은 ‘검색’ 아닐까? 그렇다면 이런 가정을 수립해 볼 수 있다. ‘효과적인 커버리지는 검색량을 상승시킨다’. 다음 그래프는 동종 제품 2가지 사례를 비교해 본 것이다.

▲ 클릭하시면 크게 볼 수 있습니다.

공교롭게도 <그래프3·4>는 서로 다른 패턴을 보여준다. 오른쪽 그래프를 보면 확실히 커버리지와 검색이 같은 패턴을 보여 주고 있다. 반면 왼쪽의 그래프는 다른 결과를 나타내는데, 이것이 커버리지의 효과가 없어서인지는 장담 할 수 없다.

그럼에도 무언가 훨씬 구체적인 인사이트는 얻을 수 있다. 뿐만 아니라 무수히 많은 생각을 하게 만든다. 만약 왼쪽과 오른쪽의 매체가 서로 다르다면 이것은 매체의 영향력일 수 있다. 반면 동일한 매체라고 가정 했을 때는 메시지의 흥미가 이런 차이를 만들 수 있다. 이런 무수한 질문 속에서 좋은 데이터 분석과 인사이트는 나오게 된다.

데이터 분석은 끊임없는 과정이다. 그리고 충분히 큰 데이터가 더 정교한 예측과 정확한 인사이트를 주는 것도 당연한 이야기다. 하지만 그런 거대한 크기에 막혀서 데이터 분석을 포기 한다면 그보다 아쉬운 일은 없을 것이다. 누구나 감당할 만한 데이터, 쉽게 다룰 수 있는 데이터에 집중해 보자. 데이터 분석이 재미있고, 즐거워질 것이다.
 



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.