하츠의 꿈

빅데이터 분석, 긍·부정을 넘어선 ‘정서 분석’과 ‘딥 러닝’의 가능성 본문

소셜 & 크리에이터

빅데이터 분석, 긍·부정을 넘어선 ‘정서 분석’과 ‘딥 러닝’의 가능성

명섭이 2015. 5. 7. 14:20

 

브랜드를 관리하는 입장에서 우리 브랜드가 소비자에게 어떤 반응을 얻고 있는지, 강점과 약점은 무엇인지, 경쟁 브랜드는 어떤 상태인지 등에 대해 궁금해 한다. 이런 것을 알아내기 위해서 많이 활용하는 방식은 양적·질적 연구를 수행하는 리서치(Research)이다.

리서치는 소비자의 반응을 알아내는 데에 여전히 유효하고 효과적인 방식이다. 그러나. 리서치는 결과를 알기까지 시간이 필요하고, 연구자의 가치 편향(bias)이 반영될 가능성이 크며, 응답자 대상·시간 등에 따라 결과가 달라질 수 있다는 문제를 안고 있기도 하다.

 

<OO 기업의 이슈 발생과 소멸 시기까지의 언급량 추이, TIBUZZ™>

특히나 브랜드에 중대한 문제가 발생한 경우 리서치는 효과적이지 못하다. 즉각적인 소비자의 정서를 파악하고 지속적으로 관찰하기 위해서는 온라인과 SNS 에서 생성되는 콘텐츠(빅데이터)를 바라보는 것이 더 효과적이다.

이슈와 관련된 글을 Crawling하여 분석하면 관련 글의 확산력으로 이슈의 지속 가능성을 예측할 수 있고, 함께 언급되는 연관 이슈를 찾아내어 대응책을 세울 수 있다.

 

 

빅데이터 분석, 긍·부정을 넘어 정서를 바라봐야.


심리학자 James(1884)는 감정(affect)을 기분(Mood)과 정서(Emotion)를 포괄하는 개념으로 보았다. 기분(Mood)은 긍정(Positive)과 부정(Negative)을 말하며 원인을 모르거나 지속 기간이 긴 특징이 있고, 정서(Emotion)는 발현되는 원인이 뚜렷하며 만족, 기쁨, 불만, 혐오 등 다양하게 표현이 된다고 하였다.

이를 브랜드 관리 차원에서 보면 긍정과 부정의 감정은 원인을 알기 어려우므로 대응책을 마련하기 쉽지 않지만, 세부 정서는 원인이 뚜렷하여 해당 정서에 상응하는 효과적인 방안을 수립하기 유리하다.

 

<'유기농' 관련 월별 연관어 흐름 분석, TIBUZZ™>

이런 것을 본다면 지금까지 바라보던 긍정과 부정 보다는 더 세밀한 감정 분석, 즉 정서를 바라봐야 한다는 결론이 나온다. 정서를 분석한다는 것은 상당히 복잡한 알고리즘이 필요하다. 특히 한국어는 미묘한 차이로 그 의미를 달리하기 때문에 기계가 파악하기 어려운 부분이 많다.

 

<2014년 세월호 관련 국민 정서 변화 분석, TIBUZZ™>

지금까지 개발된 분석 방식 중, SNS에서 많이 사용되는 단어 중 감정을 내포한 단어를 선정하고 각 단어를 10가지 정서로 설문조사 하여 DB화하고, 이를 토대로 감정을 분석하는 방식이 가장 앞서있는 방식이라 하겠다.(특허: 제 10-1330158호)

여기에 ‘부정성 효과’, ‘활성화 수준’, ‘강조 효과’ 등의 알고리즘을 추가하여 감정을 Tracking 하는 수준까지 발전되어 SNS 등의 짧은 문장에서도 상당히 근접한 결과를 얻어내고 있다.

 

 

기계적인 분석의 한계와 ‘딥 러닝’의 가능성


앞 서 말한 분석 방식은 현재까지 감정을 분석하는 가장 뛰어난 ‘기계 분석’ 방식이라 하겠다. 하지만 그러한 방식도 전체적인 흐름을 파악하기엔 부족안타깝게도 브랜드에 일어나는 모든 이슈에 완벽하게 대응하기에는 한계가 있다. 그래서 알고리즘이 아닌 사람이 직접 눈으로 봐야 한다는 말이 정답처럼 통용되기도 한다.

사람들의 감정을 분석한다는 것은 단지 브랜드의 감정 상태를 파악하는 것뿐이 아니다. 해당 이슈와 관련이 깊은 브랜드, 시간, 장소, 인물 등을 파악하는데도 유용하게 사용되고 이를 토대로 캠페인을 설정하거나 마케팅 Wording을 설계할 경우 소비자에게 쉽게 파고들 수 있다. 지금까지의 연관어를 넘어서는 정서적 동질감 또는 이질감에 따른 결과를 활용할 수 있기 때문이다.

 

<Seldon open source project>

다행스럽다고 해야 할까? 최근 글로벌에서는 머신 러닝(Machine Learning) 에 대한 관심이 뜨겁다. 그 중에서도 사람의 뇌 구조와 유사한 방식으로 문제를 바라보는 ‘딥 러닝(Deep learning)’에 대한 기술이 속속 공개가 되어 관련업계의 비상한 관심을 모으고 있다. 페이스북의 콘텐츠 추천 알고리즘인 토치(torch)와 미디어와 e커머스에서 상품 등 콘텐츠를 추천해주는 알고리즘인 셀던(seldon)이 작년 말 Open Source Project로 공개가 되었다.

 

<출처 : Google Deep Learning>

‘딥 러닝’ 기술은 구글, 마이크로소프트, 페이스북, 바이두 등이 핵심 기술로 많은 공을 들이고 있다. 반복적인 기계학습을 통해 구글은 유튜브 영상에서 무작위로 추출한 이미지 1,000만 장 중 고양이 컷을 골라내는 데 성공을 했다. 인식률은 사람이 눈으로 판별할 때 발생하는 오류율에 거의 근접한 수준까지 올라섰다.

기존 기술에 특정 분야에 적합한 신경망 조직을 구성하여(Ontology 등) ‘딥 러닝’ 엔진에 적용한다면 감정 흐름과 관련 깊은 장소, 시간, 인물, 브랜드 등 다차원적인 분석을 해낼 수 있다. 이를 기반으로 브랜드 전략을 세우고 위기를 관리한다면 지금과는 다른 개념으로 브랜드 관리가 가능해 질 것으로 전망된다.

 

 

Comments