Wednesday, November 2, 2016

판도라 - Thumbprint radio 간단 요약

원문은 https://engineering.pandora.com/the-magic-behind-thumbprint-radio-2c5b8103b71#.ekp74phzd 입니다.



  • 2014년 11월, (?) analyst, product maanager, security engineering manager, data scientist + 6 engineers 총 10명의 팀이 3일간 진행된 2014 하반기 사내 해커톤에서 My Thumb Mix를 만듬. 청취자가 '좋아요'를 누른 곡만 모아놓은 라디오를 제공하자는 아이디어
  • 회사 내부에서 좋은 반응을 받음. Product management, computational programming, data science 3개 팀에서 모두 좋은 반응을 얻어서 2015년 1월에 작은 팀 결성

아이디어

  • 판도라는 각 트랙마다 450가지 음악적 특성을 요약한 데이터를 보유. 이 데이터를 이용해 곡을 추천함. 
  • 사용자의 취향은 각 라디오 스테이션에서 사용자가 누른 좋아요/싫어요를 바탕으로 추출됨
  • Thumbprint radio는 이러한 기존 서비스보다 더욱 개인화된 라디오. (라고 주장함.)

연구 및 초기모델 개발

우선, 처음에 팀에서는 아래와 같은 내용을 연구함.
  • 여러가지 '좋아요' 곡을 어떻게 연결할 것인가
  • 어떤 곡에서 출발할 것인가
  • 새로운 음악을 어떻게 추가해넣을 것인지
총 8가지 초기모델을 만들고 이를 A/B 테스트 한 결과,
  • 완전 무작위로 섞는것은 안됨.
  • 비슷한 음악을 너무 오래 틀어주면 안됨
  • 비교적 최신곡, 흔한 곡으로 출발할 것
  • 약간의 무작위성과 새로운 곡을 섞어서 듣는 재미를 유지할 것
가 중요하다는걸 깨달음. 이 교훈은 판도라의 기본 라디오 기능에도 적용됨.

최종적으로는 아래의 두 가지 방법을 고려함.
  • 트랙간 무작위 재생 (track-level random walks): 이는 '좋아요'가 뜬 각종 트랙을 전부 랜덤으로 재생하는 것. 이 방법의 단점은 - 
    • 곡 선정 방식을 구체적으로 튜닝하기 어려우며,
    • 특정 곡만 계속 반복해서 재생하게 될 수가 있음.
  • 스테이션 단위로 무작위 재생:
    • 장점
      • 각 곡의 유형(장르 등)을 명확하게 설명할 수 있음
    • 단점
      • 각 클러스터(=스테이션 내의 트랙들)를 이용자가 얼마나 좋아하는지 알기 어렵다는 것 (즉, 스테이션 내의 트랙 중에 좋아요를 누른 것이 있다고 해서 그 스테이션에 있는 다른 트랙까지 좋아하는것 아님)
      • 트랙 간에 전환이 갑작스러울 수 있음
(역자 주: 이 부분에서 결과적으로 어떻게 문제를 해결했는진 생략되어있군요.)

최종적으로는, "음악적으로 말이 되는 무작위 재생"을 목표로 삼음.

제품 출시

최대 1억명의 이용자에게 이 서비스를 제공할 수 있도록 열심히 함.
(역자 주: 대폭 생략합니다.)

결과

상위 500개 스테이션보다 높은 유저 몰입(listening session engagement)을 보여줌
등등 자랑.