全国站北京站

浅谈音乐:提升音乐推荐系统性能构想探讨,看完长知识了!

编辑:csm351
2019-01-03来源:百家号

  摘要:本文从用户的听歌数据入手,通过数据预处理技术提取相关特征,利用FP-tree算法得到歌曲之间的关联规则;在此基础上,利用DBSCAN聚类算法将歌曲根据其本身属性进行聚类,找到同类歌曲。最终把两者有机结合,互相补充,使新的推荐系统发挥更加理想的功能。
  关键词:歌曲;FP-tree;关联规则;聚类;推荐系统;DBSCAN


  一、推荐系统简介
  谈起推荐系统首先要从个性化推荐谈起。个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐其感兴趣的商品和服务。随着电子商务规模迅速扩大,商品数量和种类急速增长,顾客需要花费大量时间才能找到自己想买的商品。这种浏览大量无关信息和产品的过程会给用户带来极大的不便,从而导致消费者不断流失。为了解决这些问题,个性化推荐系统应运而生。本文主要研究大数据在音乐推荐系统中的应用。通过一些挖掘算法,发现数据之间的相关性,预测用户喜欢的歌曲类别以及更加具体的特点构建用户画像,快速准确推测使用者的喜好,及时为用户推荐更多感兴趣的信息、数据及链接,以达到方便用户吸引消费者的目的。
  (一)推荐系统现状和弊端
  现在商业智能平台上信息量呈爆炸式发展,但数据本身所具有的规模巨大和不稳定性,对人们如何准确迅速提取出有价值的信息,仍具有不可忽视的制约作用。比如,实际上喜欢听流行歌曲的用户,因参与合唱活动反复听了一些经典革命歌曲,使软件在他结束合唱活动后,仍然继续推荐大量经典老歌,导致出现不符合用户需求的情况。这就是由于推荐系统数据处理系统过于僵化造成的不良后果。所以,推荐系统还有很多方面的技术需要优化升级。
  (二)优化升级推进系统的创新点
  在设计推荐系统过程中,如果强化数据预处理技术,并采用关联规则与聚类算法相结合的方法,则会尽最大可能地避免推荐系统僵化的问题。1、强化优化数据预处理功能。在用户选择的歌曲中,并非都是用户所喜爱的,所以,需要将数据先进行简单处理。在用户选择过的歌曲中,将播放时间短于总歌曲时长60%的歌曲剔除;2、采用关联规则与聚类算法相结合的方法。听歌是一种较为个性的行为,单使用关联规则推荐,会导致推荐范围过于宽泛,没有针对性;单使用同属性歌曲推荐,会使用户永远无法尝试新的歌曲,无法了解与自己类似爱好用户的选择。所以把两者有机结合,互相补充,才能使新的推荐系统发挥更加理想的功能。使用关联规则是从每一位用户出发,挖掘听了“a”歌曲的人同时听的其它相关歌曲,形成“a”的关联规则。这样就可以在后续推荐中,为听了“a”歌曲的人推荐与“a”相关的其他歌曲。使用聚类算法是对歌曲的各项属性进行区别。各项属性包括节奏、发行时间、语言和情感等。在实际情况中,用户的喜好都是独特的,不能单纯的依靠其他用户的选择来推测,这样就可以做到,为听过“a”歌曲的用户推荐与其属于同一类别的歌曲。


  二、实际应用
  (一)关联规则FP-tree的应用
  在进行关联规则分析时,以每个用户在一个时间段的听歌情况为一个元组。值得注意的是,用户点击的歌曲并非都是他喜欢的,首先需要对其进行预处理,把用户听了一小部分就直接跳过的歌曲直接清除,进而排除异常值对最终结果的影响。首先,设定最小支持度阈值为50%,最小置信度阈值为75%,将每一位用户的每一首歌按照递减的支持度排序,并构造FP-tree。从树根处的节点向上寻找路径,挖掘频繁项集。例如,从h处向上的路径只有一条且支持度小于最小支持度阈值,所以没有包含歌曲h的频繁项集。在歌曲h挖掘完成后对其它歌曲用此方式挖掘FP-tree。从d向上两条路径中发现{c,d}支持度为50%和在歌曲c中置信度75%,满足条件。从歌曲c向上寻找路径,可发现{a,c}也为频繁项集,支持度为75%,歌曲c中置信度为75%。通过FP-tree算法,我们得到频繁项集{a,d},{a,c}。
  (二)DBSCAN聚类算法的应用
  第二组数据是以一首歌为元组,包括歌曲的各个量化的自身属性。用DBSCAN算法,每一个点代表一首歌,使数据聚类成簇,对歌曲进行分组。在实际情况中,一首歌曲的属性多种多样,有节奏快慢、发行时间、传达的情绪等等,每一个属性决定着一个维度,他们构成多维数据。属性种类越广泛,越齐全,得到的结果也将越精确。本次实验将其简化为二维,仅用节奏快慢和发行时间的数据进行聚类。这两类数据在去除单位后的数值上有差异,并不方便进行比较和处理。因此,要把数据进行标准化处理。通过该聚类算法得到歌曲分类为{a,c,g,h}、{b,d},其中,{f},{e}可算作噪声点。


  (三)两类算法结果综合分析的应用
  假设用户听了歌曲c,要对该用户推荐歌曲,综合结果如下:从上面两种方法中得到的两个关于c的结果,分别是关联规则{a,c}和同类歌曲{a,c,g,h},再将两个集合取并集,根据受欢迎程度(本次只按照点击量表示)将歌曲分别排序,推荐并集内热度高的歌曲。
  三、音乐推荐系统拓展延伸
  (一)音乐社交
  音乐推荐系统与音乐交流平台相结合。把音乐推荐软件可以搭建在音乐交流平台上,让获得相同或类似推荐的用户参与交流和分享,让最受青睐的歌曲及时得到分享,最大限度地发挥音乐推荐系统的作用。
  (二)音乐与天气
  音乐推荐与地域天气相结合。使喜欢关注天气预报的人,能方便的看到自己喜欢的音乐歌曲,使喜欢歌曲的人也能随时观察到他需要的天气情况。天气也是影响用户听歌的重要因素,把歌曲的特点与天气影响人们情绪变化规律的特点恰当地结合起来,在推荐歌曲时,根据该地区的天气预报选择歌曲。例如,在下雨天推荐舒缓温柔的歌曲,天气晴朗时推荐活泼欢快的歌曲,在炎热的夏天推荐清爽宜人的音乐歌曲。
  四、结束语
  推荐系统作为大数据的重要应用正在日新月异地发展创新,推荐系统可以由点到线,再由线拓展到面,继续呈扇面扩展开来,进而形成功能巨大的发散型推荐系统,使其信息数据和服务范围涵盖音乐、图书、影视、日常百货以及所有商品,为用户提供越来越全面、推荐更加精准化人性化的服务,实现企业商家效益最大化的目的。

关键词

中音联智库

共享基金

中音联化蝶商学院

邻居儿童音乐学院

新城市核心示范区学位房描述

新城市核心示范区学位房描述

分布于全国1000个城市的中国邻居儿童音乐学院CSMES学位房,是由中音联智库领衔的大师级设计团队统一打造,给予家庭儿童成员一个最为和谐与精致的生活及音乐文化学习小环境。......

  • 示范区楼盘申请方式
  • 核心示范区学区房的服务政策
  • 让孩子受益一生的好房子
  • 中音联认证

    中音联指数

    社区指导师事务所

    中音联博览会

    CSMES Forum More

    0