5万余首圣诞歌词数据包+Kaggle数据科学家的脑洞=?(附数据包+代码)

  1. 云栖社区>
  2. 大数据文摘>
  3. 博客>
  4. 正文

5万余首圣诞歌词数据包+Kaggle数据科学家的脑洞=?(附数据包+代码)

技术小能手 2017-12-25 16:00:50 浏览3807
展开阅读全文

昨天在python给你的圣诞帽上意犹未尽的动手党(点击查看相关文章),今天的话题依然和圣诞节有关。

前几天,文摘菌发现了一个Kaggle上的圣诞歌曲数据礼包。这里有你能想到所有的圣诞歌曲,总计超过5万首。而Kaggle上的数据科学家用各种方式要把它们玩儿坏了,一起看看有哪些有趣的结论!

又是圣诞节,有没有被大街小巷的圣诞歌曲洗耳朵?有没有想过这些圣诞歌曲到底有什么魔力?他们的歌词又有什么共同点?

我们把所有跟圣诞有关的歌曲都打包起来,总计超过5万首歌曲。在这篇文章里,文摘菌将首先用朴素贝叶斯对这些歌曲文本进行全面分析,来快速识别出,到底什么样的歌曲才能被成为真正意义上的圣诞歌曲。

之后,我们还可以一起看看,kaggle上的数据科学家用这个数据包分析出了的这些有趣的结论:

与圣诞关系最密切的歌词TOP20;
圣诞歌产量最高的歌手TOP20;
圣诞



网友评论

登录后评论
0/500
评论