这四十年来的香港歌坛在唱些什么,“南中国听歌最多”的数据分析师带你一探究竟

  1. 云栖社区>
  2. 大数据文摘>
  3. 博客>
  4. 正文

这四十年来的香港歌坛在唱些什么,“南中国听歌最多”的数据分析师带你一探究竟

小旋风柴进 2017-05-24 16:55:00 浏览1261
展开阅读全文

0?wx_fmt=jpeg


一、分析手段介绍


Step1 定义“那些年”和 “港式流行歌”


“那些年”:为了凸显港乐发展变化的轨迹,我将“那些年”定义为1970年到2010年,共40年,并以10年作为一个区间(年代),分别分析,以便对比。2010年后的歌就不纳入研究范畴,一来还没到十年,二来年代太近,最多只能算“这些年”。


“港式流行歌”:本着以人为本的思想,我先找到各个年代的代表歌手,再用爬虫[1]爬取歌手在这个年代发行的所有专辑(录音室专辑)的歌词。那么,什么又是代表歌手呢?这没有一个统一的标准答案,我暂且选取一些知名度高、作品量大和我比较喜欢(熟悉)的歌手。如八十年代的谭张梅陈、九十年代的四大天王等。


[1]爬虫不是虫,而是一种自动抓取网页数据的程序或脚本。


Step2 准备数据


定义明确后,我开始爬虾米音乐的歌词(因为虾米比较好爬…)

一共爬取了28位歌手502















































































网友评论

登录后评论
0/500
评论
小旋风柴进
+ 关注
所属云栖号: 大数据文摘