Python数据分析之定制化网易云音乐歌单

简介: 最近朋友圈刷疯了的几件事:圣诞节骗我艾特微信官方戴红帽老的跟树皮似的骗我晒18岁皂片明明开挂却骗我自己玩的跳一跳网易云听歌报告告诉我最爱tfboy支付宝关键词鄙视我太穷丢它脸个人特别喜欢听网易云音乐的推荐歌单(个人比较懒),但一个高播放量的歌单里的歌曲,不一定都喜欢,所以我爬取了9万多首歌曲,定制化了自己的网易云音乐歌单,数据情况本文爬取了部分歌单,及歌单中的歌曲,如图所示。

最近朋友圈刷疯了的几件事:

圣诞节骗我艾特微信官方戴红帽
老的跟树皮似的骗我晒18岁皂片
明明开挂却骗我自己玩的跳一跳
网易云听歌报告告诉我最爱tfboy
支付宝关键词鄙视我太穷丢它脸

个人特别喜欢听网易云音乐的推荐歌单(个人比较懒),但一个高播放量的歌单里的歌曲,不一定都喜欢,所以我爬取了9万多首歌曲,定制化了自己的网易云音乐歌单,

数据情况

本文爬取了部分歌单,及歌单中的歌曲,如图所示。


img_406dd22caf3a3d6955f96c4a8fb55d4d.jpe

img_05ae54812f59dc31908c93d609739665.jpe

img_4658f698ad359255d4c825c14b09c60b.jpe

数据分析

  • 歌单类别


    img_2e35a0aca30099884e4b392666a7fbdc.png

    总共爬取了673个歌单,由于爬虫中断了,并没有爬取所有的类别,但爬取的歌单类别中,分布还是比较均匀的。

  • 最火歌单
    通过对播放量的预处理(有的是以万为单位),这里全部统一为万为单位。


    img_41c8729f4928b7f59d022c985ba5458c.png

    周杰伦果然是一代人的回忆,通过排行也可以看出,对于大部分用户来说,华语的播放量还是最多的。

  • 歌手出现次数


    img_fa64e827f15d03403466b8aec8ee275e.png
  • 歌单推荐
    还是前面的问题,通过播放量,只能推荐已有的歌单,但有时候歌单里的歌不是所有的都喜欢听。说下自己的思路,有些歌出现许多次,这样我就给这个歌扩大播放量,这样排序,得到了华语歌曲的歌单。

img_852a23d46409165bde09593653d6833c.jpe
部分数据
相关文章
|
9天前
|
数据采集 数据可视化 数据挖掘
深入浅出:使用Python进行数据分析
在这篇文章中,我们将探索Python在数据分析中的应用,介绍几个关键的库,如Pandas、NumPy、Matplotlib,以及如何使用它们进行有效的数据处理和可视化。本文旨在为初学者提供一个清晰、简洁的指南,让读者能够快速掌握使用Python进行数据分析的基本技能,并通过一个实例加深理解。不同于其他文章的冗长解释和复杂示例,我们将以最直接、易懂的方式,让你迅速上手,即使是完全没有编程背景的读者也能轻松跟上。
|
4天前
|
Python 数据挖掘 存储
Python 数据分析(PYDA)第三版(七)(4)
Python 数据分析(PYDA)第三版(七)
|
Python Shell 存储
Python 数据分析(PYDA)第三版(七)(3)
Python 数据分析(PYDA)第三版(七)
Python 数据分析(PYDA)第三版(七)(3)
|
机器学习/深度学习 数据可视化 Python
Python 数据分析(PYDA)第三版(六)(2)
Python 数据分析(PYDA)第三版(六)
|
机器学习/深度学习 Python 数据挖掘
Python 数据分析(PYDA)第三版(六)(1)
Python 数据分析(PYDA)第三版(六)
|
4天前
|
Python 数据格式 XML
Python 数据分析(PYDA)第三版(三)(1)
Python 数据分析(PYDA)第三版(三)
|
4天前
|
数据挖掘 索引 Python
Python 数据分析(PYDA)第三版(二)(3)
Python 数据分析(PYDA)第三版(二)
|
3天前
|
存储 数据挖掘 索引
Python 数据分析(PYDA)第三版(二)(1)
Python 数据分析(PYDA)第三版(二)
Python 数据分析(PYDA)第三版(二)(1)
|
3天前
|
数据挖掘 Python 索引
Python 数据分析(PYDA)第三版(一)(3)
Python 数据分析(PYDA)第三版(一)
Python 数据分析(PYDA)第三版(一)(3)
|
7天前
|
机器学习/深度学习 数据可视化 数据挖掘
用Python进行健康数据分析:挖掘医疗统计中的信息
【4月更文挑战第12天】Python在医疗健康数据分析中扮演重要角色,具备数据处理、机器学习、可视化及丰富生态的优势。基本流程包括数据获取、预处理、探索、模型选择与训练、评估优化及结果可视化。应用案例包括疾病预测、药物效果分析和医疗资源优化,例如使用RandomForestClassifier进行疾病预测,Logit模型分析药物效果,以及linprog优化医疗资源配置。