大数据分析,带你认识一个你从未见过的周杰伦

周杰伦可以说是大多数90后的青春了,连我妈这种从来不咋看新闻的人也知道他。

你是否曾在初中时抄过他的歌词?你又是否曾经将他的歌词写进作文?

今天我就用大数据来分析一波他的所有歌词,带你认识一个你从未见过的周杰伦。

获取周杰伦的所有歌词

这件事其实不难,我们写个代码从QQ音乐上自动收集就行了。说来也是心酸,以前一直用网易云音乐的,后来周杰伦版权没了,就只能投身了QQ音乐。

代码我都开源出来了,也不用大家自己运行,歌词文件我都放在下面了:
https://github.com/godweiyang/lyric-crawler/tree/master/output

里面有两个歌词文件是关于周杰伦的:周杰伦_歌词.txt周杰伦_歌名.txt,分别保存了他出道以来唱过的所有歌曲的歌词和按照专辑分类的歌曲名称,当然不包括演唱会和Live版本。

一共整整174首!这个数量已经是相当多了,当然这里面还包括了蔡依林和他合唱的两首歌:《骑士精神》和《布拉格广场》,还有李玟的《刀马旦》等等,我也都算进去了。

谁作曲最多?

经过简单统计可以惊人地发现,在174首歌曲中,周杰伦亲自作曲的歌曲竟然高达171首!

那三首非本人作曲的分别是袁咏琳作曲的《画沙》、派伟俊作曲的《Try》和Funky Monkey Babys作曲的《你是我的OK绷》。

老杰迷应该都知道杰伦的作曲是有多么的牛批。《夜曲》一响,上台领奖,颁奖词都说的词穷了。时至今日这首歌还是我的手机铃声。

谁作词最多?

统计下来可以发现作曲量排名前五位的分别是:

  • 方文山:96首
  • 周杰伦:42首
  • 黄俊郎:15首
  • 徐若瑄:6首
  • 宋健彰:4首

大家应该都知道,周杰伦最好的搭档就是方文山。可以说方文山和周杰伦相互成就了对方,方文山的中国风配上周杰伦的曲简直就是天造地和。

而杰伦自己作词的歌也不在少数,虽然很多人都吐槽他的《等你下课》和《不爱我就拉倒》歌词简单土味,但不可否认的是他也能写出《晴天》、《稻香》这样的神级歌曲。

周杰伦最常用的词语

我对周杰伦所有的歌词统计了一下词频,生成了一个词云:

可以看到杰伦最常用的五个词语是:

  • 离开
  • 回忆
  • 微笑
  • 世界
  • 爱情

周杰伦前期基本都是苦情歌,常使用这些词也不足为奇。比如《退后》中的“天空灰得像哭过,离开你以后,并没有,更自由”,《晴天》中的“好想再问一遍,你会等待还是离开”,《花海》中的“不要你离开,距离隔不开,思念变成海,在窗外进不来”,等等等等。

而到了后期,特别是结婚后,这种歌曲基本就销声匿迹了,更多的是《告白气球》这种甜歌:“花店玫瑰,名字写错谁,告白气球,风吹到对街,微笑在天上飞”。

周杰伦最爱的季节

杰伦最爱什么季节呢?从他所有歌词中可以统计出,春夏秋冬四个季节分别出现的次数是:

  • 春天:7次
  • 夏天:17次
  • 秋天:33次
  • 冬天:18次

可以看出,周杰伦最爱写的季节其实还是秋天和冬天,这也符合他大多数歌曲都是苦情歌的实际情况。一首《枫》里的“缓缓飘落的枫叶像思念,为何挽回要赶在冬天来之前”,非常伤感。这首歌也成为了周杰伦唱的难度最高的歌之一,他本人几乎都没有在演唱会上唱过。

周杰伦最爱的天气

粗略统计了一下,周杰伦最爱的三种天气是:

  • 雨天:150次
  • 雪天:31次
  • 晴天:12次

其中雨天更是常客,《晴天》中的“刮风这天,我试过握着你手,但偏偏,雨渐渐,大到我看你不见”,《给我一首歌的时间》中的“雨淋湿了天空,毁得很讲究,你说你不懂,为何在这时牵手”。雨是最能寄托思念的物品,因此也成为了杰伦的最爱。

周杰伦最爱的心情

人有四种心情,喜怒哀乐,分析周杰伦歌词中出现的心情词语,常用的有这么几个:

  • 喜(开心):17次
  • 怒(生气、怒火):10次
  • 哀(难过、忧伤):41次
  • 乐(快乐):32次

可以看出周杰伦表达最多的情感是哀,其次是乐,其实这也是前期苦情歌太多导致的。比如《黑色幽默》的第一句“难过是因为闷了很久,是因为想了太多,是心理起了作用”,作为第一张专辑中的主打歌曲,当时就已经走上了苦情歌的路了。

2010年前后周杰伦歌曲对比

网上很多人都持有一个观点,那就是从2010年周杰伦的《跨时代》专辑开始,他的专辑质量就出现了明显下滑。很多人还因此嘲讽,说什么江郎才尽之类的话。那么事实真的如此吗?我们还是用数据来说话。

常用词语变化

首先来看看2010年前后的最常用词语有哪些变化:

可以看到2010年以前最常用的词语是:离开、回忆、微笑、时间,而2010年之后最常用的词语变成了:hey、公公、世界、我会、微笑、靠靠。可以看出确实用词上2010年之后明显变得不如2010年之前了,这也正常,后期方文山为周杰伦作词也不如以前多了。

作词变化

那么方文山后期到底还为周杰伦作了多少词呢?我统计了2010年前后方文山和周杰伦各自作词的数量:

  • 2010年之前:方文山52首,周杰伦20首,总共93首
  • 2010年之后:方文山29首,周杰伦16首,总共56首

可以看到,周杰伦2010年之后作品数量减少很多,这几年甚至都不出专辑了。这也没办法,杰伦也不小了,但是他的神专已经足够多的让人难以超越了。

而2010年之后方文山虽然作词总数大幅减少,但是占比依然是很高的,同时周杰伦自己作词的占比提升不少。这也抨击了那些说周杰伦成名后就和方文山关系不好了之类的言论,最后一个专辑《周杰伦的床边故事》,方文山都还为周杰伦作词整整6首!

做最好的自己

周杰伦引领了2000年后中国的流行乐坛,开创了中国风歌曲的先河,很多歌曲现在听依然感觉领先整个时代。

他一直坚持自己的风格,很多歌都具有教育意义。《稻香》诉说了对家乡的思念,《止战之殇》诉说了对和平的渴望、《听妈妈的话》诉说了对妈妈的感恩,等等等等。《千山万水》更是被国家博物馆收藏,他也成为了北京奥运会唯一一位独唱的歌手,排面十足。

就像周杰伦在《土耳其冰淇淋》中唱的那样,炫技、牛批就完事了,要做就做不一样的自己:

谁说拍中国风 一定要配灯笼
谁说写中国风 一定要商角徵羽宫
我干脆自己下车 指挥乐坛的交通
管他管他什么曲风

这首也是《周杰伦的床边故事》专辑中周杰伦一手包办了作词、作曲、编曲的炫技歌曲。不像《告白气球》那样为了迎合大众而写的口水歌,这首歌表达出了周杰伦自己的个性,编曲也非常的厉害。

感谢周杰伦,感谢你出现在了我的青春里。如果给我一次机会,我一定要去看一场你的演唱会!


   转载规则


《大数据分析,带你认识一个你从未见过的周杰伦》 韦阳 采用 知识共享署名 4.0 国际许可协议 进行许可。
 上一篇
让大家久等了,BERT推理加速终于开源了 让大家久等了,BERT推理加速终于开源了
前几个月一直有不少小伙伴问我要LightSeq的BERT推理加速代码,当时内部已经使用了,但是一直没空整理开源。 现在代码终于整理好了,写了一个简单的样例,大家有需要的可以使用起来了。 实现原理这里我直接使用预训练好的BERT模型,用户只需
2021-08-10
下一篇 
分析完吴亦凡的所有歌曲,我震惊了 分析完吴亦凡的所有歌曲,我震惊了
最近吴亦凡的事件闹的沸沸扬扬,相信不少吃瓜群众也都有所耳闻。 但咱们今天不谈他的事件到底怎么样,咱们来谈谈他的歌到底如何。 收集歌词我写了一个代码,从QQ音乐上收集了吴亦凡所有的歌词信息,自动汇总整理成一个txt文件,代码在下面:https
  目录