Python帮你打包下载所有抖音背景音乐

公众号两个月

5月和朋友聊天，决定开设一个公众号，以博客的方式每天记载Python知识和有趣的内容。之后经过前期准备与摸索终于在5月31号，首次在公众号尝试发文，而今已过两月时间。

公众号首次发文

刚开始每天下班就期待着开始自己所谓的创作，而现在每晚发愁该写些什么来满足大家的口味；起初媳妇儿大力支持我学习，如今因为写公众号没时间陪家人，时而会引发矛盾。细数两个月更新56篇的文章，用一位简书朋友的评论高产似母猪，哈哈....

简友评论

由于做公众号的初衷，是整理学习内容，而非多数人那样的想将自媒体作为副业，所以没有找过大号求推荐，也没有主动向其他公众号推荐文章。起初让朋友帮忙发个朋友圈扩散下，之后就是每天清晨转发下自己的文章，偶尔将文章转载至公司内网博客。大家都说东西再好不宣传也没人知道，但两个月下来收获了800粉丝，还是让我很感动。不知道还能这样每周五篇的坚持更新多久，因为自从开了公众号，每天都是2、3点睡觉，两个月下来严重缺乏睡眠，而且经常熬夜最近胃病又犯了。但对比之前每天回来刷刷抖音、看小说、做做饭的日子充实多了。只希望能得到家人和朋友们更多的支持，谢谢大家。

刚才提到抖音？

不知道什么时候开始，中国出现了南抖音、北快手的互文格局（东市买骏马，西市买鞍鞯...）。刚才提到了，之前比较喜欢刷抖音，对于我这种佛系程序猿，看网上这些整容妹子基本一个样。喜欢抖音主要是两个初衷，学做菜听音乐。朋友之前常说，人家抖音看妹子看的乐呵呵，你看人家做菜也能津津有味，一个人在那儿傻笑...民以食为天，我看到色香味俱全的菜，做的那么好吃的乐呵乐呵还不行么。
抖音捧红了很多人，也让很多本不怎么让大家熟知的歌曲、BGM，经过翻唱、混剪与视频搭配，从而传播大街小巷。什么“若不是你，突然闯进我心里...”亦或者“也许未来遥远在光年之外，我愿守候未知里为你等待...”，成了大家闲时在嘴边哼唱的调调。那么，有没有想过将这些好听的剪辑批量下载下来呢？

python链接抖音

python下载抖音内容的帖子网上有一些，但都比较麻烦，需要通过adb连接安卓手机后，模拟操作。我这么懒，这种事儿玩不来...那么，该如何获取抖音内容呢？网上搜了下大概有两种方式，一个是浏览器插件快抖，另外一个是我今天要说的抖音网页版。其实这两者差别不是很大，都是先将抖音内容下载至服务器后，通过开发简单网站配置域名后，让大家访问。让我们来看看抖音网页版：

抖音网页版

哎哟吼，居然看到了昨天爬虫的“乔奶奶”...当然今天的重点不是视频，而是下载它全站所有的音乐！当然看过了今天的文章，你使用同样的方式，简单改几行代码，就可以爬它全站的视频了...

爬虫实现分析

热歌榜内容

抖音热歌榜

大家先开看看这个抖音热歌榜歌曲，每页20首歌曲，一个55页。但细不细心大家都能发现，很多歌曲存在重复的问题。所以，等下爬虫的时候，我们需要先准备一个music_list,用来识别这首歌曲是否已经下载过了...

网页解析

网页分析

网页比较简单，一个div中包裹了一个ul>li*20,我们是不是该这样获取：

soup.find('div',{"class":"pull-left"}).find('ul').findAll('a')

如果你说是，那么一定没有好好看我前天整理的文章通过哪吒豆瓣影评，带你分析python爬虫快速入门:https://www.jianshu.com/p/ae38f7607902，我在文章中专门提到了一个小技巧，通过使用attr的属性进行快速解析，那么最快速的获取方式是：
soup.findAll('a', attrs={'onclick': True})
我们只需要获取所有的a标签，切这些标签中包含onclick这个属性即可。

巧用eval

我们解析到的内容通过attr['onclick'],可以得到他的属性open1('夜','http://p9-dy.byteimg.com/obj/61a20007a98954b0831d','')，如何能快速获取歌曲名字和url呢？这里我们需要用到一个eval的小技巧：

index = "open1('夜','http://p9-dy.byteimg.com/obj/61a20007a98954b0831d','')"
index[5:]
"('夜','http://p9-dy.byteimg.com/obj/61a20007a98954b0831d','')"
index_tuple = eval(index[5:])
print(index_tuple, type(index_tuple))
('夜', 'http://p9-dy.byteimg.com/obj/61a20007a98954b0831d', '') <class 'tuple'>
index_tuple[0]
'夜'
index_tuple[1]
'http://p9-dy.byteimg.com/obj/61a20007a98954b0831d'

ps:今天一个朋友说我写代码没注释，我这是现身说法的告诉你，如何能写出让别人压根看不懂的代码，就是不写注释啊，哈哈！
其实，代码我都在文章中一点一点的讲解了，所以没有写，但秉承着害怕大佬们取关的心态，我还是把注释加上吧...

代码实现

总体来说实现比较简单，全部代码如下：

# -*- coding: utf-8 -*-
# @Author   : 王翔
# @JianShu  : 清风Python
# @Date     : 2019/7/31 23:25
# @Software : PyCharm
# @version  ：Python 3.7.3
# @File     : DouYinMusic.py

import os
import requests
from bs4 import BeautifulSoup
import threading
import time


class DouYinMusic:
    def __init__(self):
        self.music_list = []
        self.path = self.download_path()

    @staticmethod
    def download_path():
        """
        获取代码执行目录，并在目录下创建Music文件夹
        :return Music文件夹全路径
        """
        base_dir = os.path.dirname(os.path.abspath(__file__))
        _path = os.path.join(base_dir, "Music")
        if not os.path.exists(_path):
            os.mkdir(_path)
        return _path

    def get_request(self, url):
        """
        封装requests.get方法
        如果为网页请求，返回网页内容
        否则，解析音乐地址，并返回音乐二进制文件
        :param url: 请求url（分网页、音乐两类）
        :return: 网页内容 & 音乐二进制文件
        """
        r = requests.get(url, timeout=5)
        if url.endswith('html'):
            return r.text
        else:
            return r.content

    def analysis_html(self, html):
        """
        根据获取的网页内容，解析音乐名称、下载地址
        调用音乐下载方法
        :param html: 网页内容
        """
        soup = BeautifulSoup(html, 'lxml')
        # 根据关键字onclick查找每个下载地址
        for tag_a in soup.findAll('a', attrs={'onclick': True}):
            # 下载格式'("name","link","")',通过eval将str转化为tuple类型
            link_list = eval(tag_a['onclick'][5:])
            music_name, music_link = link_list[:2]
            # 因为存在部分重复音乐，故设置判断下载过的音乐跳过
            if music_name in self.music_list:
                continue
            self.music_list.append(music_name)
            t = threading.Thread(target=self.download_music, args=(music_name, music_link))
            time.sleep(0.5)
            t.start()

    def download_music(self, music_name, music_link):
        """
        解析音乐文件,完成音乐下载
        :param music_name: 音乐名称
        :param music_link: 下载地址
        """
        _full_name = os.path.join(self.path, music_name)
        with open(_full_name + '.mp3', 'wb') as f:
            f.write(self.get_request(music_link))
        print("抖音音乐： {} 下载完成".format(music_name))

    def run(self):
        """
        主方法，用于批量生成url
        """
        for page in range(1,55):
            url = "http://douyin.bm8.com.cn/t_{}.html".format(page)
            html = self.get_request(url)
            self.analysis_html(html)


if __name__ == '__main__':
    main = DouYinMusic()
    main.run()

来让我们看看效果吧：

抖音音乐下载.gif

网站是通过nginx负载均衡搭建的，有一些链接已经失效了。最终下载了不重复的592首抖音音乐。

音乐下载内容

同样的，大家喜欢可以按照这种方法，尝试下载一下网站的抖音视频。

The End

OK,今天的内容就到这里，如果觉得内容对你有所帮助，欢迎点击文章右下角的“在看”。
代码与下载好的音乐，如果大家喜欢，公众号回复抖音音乐即可获取百度云下载链接。
期待你关注我的公众号清风Python，如果觉得不错，希望能动动手指转发给你身边的朋友们。
希望每周一至五清晨的7点10分，都能让清风Python的知识文章叫醒大家！谢谢……

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 211,948评论 6赞 492
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 90,371评论 3赞 385
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 157,490评论 0赞 348
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 56,521评论 1赞 284
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 65,627评论 6赞 386
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,842评论 1赞 290
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,997评论 3赞 408
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 37,741评论 0赞 268
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 44,203评论 1赞 303
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 36,534评论 2赞 327
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,673评论 1赞 341
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 34,339评论 4赞 330
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,955评论 3赞 313
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,770评论 0赞 21
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,000评论 1赞 266
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 46,394评论 2赞 360
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 43,562评论 2赞 349