用Python下载爱奇艺VIP电影

爬取爱奇艺VIP电影


import requests                              

#   因为.ts文件就是视频的解码,一个ts文件就有几秒画面,所有一部视频可能有1000多个ts文件,所以在这里遍历循环下载ts文件 

for i in range(20):                                                
     url = "https://youku.cdn7-okzy.com/20200111/16621_33e37e94/1000k/hls/9daac15b8f300%04d.ts" % i    
     print(url)                            
     r = requests.get(url)                              
     ret = r.content                          
     
     # 将ts文件保存到文件夹里       
     with open('./video/{}'.format(url[-10:]), 'wb') as f:                                             
         f.write(ret)                                             
  • 运行程序后会得到如下结果:

  • 下一步我们就要把这些ts文件给合并成一个MP4文件,打开cmd,起换目录到video目录下,然后输入copy /b *.ts 决战中途岛.mp4,如下图所示:
    ![cmd下合并ts文件]

  • 打开文件夹后就可以看到合并成了一个决战中途岛.mp4的文件了

总结

  • 此方法可用于多平台的VIP电影
  • ts文件有许多,所以下载文件可能很慢,这个时候可以用多线程来解决下载速度了
#encoding utf-8
import requests
from queue import Queue
import threading


# 创建线程 生产者负责获取URL,并且解析URL
class Procuder(threading.Thread):
    headers = {
        'user-agent': 'Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)'
                      'Chrome/76.0.3809.132 Safari/537.36'
    }

    def __init__(self, num_queue, ts_queue, *args, **kwargs):
        super(Procuder, self).__init__(*args, **kwargs)
        self.num_queue = num_queue
        self.ts_queue = ts_queue

    def run(self):
        while True:
            if self.num_queue.empty():
                # 如果队列为空就,线程执行完成,跳出死循环,结束run
                break
            url = self.num_queue.get()
            self.download_ts(url)

    def download_ts(self, url):
        r = requests.get(url)
        ret = r.content
        filename = url[-10:]
        self.ts_queue.put((ret, filename))



# 创建线程 消费者 负责下载
class Consumer(threading.Thread):

    def __init__(self, num_queue, ts_queue, *args, **kwargs):
        super(Consumer, self).__init__(*args, **kwargs)
        self.num_queue = num_queue
        self.ts_queue = ts_queue

    def run(self):
        while True:
            if self.ts_queue.empty() and self.num_queue.empty():
                # 如果队列为空就,线程执行完成,跳出死循环,结束run
                break
            ret, filename = self.ts_queue.get()
            # 将ts文件保存到文件夹里
            with open('./video/{}'.format(filename), 'wb') as f:
                f.write(ret)
            print(filename + '  下载完成!')


def main():
    # 定义线程
    num_queue = Queue(2000)
    ts_queue =Queue(5000)
    for i in range(1000):
        url = "https://youku.cdn7-okzy.com/20200111/16621_33e37e94/1000k/hls/9daac15b8f300%04d.ts" % i
        num_queue.put(url)
    # 定义5个生产者
    for x in range(100):
        t = Procuder(num_queue, ts_queue)
        t.start()
    # 定义5个消费者
    for x in range(100):
        t = Consumer(num_queue, ts_queue)
        t.start()


if __name__ == '__main__':
    main()
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 一 列表 1 无序列表 ul li 2 有序列表 ol li 3 定义列表 dl dt表示被定义的内容 dd表示对...
    李玉贤_8e75阅读 179评论 0 0
  • 第2天上课内容 我们今天学习了超链接标签,列表,表格,内联...
    哈哈哈额哈哈哈阅读 327评论 0 0
  • 作业 day 02 </ a>超链接标签 1.用于定义一个可以点击跳转的连接 2 herf:...
    常樂_b00d阅读 215评论 0 0
  • MAVEN 简介 Maven是基于POM(工程对象模型),通过一小段描述来对项目的代码、报告、文件进管理的工具。M...
    summer96阅读 214评论 0 0
  • 记忆在岁月中铺展,深深浅浅的水印像是在沙盘上的白纸,狠狠的按下去留下的竟是不舍,隐约还能想起些许的留恋或是暗恋,...
    凉夏冬暖阅读 196评论 0 4