Python脚本-拉取最新上映电影免费看

  这是从id97拉取新上映电影的python脚本,很简单,如果需要拉取其它电影直接改一下正则表达式就可以了,程序测试环境:Win7 64位,Python 2.7。

  代码如下:

# -*- coding: utf-8 -*-

import urllib2;
import os;
import re;

# 找到电影
# <a\shref=\"http\:\/\/www\.id97\.com\/videos\/resource\/id\/(.+?)\"><img\swidth=\"100\%\"\ssrc=(.+?)\salt=(.+?)></a>
def getVideoList():
    url = 'http://www.id97.com/';
    user_agent = 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36'
    headers = { 'User-Agent' : user_agent }
    req = urllib2.Request(url, headers = headers)
    result = urllib2.urlopen(req);
    # print 'myResponse == ',myResponse;
    content = result.read();
    items = re.findall('<a\shref=\"http\:\/\/www\.id97\.com\/videos\/resource\/id\/(.+?)\"><img\swidth=\"100\%\"\ssrc=(.+?)\salt=(.+?)></a>',content,re.S);
    filePath = 'freefilm.txt';
    if os.path.exists(filePath):
        os.remove(filePath);
    f = open(filePath,'w+');
    for item in items:
        itemUrl = 'http://www.id97.com/videos/resource/id/' + item[0];
        onlineUrl = getVideoInfo(itemUrl);
        itemName = item[2];
        print 'itemName == ',itemName,' onlineUrl == ',onlineUrl;
        f.write('电影名称:' + itemName + ( 60 - len( itemName ) )*' ' +  '播放地址:' + onlineUrl + '\n' );
    f.close();

# 找播放地址
# <li\stitle=\"\"\sdata-original-title=\"\"\sdata-toggle=\"tooltip\"\sid=\"onlineplay\"\sclass=\"list-group-item\"><a\starget=\"_blank\"\shref=\"(.+?)\">在线观看</a></li><script\stype=\"text/javascript\">
def getVideoInfo(url):
    resultUrl = '';
    user_agent = 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36'
    headers = { 'User-Agent' : user_agent }
    req = urllib2.Request(url, headers = headers)
    result = urllib2.urlopen(req);
    page = result.read();
    content = page.decode("utf-8");
    urls = re.findall('<li\stitle=\"\"\sdata-original-title=\"\"\sdata-toggle=\"tooltip\"\sid=\"onlineplay\"\sclass=\"list-group-item\"><a\starget=\"_blank\"\shref=\"(.+?)\">(.+?)</a></li><script\stype=\"text/javascript\">'\
        ,content,re.S);
    for onlineUrl in urls:
        resultUrl = onlineUrl[0];
        break;
    return str(resultUrl);

# 拉取id97新上映电影
getVideoList();

  拉取结果如下:

电影名称:"霍比特人3:五军之战,高清在线播放" 播放地址:http://www.id97.com/videos/play/mid/8549.html

电影名称:"饥饿游戏3:嘲笑鸟(上).高清在线观看" 播放地址:http://www.id97.com/videos/play/mid/8548.html

电影名称:"爆裂鼓手,高清在线播放" 播放地址:http://www.id97.com/videos/play/mid/8543.html

电影名称:"生命之书,高清在线播放" 播放地址:http://www.id97.com/videos/play/mid/8518.html

电影名称:"马达加斯加的企鹅,高清在线播放" 播放地址:http://www.id97.com/videos/play/mid/8501.html

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 【蝶恋花】 霜打梧桐枯叶散。 月冷灯疏,帘卷星光暗。 耗尽青丝离梦远,兕觥酌彼相思满。 诵尽悲词哀怨叹。 浪里行舟...
    云儿_f93c阅读 171评论 0 0
  • 现在的独生子女不在少数,享受着家长所给的最好的保护,在爱的温床下茁壮成长,呵呵,但这不应该成为你像别人肆意索...
    vero未啊阅读 1,319评论 0 0
  • 亲爱的兜小多: 若干年以后,你看到这个文字的时候,会不会觉得妈妈很作?天天跟你见面,还酸溜溜的跟你唠叨些话...
    善水琢石66阅读 594评论 0 0
  • 仿iOS通知栏删除按钮 最近变懒了,通知栏很久都不清除了,清除的时候看到了删除的动画,觉得还可以,而且也想将学过的...
    鐵甲陳小寶阅读 1,305评论 2 5