Python多进程测试网站连通性

import datetime   
import requests
import urllib2
import random
from tld import get_tld
import multiprocessing
from multiprocessing.dummy import Pool
from multiprocessing import current_process

t1 = datetime.datetime.now()
pool = Pool(processes=10)

def conn_url(url):
    """"""
    url = url.strip('\r').strip('\n')
    url =  url
    
    try:       
        html_url = requests.get(url, timeout=random.randint(3,5))
        url_code = html_url.status_code
        if url_code == 200:
            return url        
        else:
            pass    
        
    except Exception,e:
        pass
#----------------------------------------------------------------------
def domain_url(url):
    """"""
    url_domain = get_tld(url)
    print url_domain
    
url_list = []
with open('kehu_ok.txt') as s:
    for i in s:
        
        url = i.strip('\r').strip('\n')
        url_ok = conn_url(url)
        url_list.append(url_ok)
        
pool.map(domain_url,url_list)
print 'Starting'+multiprocessing.current_process().name
pool.close()
pool.join()

print 'Multiprocess Scanning Completed in  ', datetime.datetime.now() - t1

测试网站连通性2

import tld
import requests
import urllib2
import random


def link_code(url):
    """"""
    try:       
        #request = urllib2.Request(url,headers=header.get_header())  
        html_url = requests.get(url, timeout=random.randint(3,8))

        url_code = html_url.status_code

        if url_code == 200:
            print url_code  
            return url
        else:
            pass    

    except Exception,e:
        #print 'xxx'
        pass        

#link_code('http://www.baidu.com')

#----------------------------------------------------------------------
def input_url(url_file):
    """""" 
    w1 = open('target_200_url.txt','w+')
    with open(url_file) as f:
        urls = f.readlines()
        for i in urls:
            i = i.strip('\n').strip('\r')
            print i
            try:
                url_200 = link_code(i)
                
                w1.writelines(i)
                w1.write('\n')
                print i + '    yes!'
            except Exception,e:
                print i  + str(e)
               
#input_url('formal_url.txt')


a = [] 
#----------------------------------------------------------------------
def ceshi_url(url_file):
    """"""
    with open(url_file) as w:
        urls = w.readlines()
        for i in urls:
            i = i.strip('\n').strip('\r')
            try:
                url = tld.get_tld(i)
                list_url = 'http://' + url
                a.append(list_url)
                
            except Exception,e:
                print str(e)
    
#ceshi_url('formal_url.txt')
#g = open('url.txt','w+')
#a = list(set(a))
#print len(a)
#for i in a:
    #print i
    #g.writelines(i)
    #g.writelines('\n')
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 文章来自:http://blog.csdn.net/mj813/article/details/52451355 ...
    好大一只鹏阅读 13,014评论 2 126
  • 1.问:你在测试中发现了一个 bug ,但是开发经理认为这不是一个 bug ,你应该怎样解决。 首先,将问题提...
    qianyewhy阅读 13,048评论 4 123
  • 1.测试与软件模型 软件开发生命周期模型指的是软件开发全过程、活动和任务的结构性框架。软件项目的开发包括:需求、设...
    Mr希灵阅读 22,272评论 7 278
  • 1.测试与软件模型 软件开发生命周期模型指的是软件开发全过程、活动和任务的结构性框架。软件项目的开发包括:需求、设...
    宇文臭臭阅读 11,701评论 5 101
  • 在2016年10月份的时候,我和王先生约定写出自己的遗愿清单,如果谁先没有了就帮对方实现,我当时写了一条是到北上广...
    破茧人阅读 1,346评论 0 0

友情链接更多精彩内容