python滚动截图附软件网盘地址

使用python截取一个网页从上往下整个页面的图片


# from selenium import webdriver                  #从selenium库导入webdirver
from selenium.webdriver.chrome.options import Options
# import time
chrome_options = Options()
chrome_options.add_argument("--disable-extensions")
          

from selenium import webdriver
import time

def take_screenshot(url, save_fn="capture.png"):
    #browser = webdriver.Firefox() # Get local session of firefox
    #browser = webdriver.Chrome(chrome_options=chrome_options)
    browser = webdriver.PhantomJS(executable_path=r'.\phantomjs-2.1.1-windows\bin\phantomjs.exe',service_args=['--ignore-ssl-errors=true', '--ssl-protocol=TLSv1']) 
    browser.set_window_size(1500, 900)
    browser.get(url) # Load page

    browser.execute_script("""
        (function () {
            var y = 0;
            var step = 100;
            window.scroll(0, 0);

            function f() {
                if (y < document.body.scrollHeight) {
                    y += step;
                    window.scroll(0, y);
                    setTimeout(f, 100);
                } else {
                    window.scroll(0, 0);
                    document.title += "scroll-done";
                }
            }

            setTimeout(f, 1000);
        })();
    """)

    for i in range(30):
        if "scroll-done" in browser.title:
            break
        time.sleep(10)

    browser.save_screenshot(save_fn)
    browser.close()
def date_time(delta):
    now = datetime.date.today()
    delta2 = datetime.timedelta(days=1)
    delta = datetime.timedelta(days=delta)
    n_days = now-delta2 - delta
    return (n_days.strftime('%Y-%m-%d'))

if __name__ == "__main__":
    import xlrd
    import datetime,os
    comment =  xlrd.open_workbook(r'test.xls')#(),encoding='utf-8',errors='ignore'
    table = comment.sheets()[0] 
    nrows = table.nrows
    ncols = table.ncols
    product = table.row_values(0)[1]
    filepath = '.\\'+product+'\\'+date_time(-1)+'\\'
    if not os.path.exists(filepath):
        os.makedirs(filepath)
    for i in range(1,nrows):

        
        name = '.\\'+product+'\\'+date_time(-1)+'\\'+str(i)+table.row_values(i)[1]+'.png'
        url = table.row_values(i)[2]
        print (name)
        take_screenshot(url,name)

具体操作，在同一个文件夹下，新建test.xls文件，在第三列写入要截取的网页链接，如图

image.png

对python不太熟悉的童鞋可以直接使用打包后的软件，使用方式一致。
链接：https://pan.baidu.com/s/1kSL2Zc5FcrKiuTsCEbQFLA 密码：kpc6

最后编辑于：2018.07.17 17:35:28

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

python滚动截图 附软件网盘地址

友情链接更多精彩内容

python滚动截图附软件网盘地址