Selenium可以模擬人的行為,好用歸好用,但如果安裝在server主機上或不想顯示GUI,那有什麼方法?
方法一 無頭瀏覽器"PhantomJS"
PhantomJS是一個真實的無頭瀏覽器,需要另外下載配置到環境變數才能使用。
下載對應的系統版本,加到環境變數中。
python module selenium
新版本已不支持PhantomJS,建議安裝3.4.2版
selenium == 3.4.2
- python 控制
from selenium import webdriver
from PIL import Image
from io import BytesIO
import base64
browser = webdriver.PhantomJS()
browser.get("http://www.google.com")
image_data = browser.get_screenshot_as_base64() # 截圖
i = Image.open(BytesIO(base64.b64decode(image_data)))
i.show() # 顯示截圖
方法二: Chhome headless
Chrome V59 開始推出了headless mode,原生支持無頭環境運行Chrome,速度非常快。
from selenium import webdriver
from PIL import Image
from io import BytesIO
import base64
chrome_options = webdriver.ChromeOptions()
chrome_options.add_argument('--headless') # 啟動無頭模式
chrome_options.add_argument('--disable-gpu') # windowsd必須加入此行
browser = webdriver.Chrome(chrome_options=chrome_options)
browser.get("http://www.google.com")
image_data = browser.get_screenshot_as_base64()
i = Image.open(BytesIO(base64.b64decode(image_data)))
i.show()
方法三: XVFB Linux 虛擬桌面
僅適用於linux,支持
安裝方法
apt-get install Xvfb
pip install pyvirtualdisplay
python 控制
from pyvirtualdisplay import Display
display = Display(visible=0, size=(1024, 768))
display.start()
browser = webdriver.Chrome()
browser.get('http://www.google.com')
print(browser.title)