在headless模式下運行selenium

MoAir 發(fā)布于2019-07-25 11:45 / 3467人閱讀

摘要：而在不久前宣布支持模式而后跟隨的新聞再次勾起我無盡的回憶。那么我們就來談?wù)勗诤蜑g覽器不原生支持模式下如何使用來實現(xiàn)模式進行動態(tài)數(shù)據(jù)的抓取。比較常見的例子在中進行轉(zhuǎn)發(fā)。下面我們進行測試發(fā)現(xiàn)其可以正常的運行。

原文地址:

http://52sox.com/python-use-h...

在Python中進行瀏覽器測試時,一般我們會選擇selenium這樣的庫來簡化我們工作量。而有些時候,為了對一些動態(tài)數(shù)據(jù)進行抓取,我們會選擇PhantomJs這樣的工具。而在selenium中我們也可以集成Phantomjs對應(yīng)的驅(qū)動,可以很方便的進行對應(yīng)的操作。
在Phantomjs的官方網(wǎng)站上,我們可以看到類似如下的字樣:

在這里就引申出1個headless mode的概念。而phantomjs與我們常用瀏覽器的區(qū)別就是,它不需要GUI界面也可以運行,因此更為節(jié)省資源。
實際上,對于動態(tài)數(shù)據(jù)的抓取問題對我來說已經(jīng)是很多年之前的事情,無論是基于Phantomjs的casperjs,還是使用Qt、GTK這樣的GUI包編寫瀏覽器來進行操作,或者是這里要介紹的selenium的方式,都已經(jīng)成為過去式了。
而自從在新公司從事新的工作后,對于這樣的問題實際上基本上都懶得動手了,不如讓同事去做吧。
大概在1個月前,之前公司坐我隔壁的那個哥們寫了1個分布式的爬蟲框架(實際上關(guān)于這方面,個人覺得完全沒有必要,流行的scrapy和pyspider那個好用)時遇到了這樣1個問題,當(dāng)時他在selenium中使用Phantomjs對某個頁面進行抓取,然后發(fā)現(xiàn)有些東西使用Phantomjs抓取不下來,然后只要使用firefox的方式來進行。其博客可以點擊。
而在不久前,chrome宣布支持headless模式,而后firefox跟隨的新聞,再次勾起我無盡的回憶。
實際上,phantomjs這個工具對于Python的人來說很不習(xí)慣,而且還有一些莫名其妙的問題。那么,我們就來談?wù)勗贔irefox和Chrome瀏覽器不原生支持headless模式下,如何使用selenium來實現(xiàn)headless模式進行動態(tài)數(shù)據(jù)的抓取。
在這里為了方便說明,我們在Linux環(huán)境下進行操作,使用的版本如下:

Centos==6.8
Python==2.7.10
selenium==2.53.0
Firefox==45.0

在Linux中有1個很好用的工具xvfb,它是1個X服務(wù)可以用于在沒有顯示器的硬件和物理輸入設(shè)備上運行,詳細的操作可以參考。而關(guān)于X服務(wù)的內(nèi)容,請自行百度。比較常見的例子在ssh中進行X11轉(zhuǎn)發(fā)。
可以看到,在這里我們需要借助xvfb的方式來實現(xiàn)所謂的headless模式,實際上這個操作就10分鐘就完成了。

安裝必需的軟件包

在這里,我們通過如下的方式安裝需要的軟件包:

[cat@localhost ~]$ sudo yum install xdg-utils xorg-x11-server-Xvfb xorg-x11-xkb-utils

如果你使用的是基于Debian的系統(tǒng),比如Ubuntu,那么對應(yīng)的安裝方式可能為:

sudo aptitude install xdg-utils xvfb x11-xkb-utils

安裝xvfb的綁定

安裝完成xvfb綁定后,一般情況下我們會使用命令的方式來開啟虛擬顯示。而由于本人比較懶是1個特點,因此我們直接將其與我們的腳本一起集成在一起。
在這里,我們安裝1個xvfbwrapper的庫,這個庫用于在你的Python中開啟和關(guān)閉xfvb會話。
在這里,我們直接通過pip進行安裝:

pip install xvfbwrapper

編寫對應(yīng)的代碼

安裝完綁定依賴后,我們終于可以愉快的開啟編寫代碼了,在這里我們先引入對應(yīng)的模塊:

from xvfbwrapper import Xvfb

接著我們實例化1個實例:

xvfb = Xvfb()

接著我們就可以開啟及關(guān)閉其其會話了:

#!/usr/bin/env python

from selenium import webdriver
from xvfbwrapper import Xvfb

xvfb = Xvfb(width=1280,height=720)
xvfb.start()
print("Start...")
browser = webdriver.Firefox()
browser.get("http://52sox.com")
title = browser.title
print(title)
print("Clean...")
browser.close()
xvfb.stop()

在這里,我們將其與selenium進行集成,在這里由于時間的關(guān)系,就簡單的用于獲取個人博客上的標題。
下面我們進行測試:

[cat@localhost ~]$ python headless.py 
Start...
The Kite in the wind
Clean...

發(fā)現(xiàn)其可以正常的運行?？梢哉f,簡單到?jīng)]有朋友。

參考文章:

http://tobyho.com/2015/01/09/...

云服務(wù)器 GPU云服務(wù)器在windows下運行webrtc php運行模式 php的運行模式 php安全模式運行

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://systransis.cn/yun/38591.html

發(fā)表評論

登陸后可評論

0條評論

MoAir

男|高級講師

我要關(guān)注我要私信

TA的文章

IDC：2021 Q1中國云市場規(guī)模超300億,阿里云第一、騰訊華為位列二三

閱讀 3623·2021-09-22 10:52
以??簡單易懂??的語言帶你搞懂有監(jiān)督學(xué)習(xí)算法【附Python代碼詳解】機器學(xué)習(xí)系列之KNN篇

閱讀 1622·2021-09-09 09:34
程序員的算法趣題Q22: 不纏繞的紙杯電話

閱讀 2020·2021-09-09 09:33
使用 rem 設(shè)計網(wǎng)頁

閱讀 788·2019-08-30 15:54
Bootstrap 之 Metronic 模板的學(xué)習(xí)之路 - （6）自定義和擴展

閱讀 2714·2019-08-29 11:15
嘗鮮 ES2019 的新功能

閱讀 743·2019-08-26 13:37
Web全屏模式

閱讀 1703·2019-08-26 12:11
常用的JavaScript位操作(Bitwise)

閱讀 3007·2019-08-26 12:00

成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

在headless模式下運行selenium

相關(guān)文章

**使用瀏覽器的HEADLESS模式進行自動化測試**

**使用 headless chrome進行測試**

Scrapy+Chromium+代理+selenium

不可錯過的自動化測試框架：robotframework之WebDriver功能配置

發(fā)表評論

0條評論

MoAir

男|高級講師

TA的文章

IDC：2021 Q1中國云市場規(guī)模超300億,阿里云第一、騰訊華為位列二三

以??簡單易懂??的語言帶你搞懂有監(jiān)督學(xué)習(xí)算法【附Python代碼詳解】機器學(xué)習(xí)系列之KNN篇

程序員的算法趣題Q22: 不纏繞的紙杯電話

使用 rem 設(shè)計網(wǎng)頁

Bootstrap 之 Metronic 模板的學(xué)習(xí)之路 - （6）自定義和擴展

嘗鮮 ES2019 的新功能

Web全屏模式

常用的JavaScript位操作(Bitwise)

最新活動

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

在headless模式下運行selenium

相關(guān)文章

發(fā)表評論

0條評論

男|高級講師

TA的文章

最新活動

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！