python實(shí)現(xiàn)模擬登陸

archieyang 發(fā)布于2019-07-31 11:05 / 3347人閱讀

摘要：參考文章請(qǐng)點(diǎn)擊這里模擬登陸參考文章使用的，感覺沒有用起來方便。到此，所需要的都取得了，接下來就用把參數(shù)，，請(qǐng)求頭帶上，的加上查詢字符串，就可以成功模擬登陸了。

這次想試一試模擬登陸，以為應(yīng)該會(huì)很順利，但是遇到了各種問題，所以記錄總結(jié)一下。
參考文章：請(qǐng)點(diǎn)擊這里

模擬登陸segmentfault

參考文章使用的node.js，感覺沒有python用起來方便。

工具

python2.7

Chrome瀏覽器

requests

PyV8

lxml

思路

首先進(jìn)入segmentfault的登陸頁面。
可以隨便輸入錯(cuò)誤密碼點(diǎn)擊登陸，使用Chrome查看請(qǐng)求發(fā)到了哪個(gè)url。
另外看post的參數(shù)，這里有三個(gè)：remember, username 和 password。
然后可以順便按照Requests Headers把請(qǐng)求頭設(shè)置好(照抄到代碼里)。

requests庫的session對(duì)象能夠幫我們跨請(qǐng)求保持某些參數(shù)，也會(huì)在同一個(gè)session實(shí)例發(fā)出的所有請(qǐng)求之間保持cookies。

使用：

    # 創(chuàng)建一個(gè)session對(duì)象 
    session = requests.session()
    # 用session對(duì)象發(fā)出get請(qǐng)求
    response = session.get("https://segmentfault.com/user/login")
    # 獲取cookie
    cookies = response.cookies

設(shè)置了請(qǐng)求頭，cookie也拿到了，看看post的url

發(fā)現(xiàn)這段url后面是帶了查詢字符串的，每次發(fā)請(qǐng)求都會(huì)變化。
只有明白它是如何生成的才能取得我們要post的url，這里我卡了好久，去尋找答案，才找到了參考文章，這里面提供了思路獲取js中生成的token。

在login.min.js中查詢字符串 "_=" (Chrome f12下使用快捷鍵Crtl+F可以打開查詢窗口)，因?yàn)樽⒁獾絬rl是https://segmentfault.com/api/user/login?_=[querystring]

發(fā)現(xiàn)要post的url是根url加上"?_="再加上a._.
可以想到a是一個(gè)對(duì)象，_是a這個(gè)對(duì)象的一個(gè)屬性。
可以找到：

于是發(fā)現(xiàn)了a._是window.SF.token

取得token

分析：回到login文件發(fā)現(xiàn)token是html中的script標(biāo)簽中一個(gè)函數(shù)生成的，而html可以使用requests.get取得，然后可以通過python的re模塊用正則表達(dá)式提取出所需要的函數(shù)，這時(shí)還需要python中的PyV8模塊來執(zhí)行js函數(shù)。
執(zhí)行：分析html的DOM節(jié)點(diǎn)，發(fā)現(xiàn)函數(shù)的位置，使用xpath取得那個(gè)script標(biāo)簽

    response = requests.get("https://segmentfault.com/user/login")
    sel = html.fromstring(response.text)
    s = sel.xpath("/html/body/script[8]/text()")[0]
    st = str(s.encode("utf-8"))

寫一個(gè)get_token函數(shù)取得token(這里要用到PyV8模塊實(shí)現(xiàn)python和JavaScript的交互)
這個(gè)DOM目前是這樣的:

我們需要的是第一個(gè)函數(shù)，在get_token()中用正則表達(dá)式提取出來。

def get_token(st):
    h = re.match("[sS]*(function (w) {[sS]+? })(window);", st).group()
    with PyV8.JSContext() as ctxt:
        ctxt.eval("""window={};
""" + h)
        vars = ctxt.locals
        token_var = vars.window.SF.token
        print token_var
    return token_var

到此，所需要的都取得了，接下來就用sesssion.post把參數(shù)，cookie，請(qǐng)求頭帶上，post的url加上查詢字符串，就可以成功模擬登陸了。

如有錯(cuò)誤請(qǐng)指正~謝謝~

GPU云服務(wù)器云服務(wù)器 python模擬登陸 python模擬登陸csdn python實(shí)現(xiàn)登陸模擬登陸

文章版權(quán)歸作者所有，未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址：http://systransis.cn/yun/44612.html

發(fā)表評(píng)論

登陸后可評(píng)論

0條評(píng)論

archieyang

男|高級(jí)講師

我要關(guān)注我要私信

TA的文章

常見的編譯器

閱讀 2935·2021-10-14 09:42
寶塔面板安裝pdftoolbox – 一個(gè)好用的PDF在線工具箱

閱讀 1285·2021-09-24 10:32
C語言深層理解：函數(shù)中棧幀的創(chuàng)建與銷毀

閱讀 3003·2021-09-23 11:21
阿里云：云上年中鉅惠 - 輕量應(yīng)用服務(wù)器60元/年 ECS云服務(wù)器72元/年

閱讀 2877·2021-08-27 13:10
CSS動(dòng)畫優(yōu)雅降級(jí)的簡單總結(jié)

閱讀 3359·2019-08-29 18:41
flask基礎(chǔ)之一

閱讀 2223·2019-08-29 15:16
這些國外前端周刊值得你收藏一下

閱讀 1240·2019-08-29 13:17
多圖片展開收縮實(shí)例

閱讀 915·2019-08-29 11:22

成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長期優(yōu)惠，快來選購！

python實(shí)現(xiàn)模擬登陸

相關(guān)文章

**超詳細(xì)的Python實(shí)現(xiàn)新浪微博模擬登陸(小白都能懂)**

Python爬蟲學(xué)習(xí)：微信、知乎、新浪等主流網(wǎng)站的模擬登陸爬取方法

**超詳細(xì)的Python實(shí)現(xiàn)百度云盤模擬登陸(模擬登陸進(jìn)階)**

Python 爬蟲之模擬登陸CSND

Python使用cookielib、urllib2和pyquery模擬登陸本科教學(xué)網(wǎng)并抓取數(shù)據(jù)

發(fā)表評(píng)論

0條評(píng)論

archieyang

男|高級(jí)講師

TA的文章

常見的編譯器

寶塔面板安裝pdftoolbox – 一個(gè)好用的PDF在線工具箱

C語言深層理解：函數(shù)中棧幀的創(chuàng)建與銷毀

阿里云：云上年中鉅惠 - 輕量應(yīng)用服務(wù)器60元/年 ECS云服務(wù)器72元/年

CSS動(dòng)畫優(yōu)雅降級(jí)的簡單總結(jié)

flask基礎(chǔ)之一

這些國外前端周刊值得你收藏一下

多圖片展開收縮實(shí)例

最新活動(dòng)

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長期優(yōu)惠，快來選購！

python實(shí)現(xiàn)模擬登陸

相關(guān)文章

發(fā)表評(píng)論

0條評(píng)論

男|高級(jí)講師

TA的文章

最新活動(dòng)

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長期優(yōu)惠，快來選購！