基于Python的Post請(qǐng)求數(shù)據(jù)爬取

maybe_009 發(fā)布于2019-07-31 10:32 / 1308人閱讀

摘要：為什么做這個(gè)和同學(xué)聊天，他想爬取一個(gè)網(wǎng)站的請(qǐng)求觀察該網(wǎng)站的請(qǐng)求參數(shù)有兩種類型參數(shù)體放在了中，即拼接參數(shù)中要加入一個(gè)空的對(duì)象，關(guān)于為什么要加入空的對(duì)象，猜測(cè)原因?yàn)榉磁老x(chóng)。

為什么做這個(gè)

和同學(xué)聊天，他想爬取一個(gè)網(wǎng)站的post請(qǐng)求

觀察

該網(wǎng)站的post請(qǐng)求參數(shù)有兩種類型：（1）參數(shù)體放在了query中，即url拼接參數(shù)（2）body中要加入一個(gè)空的json對(duì)象，關(guān)于為什么要加入空的json對(duì)象，猜測(cè)原因?yàn)榉磁老x(chóng)。既有query參數(shù)又有空對(duì)象體的body參數(shù)是一件腦洞很大的事情。

一開(kāi)始先在apizza網(wǎng)站上了做了相關(guān)實(shí)驗(yàn)才發(fā)現(xiàn)上面這個(gè)規(guī)律的，并發(fā)現(xiàn)該網(wǎng)站的請(qǐng)求參數(shù)要為raw形式，要是直接寫(xiě)代碼找規(guī)律不是一件容易的事情。

源碼

import requests
import json
headers = {
        "Accept":"application/json, text/javascript, */*; q=0.01",
        "X-Requested-With":"XMLHttpRequest",
        "User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.71 Safari/537.36",
        "Content-Type":"application/json",
        "Accept-Encoding":"gzip, deflate",
        "Accept-Language":"zh-CN,zh;q=0.8",
        "Cache-Control":"no-cache",
    }
#空的對(duì)象，body參數(shù)
data = {}
data = json.dumps(data)
page = 0

url = "網(wǎng)站地址，后面為參數(shù)?param1=1¶m1="+str(page)
response = requests.post(url = url,data=data ,headers =headers )
print(response.url)
print(response.text)

總結(jié)

現(xiàn)在相關(guān)工具中發(fā)現(xiàn)現(xiàn)象

請(qǐng)求方式確定：post還是get或者其它

參數(shù)類型：form-data還是raw或者其它

參數(shù)位置：若是post請(qǐng)求，在query中還是body中，還是二者皆有

文章版權(quán)歸作者所有，未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址：http://systransis.cn/yun/44003.html

發(fā)表評(píng)論

登陸后可評(píng)論

0條評(píng)論

maybe_009

男|高級(jí)講師

我要關(guān)注我要私信

TA的文章

Vue基礎(chǔ)之內(nèi)部指令（下）

閱讀 1832·2019-08-30 15:55
使用webpack手動(dòng)搭建一個(gè)基于vue的單頁(yè)面應(yīng)用

閱讀 1029·2019-08-26 11:57
《JavaScript高級(jí)程序設(shè)計(jì)》筆記：引用類型（五）

閱讀 534·2019-08-26 11:29
如何學(xué)習(xí)-什么是學(xué)習(xí)？

閱讀 3376·2019-08-26 10:49
ArcGis for JavaScript SDK

閱讀 1928·2019-08-23 18:40
白話es6系列二：你真的會(huì)聲明變量嗎

閱讀 1835·2019-08-23 16:04
JavaScript抖動(dòng)的實(shí)現(xiàn)

閱讀 3122·2019-08-23 11:01
全棧前端入門必看 koa2+mysql+vue+vant 構(gòu)建簡(jiǎn)單版移動(dòng)端博客

閱讀 2293·2019-08-23 10:56

成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來(lái)選購(gòu)！

基于Python的Post請(qǐng)求數(shù)據(jù)爬取

相關(guān)文章

Python-爬蟲(chóng)工程師-面試總結(jié)

Python入門網(wǎng)絡(luò)爬蟲(chóng)之精華版

Python爬蟲(chóng)之使用Fiddler+Postman+Python的requests模塊爬取各國(guó)國(guó)旗

Python requests 安裝與開(kāi)發(fā)

發(fā)表評(píng)論

0條評(píng)論

maybe_009

男|高級(jí)講師

TA的文章

Vue基礎(chǔ)之內(nèi)部指令（下）

使用webpack手動(dòng)搭建一個(gè)基于vue的單頁(yè)面應(yīng)用

《JavaScript高級(jí)程序設(shè)計(jì)》筆記：引用類型（五）

如何學(xué)習(xí)-什么是學(xué)習(xí)？

ArcGis for JavaScript SDK

白話es6系列二：你真的會(huì)聲明變量嗎

JavaScript抖動(dòng)的實(shí)現(xiàn)

全棧前端入門必看 koa2+mysql+vue+vant 構(gòu)建簡(jiǎn)單版移動(dòng)端博客

最新活動(dòng)

資訊專欄INFORMATION COLUMN

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來(lái)選購(gòu)！

基于Python的Post請(qǐng)求數(shù)據(jù)爬取

相關(guān)文章

發(fā)表評(píng)論

0條評(píng)論

男|高級(jí)講師

TA的文章

最新活動(dòng)

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來(lái)選購(gòu)！