Python爬蟲之urllib示例

mylxsw 發(fā)布于2019-07-30 16:27 / 1764人閱讀

摘要：最簡單直接抓取頁面代碼使用構(gòu)造一個對象，推薦發(fā)送數(shù)據(jù)，張三發(fā)送數(shù)據(jù)，張三發(fā)送數(shù)據(jù)和張三

1、最簡單：直接抓取頁面代碼

import urllib.request
import urllib.error

url = "http://test.com/test.html"
try:
    resp = urllib.request.urlopen(url)
except urllib.error.HTTPError as e:
    print(e.code, e.msg)
except urllib.error.URLError as e:
    print(e.reason)
else:
    result = resp.read().decode("utf-8")
    print(result)

2、使用 Request

import urllib.request
import urllib.error

url = "http://test.com/test.html"
try:
    req = urllib.request.Request(url)  # 構(gòu)造一個Request對象，推薦
    resp = urllib.request.urlopen(req)
except urllib.error.HTTPError as e:
    print(e.code, e.msg)
except urllib.error.URLError as e:
    print(e.reason)
else:
    result = resp.read().decode("utf-8")
    print(result)

3、發(fā)送數(shù)據(jù)，GET

import urlib.request
import urllib.parse

url = "http://test.com/a.php?act=login&id=123"
req = urllib.request.Request(url)
resp = urllib.request.urlopen(req)

# or

url = "http://test.com/a.php"
params = {
    "act": "login",
    "id": 123,
    "name": u"張三"
}
geturl = url + "?" + urllib.parse.urlencode(params)
req = urllib.request.Request(geturl)
resp = urllib.request.urlopen(req)

print(resp.read().decode("utf-8"))
# {"act":"login","name":"u5f20u4e09","id":"123"}

4、發(fā)送數(shù)據(jù)，POST

import urllib.request
import urllib.parse

url = "http://test.com/a.php"
params = {
    "act": "login",
    "login[name]": u"張三",
    "login[password]": "123456"
}
data = urllib.parse.urlencode(params).encode("utf-8")

req = urllib.request.Request(url, data)
resp = urllib.request.urlopen(req)

print(resp.read().decode("utf-8"))
# {"act":"login","login":{"password":"123456","name":"u5f20u4e09"}}}

5、發(fā)送數(shù)據(jù)和header

import urllib.request
import urllib.parse

url = "http://test.com/a.php"
params = {
    "act": "login",
    "login[name]": u"張三",
    "login[password]": "123456"
}
data = urllib.parse.urlencode(params).encode("utf-8")

headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) "
                  "Chrome/54.0.2840.99 Safari/537.36",
    "Referer": "http://www.baidu.com",
    "haha": "xixi"
}

req = urllib.request.Request(url, data, headers)
resp = urllib.request.urlopen(req)

print(resp.read().decode("utf-8"))

云服務(wù)器 GPU云服務(wù)器 python爬蟲示例 scrapy爬蟲示例 python示例 python代碼示例

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://systransis.cn/yun/41688.html

發(fā)表評論

登陸后可評論

0條評論

mylxsw

男|高級講師

我要關(guān)注我要私信

TA的文章

RAKsmart：爆款產(chǎn)品 $ 30秒殺，香港新增DDOS最高100G， VPS全場5折

閱讀 1414·2021-09-02 09:53
Sharktech：$129/月/2*E5-2678v3/64GB內(nèi)存/1TB NVMe硬盤/不限流

閱讀 2677·2021-07-29 13:50
iconfont在react中完整使用教程

閱讀 1726·2019-08-30 11:07
2019年5月所遇知識點整理

閱讀 1583·2019-08-30 11:00
flex布局的一些好帖子,你值得擁有

閱讀 1461·2019-08-29 14:00
你可能不知道的前端知識點

閱讀 1853·2019-08-29 12:52
CSS屬性中經(jīng)常出現(xiàn)的百分比

閱讀 2572·2019-08-29 11:11
Taro開發(fā)小程序填坑筆記（一）

閱讀 3429·2019-08-26 12:23

成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

Python爬蟲之urllib示例

相關(guān)文章

零基礎(chǔ)如何學(xué)爬蟲技術(shù)

Python爬蟲之多線程下載程序類電子書

Python入門網(wǎng)絡(luò)爬蟲之精華版

**【爬蟲系列之二】python基礎(chǔ)知識的了解**

python爬蟲之ajax請求

發(fā)表評論

0條評論

mylxsw

男|高級講師

TA的文章

RAKsmart：爆款產(chǎn)品 $ 30秒殺，香港新增DDOS最高100G， VPS全場5折

Sharktech：$129/月/2*E5-2678v3/64GB內(nèi)存/1TB NVMe硬盤/不限流

iconfont在react中完整使用教程

2019年5月所遇知識點整理

flex布局的一些好帖子,你值得擁有

你可能不知道的前端知識點

CSS屬性中經(jīng)常出現(xiàn)的百分比

Taro開發(fā)小程序填坑筆記（一）

最新活動

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

Python爬蟲之urllib示例

相關(guān)文章

發(fā)表評論

0條評論

男|高級講師

TA的文章

最新活動

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！