Python3網(wǎng)絡(luò)爬蟲實戰(zhàn)---21、使用Urllib：處理異常

hlcfan 發(fā)布于2019-07-31 10:35 / 539人閱讀

摘要：最后用來處理正常的邏輯，這是一個較好的異常處理寫法。上一篇文章網(wǎng)絡(luò)爬蟲實戰(zhàn)使用發(fā)送請求下一篇文章網(wǎng)絡(luò)爬蟲實戰(zhàn)使用解析鏈接

上一篇文章：Python3網(wǎng)絡(luò)爬蟲實戰(zhàn)---20、使用Urllib：發(fā)送請求
下一篇文章：Python3網(wǎng)絡(luò)爬蟲實戰(zhàn)---22、使用Urllib：解析鏈接

在前面一節(jié)我們了解了 Request 的發(fā)送過程，但是在網(wǎng)絡(luò)情況不好的情況下，出現(xiàn)了異常怎么辦呢？這時如果我們不處理這些異常，程序很可能報錯而終止運行，所以異常處理還是十分有必要的。

Urllib 的 error 模塊定義了由 request 模塊產(chǎn)生的異常。如果出現(xiàn)了問題，request 模塊便會拋出 error 模塊中定義的異常，本節(jié)會對其進行詳細的介紹。

1. URLError

URLError 類來自 Urllib 庫的 error 模塊，它繼承自 OSError 類，是 error 異常模塊的基類，由 request 模塊生的異常都可以通過捕獲這個類來處理。

它具有一個屬性 reason，即返回錯誤的原因。

下面用一個實例來感受一下：

from urllib import request, error
try:
    response = request.urlopen("http://cuiqingcai.com/index.htm")
except error.URLError as e:
    print(e.reason)

我們打開一個不存在的頁面，照理來說應(yīng)該會報錯，但是這時我們捕獲了 URLError 這個異常，運行結(jié)果如下：

Not Found

程序沒有直接報錯，而是輸出了如上內(nèi)容，這樣通過如上操作，我們就可以避免程序異常終止，同時異常得到了有效處理。

2. HTTPError

它是 URLError 的子類，專門用來處理 HTTP 請求錯誤，比如認證請求失敗等等。

它有三個屬性。

code，返回 HTTP Status Code，即狀態(tài)碼，比如 404 網(wǎng)頁不存在，500 服務(wù)器內(nèi)部錯誤等等。

reason，同父類一樣，返回錯誤的原因。

headers，返回 Request Headers。

下面我們來用幾個實例感受一下：

from urllib import request,error
try:
    response = request.urlopen("http://cuiqingcai.com/index.htm")
except error.HTTPError as e:
    print(e.reason, e.code, e.headers, sep="
")

運行結(jié)果：

Not Found
404
Date: Mon, 17 Jun 2019 04:52:50 GMT
Content-Type: text/html; charset=utf-8
Transfer-Encoding: chunked
Connection: close
Vary: Accept-Encoding
Status: 404 Not Found
Cache-Control: no-cache
Strict-Transport-Security: max-age=31536000
X-XSS-Protection: 1; mode=block
X-Request-Id: e65fb029-a4fd-46e2-91c3-9616ccc2f879
X-Runtime: 0.006814
X-Frame-Options: SAMEORIGIN
X-Content-Type-Options: nosniff
X-Powered-By: Phusion Passenger 6.0.2
Server: nginx + Phusion Passenger 6.0.2

依然是同樣的網(wǎng)址，在這里我們捕獲了 HTTPError 異常，輸出了 reason、code、headers 屬性。

因為 URLError 是 HTTPError 的父類，所以我們可以先選擇捕獲子類的錯誤，再去捕獲父類的錯誤，所以上述代碼更好的寫法如下：

from urllib import request, error

try:
    response = request.urlopen("http://cuiqingcai.com/index.htm")
except error.HTTPError as e:
    print(e.reason, e.code, e.headers, sep="
")
except error.URLError as e:
    print(e.reason)
else:
    print("Request Successfully")

這樣我們就可以做到先捕獲 HTTPError，獲取它的錯誤狀態(tài)碼、原因、Headers 等詳細信息。如果非 HTTPError，再捕獲 URLError 異常，輸出錯誤原因。最后用 else 來處理正常的邏輯，這是一個較好的異常處理寫法。

有時候 reason 屬性返回的不一定是字符串，也可能是一個對象，我們再看下面的實例：

import socket
import urllib.request
import urllib.error

try:
    response = urllib.request.urlopen("https://www.baidu.com", timeout=0.01)
except urllib.error.URLError as e:
    print(type(e.reason))
    if isinstance(e.reason, socket.timeout):
        print("TIME OUT")

在這里我們直接設(shè)置了超時時間來強制拋出 timeout 異常。

運行結(jié)果如下：


TIME OUT

可以發(fā)現(xiàn) reason 屬性的結(jié)果是 socket.timeout 類。所以在這里我們可以用 isinstance() 方法來判斷它的類型，做出更詳細的異常判斷。

3. 結(jié)語

本節(jié)講述了 error 模塊的相關(guān)用法，通過合理地捕獲異?？梢宰龀龈鼫蚀_的異常判斷，使得程序更佳穩(wěn)健。

上一篇文章：Python3網(wǎng)絡(luò)爬蟲實戰(zhàn)---20、使用Urllib：發(fā)送請求
下一篇文章：Python3網(wǎng)絡(luò)爬蟲實戰(zhàn)---22、使用Urllib：解析鏈接

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://systransis.cn/yun/44073.html

發(fā)表評論

登陸后可評論

0條評論

hlcfan

男|高級講師

我要關(guān)注我要私信

TA的文章

卷積神經(jīng)網(wǎng)絡(luò)tensorflow

閱讀 3007·2023-04-26 02:29
CSS選擇器

閱讀 617·2019-08-30 15:54
情人節(jié)之每天給你的女朋友發(fā)短信（nodejs版）

閱讀 1703·2019-08-29 13:13
CSS繼承

閱讀 631·2019-08-28 17:51
10分鐘了解react新特性hooks

閱讀 2753·2019-08-26 13:58
Express 文檔（路由基礎(chǔ)）

閱讀 1560·2019-08-26 13:27
javascript 總結(jié)（那些剪不斷理還亂的關(guān)系）

閱讀 2844·2019-08-26 11:39
你可能不知道的LocalStorage用法

閱讀 3473·2019-08-26 10:46

成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

Python3網(wǎng)絡(luò)爬蟲實戰(zhàn)---21、使用Urllib：處理異常

相關(guān)文章

Python3網(wǎng)絡(luò)爬蟲實戰(zhàn)---22、使用Urllib：解析鏈接

Python3網(wǎng)絡(luò)爬蟲實戰(zhàn)---20、使用Urllib：發(fā)送請求

Python3網(wǎng)絡(luò)爬蟲實戰(zhàn)---17、爬蟲基本原理

Python3網(wǎng)絡(luò)爬蟲實戰(zhàn)---25、requests：高級用法

Python3網(wǎng)絡(luò)爬蟲實戰(zhàn)---23、使用Urllib：分析Robots協(xié)議

發(fā)表評論

0條評論

hlcfan

男|高級講師

TA的文章

卷積神經(jīng)網(wǎng)絡(luò)tensorflow

CSS選擇器

情人節(jié)之每天給你的女朋友發(fā)短信（nodejs版）

CSS繼承

10分鐘了解react新特性hooks

Express 文檔（路由基礎(chǔ)）

javascript 總結(jié)（那些剪不斷理還亂的關(guān)系）

你可能不知道的LocalStorage用法

最新活動

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

Python3網(wǎng)絡(luò)爬蟲實戰(zhàn)---21、使用Urllib：處理異常

相關(guān)文章

發(fā)表評論

0條評論

男|高級講師

TA的文章

最新活動

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

Python3網(wǎng)絡(luò)爬蟲實戰(zhàn)---21、使用Urllib：處理異常