摘要:作為爬蟲的入門教程,我想有必要來個爬蟲程序壓壓驚,爬取性感美女的圖片,然后保存到自己的電腦里面。爽歪歪先看下效果吧,這是我把爬取的圖片自動存儲到的文件夾里邊爬蟲三步驟抓取,分析,存儲。相關(guān)文章入門基礎(chǔ)有趣的教程
作為 Python 爬蟲的入門教程,我想有必要來個爬蟲程序壓壓驚,爬取性感美女的圖片,然后保存到自己的電腦里面。爽歪歪~
先看下效果吧,這是我把爬取的圖片自動存儲到的文件夾里邊:
爬蟲三步驟:抓取,分析,存儲。
抓取首先我們要有個目標對吧,我們想要抓取美女照片,就去找找看哪里的網(wǎng)站妹紙多,那咱們就從哪里下手唄。
我發(fā)現(xiàn)這網(wǎng)站 http://www.meizitu.com 的妹紙圖不錯啊,那還等什么,抓取唄。
在 python 中有個叫做 requests 模塊,直接 pip install 就可以了,然后訪問這個網(wǎng)址獲取相應的源碼:
response = requests.get(url) return response
比如我想獲取性感美女的源碼,那么我的 url 就是 http://www.meizitu.com/a/sexy... 通過get請求我們就可以獲取返回的響應體了,我們通過response.text就可以或源碼。部分源碼截圖如下:
分析抓取完了之后,我們對我們感興趣的內(nèi)容要進行分析了,這時候就涉及到「正則表達式」,根據(jù)我們定義的一些規(guī)則,來獲取我們想要的內(nèi)容。
我們現(xiàn)在當然是對返回源碼中的美女圖片感興趣啦,從返回的源碼中就可以看到,美女的圖片都是包裹在 img 標簽中的:
那么我們就可以用 re 模塊來匹配獲取我們想要的圖片鏈接了:
p = r"獲取到的部分圖片鏈接截圖:
存儲既然獲取到圖片鏈接了,那么接下來就可以存儲了,這里暫時存儲到自己本地電腦上吧:
with open(filename,"wb") as f: img = url_open(each).content f.write(img)ok,這樣就完成了,是不是很簡單?當然爬蟲說簡單也簡單,說復雜也復雜,關(guān)鍵是要看自己想做什么事情,如果你從這個例子中發(fā)現(xiàn)自己對 python 又多了些許興趣,那不妨多關(guān)注我,我往后給你寫一些 python爬蟲 所需要的知識點,例如其它的爬蟲模塊如Scrapy ,一些表單的請求參數(shù),反爬蟲,cookie,多進程抓取等等。
專門為 Python 開了個公眾號:學習python的正確姿勢 ,在里面發(fā)送 「meizi」獲取抓美女的源代碼吧。
不說了,我再去抓取多一點美女的圖片了。
相關(guān)文章python3入門基礎(chǔ)有趣的教程
Categories: python
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/42711.html
摘要:很多人學習爬蟲的第一驅(qū)動力就是爬取各大網(wǎng)站的妹子圖片,比如比較有名的。最后我們只需要運行程序,即可執(zhí)行爬取,程序運行命名如下完整代碼我已上傳到微信公眾號后臺,在癡海公眾號后臺回復即可獲取。本文首發(fā)于公眾號癡海,后臺回復即可獲取最新編程資源。 showImg(https://segmentfault.com/img/remote/1460000016780800); 閱讀文本大概需要 1...
摘要:爬蟲入門聽說你寫代碼沒動力本文就給你動力,爬取妹子圖。分別進入每個套圖中去,下載相應的圖片。最大線程數(shù)設置為正在下載頁好了,之后運行,我們的爬蟲就會孜孜不倦的為我們下載漂亮妹子啦。 Python 爬蟲入門 聽說你寫代碼沒動力?本文就給你動力,爬取妹子圖。如果這也沒動力那就沒救了。 GitHub 地址: https://github.com/injetlee/Python/blob/ma...
摘要:為了寫好爬蟲,我們需要準備一個火狐瀏覽器,還需要準備抓包工具,抓包工具,我使用的是自帶的,加上,這兩款軟件的安裝和使用,建議你還是學習一下,后面我們應該會用到。 妹子圖網(wǎng)站----前言 從今天開始就要擼起袖子,直接寫Python爬蟲了,學習語言最好的辦法就是有目的的進行,所以,接下來我將用10+篇的博客,寫爬圖片這一件事情。希望可以做好。 為了寫好爬蟲,我們需要準備一個火狐瀏覽器,還需...
摘要:為了寫好爬蟲,我們需要準備一個火狐瀏覽器,還需要準備抓包工具,抓包工具,我使用的是自帶的,加上,這兩款軟件的安裝和使用,建議你還是學習一下,后面我們應該會用到。 妹子圖網(wǎng)站----前言 從今天開始就要擼起袖子,直接寫Python爬蟲了,學習語言最好的辦法就是有目的的進行,所以,接下來我將用10+篇的博客,寫爬圖片這一件事情。希望可以做好。 為了寫好爬蟲,我們需要準備一個火狐瀏覽器,還需...
閱讀 3822·2023-04-25 19:07
閱讀 3571·2021-11-22 12:02
閱讀 3146·2021-10-12 10:11
閱讀 3934·2021-09-03 10:49
閱讀 2899·2019-08-30 13:21
閱讀 3011·2019-08-30 11:14
閱讀 2096·2019-08-29 15:40
閱讀 2881·2019-08-28 18:29