python 獲得一個網(wǎng)站的所有鏈接

hzx 發(fā)布于2019-07-31 10:08 / 1635人閱讀

摘要：第一步，找個網(wǎng)站我這里就找行業(yè)里比較有名的收錄網(wǎng)站的網(wǎng)站酷網(wǎng)第二步，打開按下鼠標右鍵點擊查看源碼第三步，把源碼復(fù)制下來保存成一個文件命名第四步，執(zhí)行以下程序我這里用的版本

第一步，找個網(wǎng)站我這里就找行業(yè)里比較有名的收錄網(wǎng)站的網(wǎng)站酷113網(wǎng)

第二步，打開www.ku113.com 按下鼠標右鍵點擊查看源碼

第三步，把源碼復(fù)制下來保存成一個文件命名 ku113.html

第四步，執(zhí)行以下python 程序我這里用的py 2.7.13版本

coding:utf-8

import re
from bs4 import BeautifulSoup

with open(‘ku113.html’,‘r’) as f:
data = f.read()

print (data)

result = re.findall(r"(?<=href=").+?(?=")|(?<=href=’).+?(?=’)",data)

print result

for each in result:

print (each)

云服務(wù)器 GPU云服務(wù)器 js獲得所有的文檔如何獲得網(wǎng)站的源碼獲得網(wǎng)站的php代碼 js怎么獲得一個標簽

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://systransis.cn/yun/43323.html

相關(guān)文章

忘記API 使用Beautiful Soup進行Python Scraping，從Web導(dǎo)入數(shù)據(jù)文件

摘要：忘記使用進行，從導(dǎo)入數(shù)據(jù)文件第部分對于每個網(wǎng)站而言，并不總是適合您，但將永遠與您保持聯(lián)系以從任何網(wǎng)站收集任何類型的數(shù)據(jù)。非資源讓我們拿一個維基百科頁面進行報廢。請求它旨在被人類用于與語言進行通信。使用標簽，我們將告訴保護我們的數(shù)據(jù)。忘記API使用Beautiful Soup進行Python Scraping，從Web導(dǎo)入數(shù)據(jù)文件：第2部分對于每個網(wǎng)站而言，API并不總是適合您，但Be...

馬龍駒 2019-05-23 16:08 評論0 收藏0
忘記API 使用Beautiful Soup進行Python Scraping，從Web導(dǎo)入數(shù)據(jù)文件

摘要：忘記使用進行，從導(dǎo)入數(shù)據(jù)文件第部分對于每個網(wǎng)站而言，并不總是適合您，但將永遠與您保持聯(lián)系以從任何網(wǎng)站收集任何類型的數(shù)據(jù)。非資源讓我們拿一個維基百科頁面進行報廢。請求它旨在被人類用于與語言進行通信。使用標簽，我們將告訴保護我們的數(shù)據(jù)。忘記API使用Beautiful Soup進行Python Scraping，從Web導(dǎo)入數(shù)據(jù)文件：第2部分對于每個網(wǎng)站而言，API并不總是適合您，但Be...

wayneli 2019-06-03 15:29 評論0 收藏0
Python--Redis實戰(zhàn)：第一章：初識Redis：第三節(jié)：你好Redis-文章投票試煉

摘要：為了防止用戶對同一篇文章進行多次投票，網(wǎng)站需要為每一篇文章記錄一個已投票用戶名單。上一篇文章實戰(zhàn)第一章初識第二節(jié)數(shù)據(jù)結(jié)構(gòu)簡介下一篇文章實戰(zhàn)第二章使用構(gòu)建應(yīng)用第一節(jié)登錄和緩存上一篇文章： Python--Redis實戰(zhàn)：第一章：初識Redis：第二節(jié)：Redis數(shù)據(jù)結(jié)構(gòu)簡介下一篇文章：Python--Redis實戰(zhàn)：第二章：使用Redis構(gòu)建Web應(yīng)用：第一節(jié)：登錄和cookie緩存 ...

Meils 2019-07-30 18:01 評論0 收藏0
Python 從零開始爬蟲(六)——動態(tài)爬取解決方案之手動分析

摘要：之前提到動態(tài)加載就兩個解決方案手動分析和。背后有許多不為人知的交易進行著，動態(tài)爬取的任務(wù)就是攔截它們揭開它們的真面目。在爬蟲界有著霸王硬上弓的稱號，管它情不情愿，來了動態(tài)加載也只有屈服的份了。之前提到動態(tài)加載就兩個解決方案——手動分析和selenium。接下來的文章我們會來深入探討它們，本文將首先，重點介紹前者——手動分析手動分析是一個比較有難度，比較麻煩的解決方案，但優(yōu)點也很明顯...

rozbo 2019-07-30 16:30 評論0 收藏0

發(fā)表評論

登陸后可評論

0條評論

hzx

男|高級講師

我要關(guān)注我要私信

TA的文章

國內(nèi)Gravatar頭像的完美替代方案Cravatar

閱讀 1644·2021-09-02 09:55
行內(nèi)元素在設(shè)置float后，就可以設(shè)置width和height

閱讀 1118·2019-08-30 13:19
如何在Canvas中添加事件

閱讀 1405·2019-08-26 13:51
webpack中如何加載靜態(tài)文件

閱讀 1456·2019-08-26 13:49
electron跳坑指南 2(主進程和渲染進程)

閱讀 2385·2019-08-26 12:13
textarea文域高度自適應(yīng)

閱讀 465·2019-08-26 11:52
JS基礎(chǔ)07「函數(shù)」

閱讀 1913·2019-08-26 10:58
數(shù)據(jù)類型（概述）

閱讀 3093·2019-08-26 10:19

成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！