? 作者主頁(yè):不吃西紅柿
? 簡(jiǎn)介:CSDN博客專家?、信息技術(shù)智庫(kù)公號(hào)作者?簡(jiǎn)歷模板、PPT模板、技術(shù)資料盡管【關(guān)注】私聊我。歷史文章目錄:https://t.1yb.co/zHJo
? 歡迎點(diǎn)贊 ? 收藏 ?留言 ? 如有錯(cuò)誤敬請(qǐng)指正!
本文重點(diǎn):
1、爬蟲獲取csdn大佬之間的關(guān)系
2、可視化分析曖昧關(guān)系,復(fù)雜堪比娛樂(lè)圈
大佬簡(jiǎn)介
? Java李楊勇:一個(gè)性感的計(jì)算機(jī)專業(yè)畢業(yè)的3年java開發(fā)者。
? 沉默王二:CSDN 頭牌博主,Java 領(lǐng)域優(yōu)質(zhì)創(chuàng)作者,2019、2020 兩屆博客之星 Top5?。
? 擦姐yyds:現(xiàn)象級(jí)專欄 《Python 爬蟲 100 例》作者、《滾雪球?qū)W Python 專欄》原創(chuàng)者。
? 濤歌依舊:濤哥不知何許人也,亦不詳其姓字。閑靜少言,不慕榮利。好讀書,求甚解。
? Lucifer三思而后行:靈感來(lái)源于生活,故而熱愛生活~
? 曲鳥:python領(lǐng)域新星創(chuàng)作者。
? 孤寒者:深入淺出的講解Python基礎(chǔ)知識(shí)&爬蟲初階及進(jìn)階&主流Web框架(Django等)
? 肥學(xué)大師:目前還是學(xué)生喜歡分享從每個(gè)項(xiàng)目得到的技術(shù)和趣聞?lì)惖奈恼隆?/p>
不甚枚舉......
目錄
我們尤其可以看到:
這個(gè)「不吃西紅柿」竟然關(guān)注了所有人,簡(jiǎn)直是朵交際花,不僅文章寫得好,還愛交朋友! 據(jù)說(shuō),他最近有評(píng)論必回關(guān)? ?
C站的關(guān)注api:
https://blog.csdn.net/community/home-api/v1/get-follow-list?page=%s&size=20&noMore=false&blogUsername=%s"%(p,Username)
需要傳入兩個(gè)參數(shù):頁(yè)數(shù)、用戶id
%(p,Username)
還是經(jīng)典的爬蟲包: import requests
def get_follow(Username): headers = { "User-Agent": "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; WOW64; Trident/4.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; .NET4.0C; InfoPath.3)", "accept": "application/json, text/javascript, */*; q=0.01", "accept-encoding": "gzip, deflate, br", "accept-language": "zh-CN,zh;q=0.9", "content-type": "application/x-www-form-urlencoded; charset=UTF-8", "cookie": "cookie", } data ={ "page": "1", "size": "20", "noMore": "false", "blogUsername": Username } follow_list = [] for p in range(1,101): url = "https://blog.csdn.net/community/home-api/v1/get-follow-list?page=%s&size=20&noMore=false&blogUsername=%s"%(p,Username) res = requests.get(url,headers=headers,data=data) fans = json.loads(res.text)["data"]["list"] if fans: follow_list.extend(fans) else: break ff = [] for i in follow_list: ff.append(i["username"]) return ff
def graph(nodes, links): graph = Graph() graph.add("Name:", nodes,links, repulsion=8000) graph.set_global_opts(title_opts=opts.TitleOpts("關(guān)系圖")) graph.render() #生成render.html
if __name__ == "__main__": nodes,links = [],[] blog = { "weixin_39032019": "不吃西紅柿", "Mancuojie":"Mancuojie", "weixin_39709134": "Java李楊勇", "zhongguomao": "SAP劍客", "qing_gee": "沉默王二", "hihell": "擦姐yyds", "stpeace": "濤歌依舊", "jacke121": "AI視覺網(wǎng)奇", "weixin_40400177": "DrogoZhang", "m0_50546016": "Lucifer三思而后行", "momoda118": "曲鳥大師", "qq_44907926": "孤寒大佬", "jiahuiandxuehui": "肥學(xué)大師", } blog_key = blog.keys() for blogUsername in blog: follows = get_follow(blogUsername) simple_follows = [val for val in follows if val in blog_key] nodes.append({"name": blog[blogUsername] }) for one in simple_follows: if blog[blogUsername] != blog[one]: links.append({"source": blog[blogUsername] ,"target":blog[one] }) print(links) graph(nodes,links)
好了,今天的「爬蟲」和「數(shù)據(jù)可視化」小課堂,就到這里了,我是西紅柿?,我們下期再見~
熱門專欄推薦:
? 大數(shù)據(jù)集錦專欄:大數(shù)據(jù)-硬核學(xué)習(xí)資料 & 面試真題集錦?
??數(shù)據(jù)倉(cāng)庫(kù)專欄:數(shù)倉(cāng)發(fā)展史、建設(shè)方法論、實(shí)戰(zhàn)經(jīng)驗(yàn)、面試真題?
??Python專欄:Python相關(guān)黑科技:爬蟲、算法、小工具?
(優(yōu)質(zhì)好文持續(xù)更新中……)?
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/118776.html
??大佬都在學(xué)什么?Python爬蟲分析C站大佬收藏夾,跟著大佬一起學(xué),你就是下一個(gè)大佬??! 前言程序說(shuō)明數(shù)據(jù)爬取獲取 CSDN 作者總榜數(shù)據(jù)獲取收藏夾列表獲取收藏?cái)?shù)據(jù)爬蟲程序完整代碼爬取數(shù)據(jù)結(jié)果 數(shù)據(jù)分析及可視化 前言 計(jì)算機(jī)行業(yè)的發(fā)展太快了,有時(shí)候幾天不學(xué)習(xí),就被時(shí)代所拋棄了,因此對(duì)于我們程序員而言,最重要的就是要時(shí)刻緊跟業(yè)界動(dòng)態(tài)變化,學(xué)習(xí)新的技術(shù),但是很多時(shí)候我們又不知道學(xué)什么好,萬(wàn)...
??蘇州程序大白一文從基礎(chǔ)手把手教你Python數(shù)據(jù)可視化大佬??《??記得收藏??》 目錄 ????開講啦?。。?!????蘇州程序大白?????博主介紹前言數(shù)據(jù)關(guān)系可視化散點(diǎn)圖 Scatter plots折線圖強(qiáng)調(diào)連續(xù)性 Emphasizing continuity with line plots同時(shí)顯示多了圖表 數(shù)據(jù)種類的可視化 Plotting with categorical da...
摘要:我是布小禪,一枚自學(xué)萌新,跟著我每天進(jìn)步一點(diǎn)點(diǎn)吧說(shuō)了這么多暫時(shí)也就夠了,那么就告辭吧 文章目錄 ?? 前言 ??? 作者簡(jiǎn)介 ??文件操作?1??、open函數(shù)...
摘要:標(biāo)簽不區(qū)分大小寫,但推薦小寫。標(biāo)簽可以嵌套,但不能交叉嵌套。標(biāo)簽也稱為元素。比如行內(nèi)標(biāo)簽亦可成行內(nèi)元素。 ??HTML必備知識(shí)詳解?? 第一部分:HTML框架簡(jiǎn)介...
閱讀 3396·2021-11-24 09:38
閱讀 1392·2021-11-22 15:08
閱讀 1467·2021-09-29 09:35
閱讀 485·2021-09-02 15:11
閱讀 1310·2019-08-30 12:55
閱讀 392·2019-08-29 17:16
閱讀 497·2019-08-29 11:30
閱讀 422·2019-08-26 13:23