完成目標(biāo):
??獲取評(píng)論并制作詞云
??畢竟會(huì)在煙臺(tái)待上三年,先了解了解煙臺(tái)這個(gè)地方。
編輯器:pycharm
用到的庫:requests、wordcloud、jieba
??爬取去哪兒網(wǎng)關(guān)于蓬萊島的游客評(píng)論的前20頁
def save_comment(): fp = open("comment.txt", mode="w", encoding="utf-8") for num in range(1, 20): url = "https://piao.qunar.com/ticket/detailLight/sightCommentList.json?sightId=3827&index=" + str( num) + "&page=" + str(num) + "&pageSize=10&tagType=0" headers = { "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/93.0.4577.63 Safari/537.36 Edg/93.0.961.38", "accept": "application/json, text/javascript, */*; q=0.01", } response = requests.get(url=url, headers=headers) try: commentList = response.json()["data"]["commentList"] for comment in commentList: # content.append() fp.write(comment["content"] + "/n") except Exception as e: pass fp.close()
??讀取評(píng)論并制作詞云
def stopwordslist(): # 停用詞列表 stopwords = [line.strip() for line in open("Chinesestopword.txt", encoding="UTF-8").readlines()] return stopwordsdef get_wcd(): fp = open("comment.txt", "r", encoding="utf-8") data = fp.read() stopwords=stopwordslist() data_list = jieba.lcut(data) data_list = " ".join(data_list) outstr = "" for word in data_list: if word not in stopwords: if word != "/t": outstr += word outstr += " " wcd = wordcloud.WordCloud( font_path="simkai.ttf" , colormap="brg" , width=800 , height=400 , max_words=200 , background_color="white" , scale=16 ).generate(outstr) wcd.to_file("comment.jpg")
??還是不錯(cuò)滴,有機(jī)會(huì)去~~~
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/119543.html
摘要:接著線程過來通過方式獲取鎖,獲取鎖的過程就是通過操作變量將其值從變?yōu)椤>€程加鎖成功后還有一步重要的操作,就是將設(shè)置成為自己。線程屁顛屁顛的就去等待區(qū)小憩一會(huì)去了。 一、寫在前面 這篇文章,我們聊一聊Java并發(fā)中的核武器, AQS底層實(shí)現(xiàn)。 不管是工作三四年、還是五六年的在工作或者面試中涉及到并發(fā)的是時(shí)候總是繞不過AQS這個(gè)詞。 首先,確實(shí)還有很多人連AQS是什么都不知道,甚至有的竟...
摘要:語料庫是由文本構(gòu)成的數(shù)據(jù)集通過提供現(xiàn)成的文本數(shù)據(jù)來輔助文本處理。那么可以用來做什么呢我自己是一名從事是不錯(cuò)的入門選項(xiàng)。大數(shù)據(jù)和人工智能是機(jī)器學(xué)習(xí)和的主要開發(fā)語言。 Python培訓(xùn)有哪些內(nèi)容?很多零基礎(chǔ)學(xué)員不知道Python軟件是干什么用的?Python軟件是Python工程師編寫代碼時(shí)所需...
摘要:月底了,又到了我們總結(jié)這一個(gè)月技術(shù)干貨的時(shí)候了,又到了我們給粉絲免費(fèi)送書的日子了。 月底了,又到了我們總結(jié)這一個(gè)月 Java 技術(shù)干貨的時(shí)候了,又到了我們給粉絲免費(fèi)送書的日子了。 7 月份干貨總結(jié) Oracle 發(fā)布了一個(gè)全棧虛擬機(jī) GraalVM 一文帶你深入拆解 Java 虛擬機(jī) 圖文帶你了解 8 大排序算法 Spring Boot 2.x 新特性總結(jié)及遷移指南 Spring B...
摘要:但是,客戶在選擇的時(shí)候,不要只看概念,一定要緊盯智能,看目標(biāo)平臺(tái)是否在網(wǎng)絡(luò)監(jiān)控大數(shù)據(jù)分析調(diào)度管理等方面下大力氣天浩提醒一個(gè)小小的秘訣,就是看其有沒有服務(wù)等巨頭,被多家巨頭選用,一般不是假融合。大型互聯(lián)網(wǎng)企業(yè)的一次宕機(jī),會(huì)造成多大影響?國外有網(wǎng)友這么回答:(以為)世界末日來了!這是4月15日Facebook、Instagram等平臺(tái)的服務(wù)器大面積宕機(jī)故障之后,部分網(wǎng)民的吐槽,由此可見網(wǎng)絡(luò)服務(wù)穩(wěn)...
閱讀 3605·2021-11-23 09:51
閱讀 2812·2021-11-23 09:51
閱讀 689·2021-10-11 10:59
閱讀 1685·2021-09-08 10:43
閱讀 3239·2021-09-08 09:36
閱讀 3300·2021-09-03 10:30
閱讀 3306·2021-08-21 14:08
閱讀 2212·2021-08-05 09:59