摘要:我又回頭看那個爬京東的程序哦我好像被反爬蟲發(fā)現(xiàn)了解決反爬蟲問題這下可以了吧直接點開鏈接看一下沒錯,火狐才是我的默認(rèn)瀏覽器終于不用再說交封不殺了。
昨晚終于提交了該死的31條CPU,今天十節(jié)課翹了八節(jié),躺在宿舍睡覺,不幸遇到幾百年難得一見的點名……然而當(dāng)時我在吃炸雞,沒法(懶)趕過去,達(dá)成“第一次翹課就點名”。
心情郁結(jié)的我打算看一看漂亮小姐姐開心一下,于是我發(fā)現(xiàn)了這個視頻:
據(jù)說是Rose韓國站的站姐飛去美國科切拉音樂節(jié)現(xiàn)場拍攝的視頻。因為四個站只有Rose的站姐去了,所以視頻、高清圖都非常珍稀。
于是我對up主說:
交封不殺!
但是顯然up主并不care我的留言,氣。
求人不如求己,打開開發(fā)者工具:
……我瞎了……
老年人還是要放大字體啊。
看我找到了什么?
哈哈哈哈哈哈哈哈哈
復(fù)制鏈接打開:
555為什么會有這么漂亮的小姐姐??!我愛了??!
但是后面我又發(fā)現(xiàn)了更多想要封面的視頻:
一個一個找我怕不是要累死……
想到“一個木函”這個app之前有獲取B站封面的功能,但是后來用不了了。
那我就自己寫一個!
(非常激動,畢竟我只會用python寫hello world)
工具:pycharm(不得不說這東西的logo真丑);
功能:輸入av號,生成封面圖片鏈接;
環(huán)境:python3.7
思路:輸入av號,到相應(yīng)的網(wǎng)址,打開開發(fā)者界面,找到并返回圖片鏈接。
那就開始吧!
剛剛那個視頻的鏈接是:
結(jié)構(gòu)是https://www.bilibili.com/ + video + av號。
that"s easy.
def getcover(): avnum=input("please input the av number of your video:") url="https://www.bilibili.com/video/av"+avnum
emmmm,下面該怎么做?
哦對!下面找圖片的鏈接!
可以看出來,只要找到
itemprop="image"
content="https://balabala.jpg"
就能確定圖片地址。
index1=text.find("itemprop="image"")+len("itemprop="image" content="") index2=text.find(""",index1) cover=text[index1:index2] print(cover)
作為一個不會python的人,我能寫出這段真是感天動地了。
(我在網(wǎng)上找到好多教python爬蟲的文章,可是他們寫的都好長好復(fù)雜……然后看到一個爬取京東商品信息的,從里面摳出來這一段……)
anyway,運行!
咦,出錯了。
我又回頭看那個爬京東的程序……
哦!我沒加head。
headers={ "Host":"www.bilibili.com", "User-Agent": "Chrome/73.0.3683.103" }
再運行……
還是錯。wtf。
我又回頭看那個爬京東的程序……
哦!我好像被反爬蟲發(fā)現(xiàn)了!
text=requests.get(url,headers=headers).text#解決反爬蟲問題
這下可以了吧?
直接點開鏈接看一下?
沒錯,火狐才是我的默認(rèn)瀏覽器
perfect!
終于不用再說“交封不殺”了。
下面附上源代碼:
import re import requests def getcover(): avnum=input("please input the av number of your video:") url="https://www.bilibili.com/video/av"+avnum headers={ "Host":"www.bilibili.com", "User-Agent": "Chrome/73.0.3683.103" } text=requests.get(url,headers=headers).text#解決反爬蟲問題 index1=text.find("itemprop="image"")+len("itemprop="image" content="") index2=text.find(""",index1) cover=text[index1:index2] print(cover) getcover()
最后,記錄一下一些“意想不到的bug”。
正常的不會python的人的bug:
ModuleNotFoundError: No module named "requests"
上網(wǎng)找這個bug的原因,都顯示因為沒有安裝這個package。
ok,那裝。
順便升級了一下pip
但是還是同樣的報錯。
找啊找找啊找,終于看到有人說,或許是因為“沒有安裝到同一目錄”。
what???誰和誰沒有安裝到同一目錄???
但是!我突然想到,第一次用的時候輸入任何代碼都報錯,因為我沒把python放到interpreter里。
打開project interpreter,發(fā)現(xiàn)果然沒有requests。
那就手動install一下:
perfect!
不正常的bug:
python語句結(jié)尾不要加分號!?。?/p>
不要加分號?。?!
不要加分號?。?!
python的注釋是#不是// ?。?!
python的注釋是#不是// ?。?!
python的注釋是#不是// ?。?!
That"s all.
最后,python和C++真的是太不一樣了。
python可以引用的東西非常多,很多東西都不需要自己寫。
但是其實也差不多,不過相比之下,python的可讀性更好一點。
btw我還是懶得學(xué)orz
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/43674.html
摘要:摘要近日,阿里云重磅推出視頻點播新功能視頻,基于深度學(xué)習(xí)計算機視覺技術(shù)和海量數(shù)據(jù),為廣大用戶提供多場景的視頻服務(wù)。場景應(yīng)用功能特性阿里云視頻智能服務(wù)在標(biāo)簽預(yù)測內(nèi)容審核智能封面等層面能夠提供多種應(yīng)用服務(wù)。 摘要: 近日,阿里云重磅推出視頻點播新功能——視頻AI ,基于深度學(xué)習(xí)、計算機視覺技術(shù)和海量數(shù)據(jù),為廣大用戶提供多場景的視頻AI服務(wù)。 點此查看原文:http://click.aliy...
閱讀 1474·2021-11-17 09:33
閱讀 3070·2021-10-13 09:39
閱讀 2736·2021-10-09 10:01
閱讀 2491·2021-09-29 09:35
閱讀 3976·2021-09-26 10:01
閱讀 3550·2019-08-26 18:37
閱讀 3203·2019-08-26 13:46
閱讀 1941·2019-08-26 13:39