成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專(zhuān)欄INFORMATION COLUMN

記一次關(guān)于sklearn.datasets.fetch_20newsgroups的下載速度極慢的解決

dabai / 2941人閱讀

摘要:明天就是中秋節(jié)了現(xiàn)在的實(shí)驗(yàn)室空空蕩蕩的只剩下我們幾個(gè)了提前祝大家中秋快樂(lè)

最近, 耗子我在做關(guān)于互聯(lián)網(wǎng)新聞分類(lèi)的項(xiàng)目, 需要用到sklearn.datasets里新聞數(shù)據(jù)抓取器fetch_20newsgroups, 而當(dāng)將參數(shù)subset設(shè)置為"all"時(shí), fetch_20newsgroups需要即時(shí)從互聯(lián)網(wǎng)下載數(shù)據(jù), So:

稍有python下載經(jīng)驗(yàn)的就知道, 1M就得等很久了, 這是14M, 啊??!


So:老辦法一

直接復(fù)制圖片中的網(wǎng)址下載:

https://ndownloader.figshare.com/files/5975967

然后, 依然很慢......


So:老辦法二

復(fù)制鏈接, 用火狐瀏覽器插件多線程下載器下載
額, 也不算快啊......


So:老辦法三

直接復(fù)制鏈接給迅雷呀!? 剛咋沒(méi)想到呢????
行吧, 還算迅雷給力......

接下來(lái)。。。

問(wèn)題又來(lái)了, 有文件了, Python 怎么讀取啊???
文件名是 20newsbydate.tar.gz
然后我就搜了 Python如何讀取gz文件
大概是我中午沒(méi)睡好吧, 搜這干嘛......

幾經(jīng)波折, 終于找到了......
感謝大神的分享: 這里是原文

在此說(shuō)明如下:
fetch_20newsgroups函數(shù)將下載的文件放在
C:Users(你的user_name)scikit_learn_data20news_home目錄下
將你下載的文件放在這里

注:
Python下載的文件叫20new-sbydate.tar.gz
你下載的叫20newsbydate.tar.gz
所以改成它那樣的就成
(不過(guò)自己應(yīng)該先看下, 你那個(gè)版本的Python下載的文件名字是啥)


進(jìn)入Python安裝文件夾中找到文件 twenty_newsgroups.py

用任意文本編輯器打開(kāi)它
找到download_20newsgroups函數(shù)

上紅框是下載文件的部分, 下紅框是解壓文件的部分
So, 我們只需要將上紅框注釋掉, 并加入文件地址即可
然后, ctrl+s , 如圖:

有可能再報(bào)一個(gè)縮進(jìn)的錯(cuò):

縮進(jìn)嘛, 看下哪行的4個(gè)空格變成一個(gè)Tab了, 改過(guò)來(lái)即可


So:

這是耗子我第一次發(fā)文章, 有錯(cuò)誤的請(qǐng)不吝賜教, 耗子一定改正。 明天就是中秋節(jié)了, 現(xiàn)在的實(shí)驗(yàn)室空空蕩蕩的只剩下我們幾個(gè)了, 提前祝大家中秋快樂(lè)!

文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/42517.html

相關(guān)文章

  • 一次修復(fù)微信支付吊起非常慢問(wèn)題

    摘要:記一次修復(fù)微信支付吊起非常慢的問(wèn)題微信接支付調(diào)用有些安卓手機(jī)吊起非常慢,因?yàn)檎{(diào)支付寫(xiě)法就是這樣子,實(shí)在定位不到問(wèn)題所在,正在打算放棄的時(shí)候。定位會(huì)導(dǎo)致支付吊起不了嗎原來(lái)之前把瀏覽器定位換成了微信定位,解決安卓下面會(huì)頻繁彈授權(quán)的問(wèn)題。 記一次修復(fù)微信支付吊起非常慢的問(wèn)題 微信h5接支付調(diào)用 window.wx.invoke(getBrandWCPayRequest) 有些安卓手機(jī)吊起非常...

    Mertens 評(píng)論0 收藏0
  • sklearn 文本分類(lèi)記錄 [1] 官方文檔

    摘要:最后,模型甚至可以返回最能影響分類(lèi)器分類(lèi)效果的個(gè)單詞,但是要求分類(lèi)器有屬性,目前用到的幾個(gè)分類(lèi)器,似乎都有這個(gè)這個(gè)屬性。 工作上需要用到文本分類(lèi),這里用 sklearn 做為工具,記錄下學(xué)習(xí)過(guò)程 目錄 1. SVM 文本分類(lèi)范例2. sklearn 做文本分類(lèi)其他可選分類(lèi)器3. 文本分類(lèi)的數(shù)據(jù)預(yù)處理3. 中文文本分類(lèi)方法 SVM 文本分類(lèi)范例 import numpy as np f...

    pcChao 評(píng)論0 收藏0
  • 一次MongoDB高負(fù)載性能優(yōu)化

    摘要:年月日本文是關(guān)于記錄某次游戲服務(wù)端的性能優(yōu)化此處涉及的技術(shù)包括引擎隨著游戲?qū)肴藬?shù)逐漸增加單個(gè)集合的文檔數(shù)已經(jīng)超過(guò)經(jīng)常有玩家反饋說(shuō)卡特別是在服務(wù)器遷移后從核降到核卡頓更嚴(yán)重了遂開(kāi)始排查問(wèn)題確認(rèn)服務(wù)器壓力首先使用命令查看總體情況此時(shí)占用不高 Last-Modified: 2019年6月13日11:08:19 本文是關(guān)于記錄某次游戲服務(wù)端的性能優(yōu)化, 此處涉及的技術(shù)包括: MongoDB...

    huhud 評(píng)論0 收藏0
  • 一次MongoDB高負(fù)載性能優(yōu)化

    摘要:年月日本文是關(guān)于記錄某次游戲服務(wù)端的性能優(yōu)化此處涉及的技術(shù)包括引擎隨著游戲?qū)肴藬?shù)逐漸增加單個(gè)集合的文檔數(shù)已經(jīng)超過(guò)經(jīng)常有玩家反饋說(shuō)卡特別是在服務(wù)器遷移后從核降到核卡頓更嚴(yán)重了遂開(kāi)始排查問(wèn)題確認(rèn)服務(wù)器壓力首先使用命令查看總體情況此時(shí)占用不高 Last-Modified: 2019年6月13日11:08:19 本文是關(guān)于記錄某次游戲服務(wù)端的性能優(yōu)化, 此處涉及的技術(shù)包括: MongoDB...

    vibiu 評(píng)論0 收藏0

發(fā)表評(píng)論

0條評(píng)論

最新活動(dòng)
閱讀需要支付1元查看
<