摘要:明天就是中秋節(jié)了現(xiàn)在的實(shí)驗(yàn)室空空蕩蕩的只剩下我們幾個(gè)了提前祝大家中秋快樂(lè)
最近, 耗子我在做關(guān)于互聯(lián)網(wǎng)新聞分類(lèi)的項(xiàng)目, 需要用到sklearn.datasets里新聞數(shù)據(jù)抓取器fetch_20newsgroups, 而當(dāng)將參數(shù)subset設(shè)置為"all"時(shí), fetch_20newsgroups需要即時(shí)從互聯(lián)網(wǎng)下載數(shù)據(jù), So:
稍有python下載經(jīng)驗(yàn)的就知道, 1M就得等很久了, 這是14M, 啊??!
直接復(fù)制圖片中的網(wǎng)址下載:
https://ndownloader.figshare.com/files/5975967
然后, 依然很慢......
復(fù)制鏈接, 用火狐瀏覽器插件多線程下載器下載
額, 也不算快啊......
直接復(fù)制鏈接給迅雷呀!? 剛咋沒(méi)想到呢????
行吧, 還算迅雷給力......
問(wèn)題又來(lái)了, 有文件了, Python 怎么讀取啊???
文件名是 20newsbydate.tar.gz
然后我就搜了 Python如何讀取gz文件
大概是我中午沒(méi)睡好吧, 搜這干嘛......
幾經(jīng)波折, 終于找到了......
感謝大神的分享: 這里是原文
在此說(shuō)明如下:
fetch_20newsgroups函數(shù)將下載的文件放在
C:Users(你的user_name)scikit_learn_data20news_home目錄下
將你下載的文件放在這里
注:
Python下載的文件叫20new-sbydate.tar.gz
你下載的叫20newsbydate.tar.gz
所以改成它那樣的就成
(不過(guò)自己應(yīng)該先看下, 你那個(gè)版本的Python下載的文件名字是啥)
進(jìn)入Python安裝文件夾中找到文件 twenty_newsgroups.py
用任意文本編輯器打開(kāi)它
找到download_20newsgroups函數(shù)
上紅框是下載文件的部分, 下紅框是解壓文件的部分
So, 我們只需要將上紅框注釋掉, 并加入文件地址即可
然后, ctrl+s , 如圖:
有可能再報(bào)一個(gè)縮進(jìn)的錯(cuò):
縮進(jìn)嘛, 看下哪行的4個(gè)空格變成一個(gè)Tab了, 改過(guò)來(lái)即可
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/42517.html
摘要:記一次修復(fù)微信支付吊起非常慢的問(wèn)題微信接支付調(diào)用有些安卓手機(jī)吊起非常慢,因?yàn)檎{(diào)支付寫(xiě)法就是這樣子,實(shí)在定位不到問(wèn)題所在,正在打算放棄的時(shí)候。定位會(huì)導(dǎo)致支付吊起不了嗎原來(lái)之前把瀏覽器定位換成了微信定位,解決安卓下面會(huì)頻繁彈授權(quán)的問(wèn)題。 記一次修復(fù)微信支付吊起非常慢的問(wèn)題 微信h5接支付調(diào)用 window.wx.invoke(getBrandWCPayRequest) 有些安卓手機(jī)吊起非常...
摘要:最后,模型甚至可以返回最能影響分類(lèi)器分類(lèi)效果的個(gè)單詞,但是要求分類(lèi)器有屬性,目前用到的幾個(gè)分類(lèi)器,似乎都有這個(gè)這個(gè)屬性。 工作上需要用到文本分類(lèi),這里用 sklearn 做為工具,記錄下學(xué)習(xí)過(guò)程 目錄 1. SVM 文本分類(lèi)范例2. sklearn 做文本分類(lèi)其他可選分類(lèi)器3. 文本分類(lèi)的數(shù)據(jù)預(yù)處理3. 中文文本分類(lèi)方法 SVM 文本分類(lèi)范例 import numpy as np f...
摘要:年月日本文是關(guān)于記錄某次游戲服務(wù)端的性能優(yōu)化此處涉及的技術(shù)包括引擎隨著游戲?qū)肴藬?shù)逐漸增加單個(gè)集合的文檔數(shù)已經(jīng)超過(guò)經(jīng)常有玩家反饋說(shuō)卡特別是在服務(wù)器遷移后從核降到核卡頓更嚴(yán)重了遂開(kāi)始排查問(wèn)題確認(rèn)服務(wù)器壓力首先使用命令查看總體情況此時(shí)占用不高 Last-Modified: 2019年6月13日11:08:19 本文是關(guān)于記錄某次游戲服務(wù)端的性能優(yōu)化, 此處涉及的技術(shù)包括: MongoDB...
摘要:年月日本文是關(guān)于記錄某次游戲服務(wù)端的性能優(yōu)化此處涉及的技術(shù)包括引擎隨著游戲?qū)肴藬?shù)逐漸增加單個(gè)集合的文檔數(shù)已經(jīng)超過(guò)經(jīng)常有玩家反饋說(shuō)卡特別是在服務(wù)器遷移后從核降到核卡頓更嚴(yán)重了遂開(kāi)始排查問(wèn)題確認(rèn)服務(wù)器壓力首先使用命令查看總體情況此時(shí)占用不高 Last-Modified: 2019年6月13日11:08:19 本文是關(guān)于記錄某次游戲服務(wù)端的性能優(yōu)化, 此處涉及的技術(shù)包括: MongoDB...
閱讀 3506·2021-10-14 09:42
閱讀 2782·2021-09-08 10:44
閱讀 1378·2021-09-02 10:18
閱讀 3753·2021-08-30 09:43
閱讀 2886·2021-07-29 13:49
閱讀 3768·2019-08-29 17:02
閱讀 1627·2019-08-29 15:09
閱讀 1074·2019-08-29 11:01