成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

數(shù)據(jù)科學(xué) 第 3 章 12 處理時間序列,小時、分

Atom / 1966人閱讀

摘要:時間序列,日期格式處理原以為本章是講怎么用處理時間格式,比如提取年月之類的。新增一列日期,不要時分新增兩列年,月,以便后續(xù)分析。這個方法太復(fù)雜,而且處理時間可能會更長,看下面的簡單方法新增月份年。

時間序列,日期格式處理

原以為本章是講怎么用python處理時間格式,比如提取年月之類的。
但本節(jié)寫的是時間格式已經(jīng)工整后的事,暫時不是我想學(xué)的,所以跳過,就沒有寫公式了。

下面的函數(shù)時之前谷歌之后學(xué)到的,先放上來,書里面的在分割線后面:

--1、把列表中 str 轉(zhuǎn)為datetime格式:pd.to_datetime

這次使用的是trd的數(shù)據(jù),對用戶名,產(chǎn)品,姓名做了處理。
要改變df中times的格式
cycle 3576 non-null object
amount 3576 non-null float64
times 3576 non-null object

#修改時間格式
# datetime.strptime(df.times, %Y%m%d)  這行代碼是先測試是否修改成功
df["times"] = pd.to_datetime(df["times"], format="%Y/%m/%d")

更改后
cycle 3576 non-null object
amount 3576 non-null float64
times 3576 non-null datetime64[ns]

*講了asfreq() 和 resample() 的使用方法,但是沒有g(shù)et到意思,略過。

--2、只取日期,不要時分

新增一列date,保留年月日,不要小時和分。

#新增一列日期,不要時分
df["date"] = pd.to_datetime(df["times"]).dt.normalize()
df

新增兩列:年,月,以便后續(xù)分析。
(-- 這個方法太復(fù)雜,而且處理時間可能會更長,看下面的簡單方法?。。。?/p>

#新增月份、年。在月份補齊為兩位數(shù),要先把原來的month改為字符串,再補齊原month,最后循環(huán)
df["year"] = [i.year for i in df["date"]]
df["month"] = [str(i.month).zfill(2) for i in df["date"]]
df

數(shù)據(jù)處理完成之后,就可以用年月創(chuàng)建透視表了。

畫了一個17年每天交易量的圖,順便引出下一章的內(nèi)容,畫圖。

df.groupby(["date"])["amount"].count().plot()

把圖刪了,下一章全是講的圖,而且要突出下面的內(nèi)容。

3、讀取日期中的年、月、日、小時、分、等等等等

啊啊啊啊啊啊啊?。。。?!這個真的找了好久的方法怎么讀取dataframe中的小時和分,搜索之后全是讀取現(xiàn)在的,妹的,你要現(xiàn)在的有鬼用啊,你的數(shù)據(jù)里面不是已經(jīng)有具體的時間了嗎,分析現(xiàn)在的時分干嘛?找了2個小時,翻來覆去都是這些沒用的,越找越暴躁,最后還是在stackoverflow上找到了,感恩

文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/44990.html

相關(guān)文章

  • ApacheCN 人工智能知識樹 v1.0

    摘要:貢獻(xiàn)者飛龍版本最近總是有人問我,把這些資料看完一遍要用多長時間,如果你一本書一本書看的話,的確要用很長時間。為了方便大家,我就把每本書的章節(jié)拆開,再按照知識點合并,手動整理了這個知識樹。 Special Sponsors showImg(https://segmentfault.com/img/remote/1460000018907426?w=1760&h=200); 貢獻(xiàn)者:飛龍版...

    劉厚水 評論0 收藏0
  • 數(shù)據(jù)科學(xué) 5 建模過程 與 決策樹模型

    摘要:一周沒寫文了,之前干什么去了呢本周前半部分卡在畫圖了,然后的時間在處理數(shù)據(jù),處理數(shù)據(jù)是我目前在畫圖和機器學(xué)習(xí)上一個重大的障礙,處理各種報錯各種不適合,等我學(xué)會了和你再來堵我呀 一周沒寫文了,之前干什么去了呢?本周前半部分卡在畫圖了,然后1/3的時間在處理數(shù)據(jù),處理數(shù)據(jù)是我目前在畫圖和機器學(xué)習(xí)上一個重大的障礙,python處理各種報錯各種不適合,等我學(xué)會了kettle和spark你再來堵...

    lowett 評論0 收藏0
  • 數(shù)據(jù)科學(xué) 4 1-3 畫圖的簡單設(shè)置

    摘要:保存打開執(zhí)行打開的時候要先加載一個包第二節(jié)畫個圖的方法風(fēng)格面向?qū)ο螽媹D第節(jié)簡易線型圖先設(shè)置。是一個可以裝圖形文字的容器是帶有刻度和標(biāo)簽的矩形。 第 4 章是講用matplotlib畫圖 期待已久的內(nèi)容,用可視化展示數(shù)據(jù)比丟一張數(shù)據(jù)表給他好的多,在建模的時候先畫個圖會清晰不少,下面進入正題: 數(shù)據(jù)源:當(dāng)然是上一章最后一節(jié)的提取了小時的sougou數(shù)據(jù) 第一節(jié):保存就是教你怎么保存畫的圖,...

    ShevaKuilin 評論0 收藏0
  • Javascript中的時間

    摘要:比如中國,從西到東橫跨東五東六東七東八和東九五個時區(qū),中華人民共和國成立以后,全國統(tǒng)一采用首都北京所在的東八時區(qū)的區(qū)時作為標(biāo)準(zhǔn)時間,稱為北京時間。全球所有國家根據(jù)時間和各自國家所在的時區(qū)確定當(dāng)?shù)貢r間,以此來保證全球時間的低誤差同步。 我們在編程時,不可避免地會和時間打交道。 比如要完成一次秒殺活動, 就會涉及到時間存取,時間同步和時間差值計算等諸多細(xì)節(jié)。一個JavsScript的簡單例...

    MageekChiu 評論0 收藏0
  • 如何在高性能計算中穩(wěn)中求勝?

    摘要:年月日,由中國信息通信研究院以下簡稱中國信通院中國通信學(xué)會中國通信標(biāo)準(zhǔn)化協(xié)會共同主辦的可信云大會在北京國際會議中心召開。兩日內(nèi),共有人次參與了本屆會議。2018年8月14-15日,由中國信息通信研究院(以下簡稱中國信通院)、中國通信學(xué)會、中國通信標(biāo)準(zhǔn)化協(xié)會共同主辦的2018可信云大會在北京國際會議中心召開。兩日內(nèi),共有5000人次參與了本屆會議。會上公布了第十批通過可信云評估的服務(wù)名單,揭曉...

    yeooo 評論0 收藏0

發(fā)表評論

0條評論

最新活動
閱讀需要支付1元查看
<