摘要:時間序列,日期格式處理原以為本章是講怎么用處理時間格式,比如提取年月之類的。新增一列日期,不要時分新增兩列年,月,以便后續(xù)分析。這個方法太復(fù)雜,而且處理時間可能會更長,看下面的簡單方法新增月份年。
時間序列,日期格式處理
原以為本章是講怎么用python處理時間格式,比如提取年月之類的。
但本節(jié)寫的是時間格式已經(jīng)工整后的事,暫時不是我想學(xué)的,所以跳過,就沒有寫公式了。
下面的函數(shù)時之前谷歌之后學(xué)到的,先放上來,書里面的在分割線后面:
--1、把列表中 str 轉(zhuǎn)為datetime格式:pd.to_datetime這次使用的是trd的數(shù)據(jù),對用戶名,產(chǎn)品,姓名做了處理。
要改變df中times的格式
cycle 3576 non-null object
amount 3576 non-null float64
times 3576 non-null object
#修改時間格式 # datetime.strptime(df.times, %Y%m%d) 這行代碼是先測試是否修改成功 df["times"] = pd.to_datetime(df["times"], format="%Y/%m/%d")
更改后
cycle 3576 non-null object
amount 3576 non-null float64
times 3576 non-null datetime64[ns]
*講了asfreq() 和 resample() 的使用方法,但是沒有g(shù)et到意思,略過。
--2、只取日期,不要時分新增一列date,保留年月日,不要小時和分。
#新增一列日期,不要時分 df["date"] = pd.to_datetime(df["times"]).dt.normalize() df
新增兩列:年,月,以便后續(xù)分析。
(-- 這個方法太復(fù)雜,而且處理時間可能會更長,看下面的簡單方法?。。。?/p>
#新增月份、年。在月份補齊為兩位數(shù),要先把原來的month改為字符串,再補齊原month,最后循環(huán) df["year"] = [i.year for i in df["date"]] df["month"] = [str(i.month).zfill(2) for i in df["date"]] df
數(shù)據(jù)處理完成之后,就可以用年月創(chuàng)建透視表了。
畫了一個17年每天交易量的圖,順便引出下一章的內(nèi)容,畫圖。
df.groupby(["date"])["amount"].count().plot()
把圖刪了,下一章全是講的圖,而且要突出下面的內(nèi)容。
3、讀取日期中的年、月、日、小時、分、等等等等啊啊啊啊啊啊啊?。。。?!這個真的找了好久的方法怎么讀取dataframe中的小時和分,搜索之后全是讀取現(xiàn)在的,妹的,你要現(xiàn)在的有鬼用啊,你的數(shù)據(jù)里面不是已經(jīng)有具體的時間了嗎,分析現(xiàn)在的時分干嘛?找了2個小時,翻來覆去都是這些沒用的,越找越暴躁,最后還是在stackoverflow上找到了,感恩
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/44990.html
摘要:貢獻(xiàn)者飛龍版本最近總是有人問我,把這些資料看完一遍要用多長時間,如果你一本書一本書看的話,的確要用很長時間。為了方便大家,我就把每本書的章節(jié)拆開,再按照知識點合并,手動整理了這個知識樹。 Special Sponsors showImg(https://segmentfault.com/img/remote/1460000018907426?w=1760&h=200); 貢獻(xiàn)者:飛龍版...
摘要:一周沒寫文了,之前干什么去了呢本周前半部分卡在畫圖了,然后的時間在處理數(shù)據(jù),處理數(shù)據(jù)是我目前在畫圖和機器學(xué)習(xí)上一個重大的障礙,處理各種報錯各種不適合,等我學(xué)會了和你再來堵我呀 一周沒寫文了,之前干什么去了呢?本周前半部分卡在畫圖了,然后1/3的時間在處理數(shù)據(jù),處理數(shù)據(jù)是我目前在畫圖和機器學(xué)習(xí)上一個重大的障礙,python處理各種報錯各種不適合,等我學(xué)會了kettle和spark你再來堵...
摘要:保存打開執(zhí)行打開的時候要先加載一個包第二節(jié)畫個圖的方法風(fēng)格面向?qū)ο螽媹D第節(jié)簡易線型圖先設(shè)置。是一個可以裝圖形文字的容器是帶有刻度和標(biāo)簽的矩形。 第 4 章是講用matplotlib畫圖 期待已久的內(nèi)容,用可視化展示數(shù)據(jù)比丟一張數(shù)據(jù)表給他好的多,在建模的時候先畫個圖會清晰不少,下面進入正題: 數(shù)據(jù)源:當(dāng)然是上一章最后一節(jié)的提取了小時的sougou數(shù)據(jù) 第一節(jié):保存就是教你怎么保存畫的圖,...
摘要:比如中國,從西到東橫跨東五東六東七東八和東九五個時區(qū),中華人民共和國成立以后,全國統(tǒng)一采用首都北京所在的東八時區(qū)的區(qū)時作為標(biāo)準(zhǔn)時間,稱為北京時間。全球所有國家根據(jù)時間和各自國家所在的時區(qū)確定當(dāng)?shù)貢r間,以此來保證全球時間的低誤差同步。 我們在編程時,不可避免地會和時間打交道。 比如要完成一次秒殺活動, 就會涉及到時間存取,時間同步和時間差值計算等諸多細(xì)節(jié)。一個JavsScript的簡單例...
摘要:年月日,由中國信息通信研究院以下簡稱中國信通院中國通信學(xué)會中國通信標(biāo)準(zhǔn)化協(xié)會共同主辦的可信云大會在北京國際會議中心召開。兩日內(nèi),共有人次參與了本屆會議。2018年8月14-15日,由中國信息通信研究院(以下簡稱中國信通院)、中國通信學(xué)會、中國通信標(biāo)準(zhǔn)化協(xié)會共同主辦的2018可信云大會在北京國際會議中心召開。兩日內(nèi),共有5000人次參與了本屆會議。會上公布了第十批通過可信云評估的服務(wù)名單,揭曉...
閱讀 3181·2023-04-25 19:09
閱讀 3893·2021-10-22 09:54
閱讀 1770·2021-09-29 09:35
閱讀 2925·2021-09-08 09:45
閱讀 2270·2021-09-06 15:00
閱讀 2781·2019-08-29 15:32
閱讀 1046·2019-08-28 18:30
閱讀 382·2019-08-26 13:43