摘要:官方文檔連接像其他函數(shù)一樣,官方文檔中的參數(shù)有很多,具體如下寫在前面,如果要對(duì)透視表中的字段進(jìn)行計(jì)數(shù),有時(shí)候用會(huì)報(bào)錯(cuò),可以用實(shí)例運(yùn)用簡(jiǎn)單版透視表上面以部門為索引,下面有二級(jí)索引,部門小組。
本節(jié)學(xué)習(xí)數(shù)據(jù)透視表
引用激勵(lì)數(shù)據(jù),連接數(shù)據(jù)庫jili表,jili這幾個(gè)太難打了,下文用df代表激勵(lì)數(shù)據(jù)(代碼省略)
之前在excel中用爛了的透視表,終于用python來實(shí)現(xiàn)了,其實(shí)主要是講pivot_table里面的參數(shù)怎么使用,但書中講的不是詳細(xì),還是要自己找一些文檔或者視頻輔助學(xué)習(xí)。
pivot_table 官方文檔連接
像其他函數(shù)一樣,官方文檔中的參數(shù)有很多,具體如下:
df.pivot_table(data, values=None, index=None, columns=None, aggfunc="mean", fill_value=None, margins=False, dropna=True, margins_name="All")
寫在前面,如果要對(duì)透視表中的字段進(jìn)行計(jì)數(shù),有時(shí)候用count會(huì)報(bào)錯(cuò),可以用len
實(shí)例運(yùn)用:
1、簡(jiǎn)單版透視表df.pivot_table(index="dep",aggfunc="sum") #上面以部門為索引,下面有二級(jí)索引,部門、小組。 不知道是不是叫二級(jí)索引,暫且這么命名吧 df.pivot_table(index=["dep","group"],aggfunc="sum")2、升級(jí)版透視表:金額分組
對(duì)金額進(jìn)行分組,然后再來透視表(看了就懂了):
#金額分組 amount = pd.cut(df["allbones"],[0,1000,5000,10000,20000,40000]) df.pivot_table(index=["dep",amount],values= "allbones", aggfunc="count")
因?yàn)橹付酥祐alues = "allbones",所以結(jié)果中只包含allbones的計(jì)算結(jié)果,如果不指定values,則會(huì)像上面一樣計(jì)算滿足條件的所有字段的count值。
進(jìn)行多個(gè)值的計(jì)算,并指定計(jì)算方法。 如果有需要,還可以增加計(jì)算值。
為了方便查看每個(gè)參數(shù)的內(nèi)容,所以換行了。
df.pivot_table(index =[ "dep",amount], values = ["allbones","oldrate"], aggfunc = {"allbones":[np.sum,len,np.mean], #一個(gè)字段進(jìn)行3中運(yùn)算 "oldrate":np.sum})4、在透視表最后加一個(gè)匯總
df.pivot_table(index =[ "dep",amount], values = ["allbones","oldrate"], aggfunc = [np.sum,np.mean,len], margins = True) #margins默認(rèn)為false,改成True后在表的最后顯示匯總5、大boss版,在每個(gè)部門下面進(jìn)行分類匯總:不會(huì)
還沒找到方法
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/44999.html
摘要:聚合后沒有用函數(shù),會(huì)返回一個(gè)用函數(shù)后會(huì)顯示計(jì)算結(jié)果組合之后,切片,查看的和??梢栽O(shè)定計(jì)算方法對(duì)列進(jìn)行了切片,如果的均值小于,則不顯示二部的均值低于,所以結(jié)果中沒有二部數(shù)據(jù)。 本節(jié)學(xué)習(xí)groupby 引用激勵(lì)數(shù)據(jù),連接數(shù)據(jù)庫jili表(代碼省略)數(shù)字簡(jiǎn)單計(jì)算本節(jié)內(nèi)容前面是運(yùn)用sum/mean等函數(shù)對(duì)數(shù)字簡(jiǎn)單計(jì)算 jili.mean() #求均值 jili.mean(axis = col...
摘要:時(shí)間序列,日期格式處理原以為本章是講怎么用處理時(shí)間格式,比如提取年月之類的。新增一列日期,不要時(shí)分新增兩列年,月,以便后續(xù)分析。這個(gè)方法太復(fù)雜,而且處理時(shí)間可能會(huì)更長,看下面的簡(jiǎn)單方法新增月份年。 時(shí)間序列,日期格式處理 原以為本章是講怎么用python處理時(shí)間格式,比如提取年月之類的。 但本節(jié)寫的是時(shí)間格式已經(jīng)工整后的事,暫時(shí)不是我想學(xué)的,所以跳過,就沒有寫公式了。 下面的函數(shù)時(shí)之前...
摘要:第章合并連接數(shù)據(jù)集包含三個(gè)函數(shù)省略,在頁。沒有對(duì)默認(rèn)合并兩個(gè)表的所有列,如果有列,有列,則結(jié)果為列多對(duì)保留多條記錄多對(duì)多會(huì)交叉每一條記錄通過參數(shù)設(shè)定連接方式兩個(gè)表都有兩個(gè)字段,則通過連接兩個(gè)表。 第3章 7-8:合并、連接數(shù)據(jù)集 包含三個(gè)函數(shù):numpy:concatenate 省略,在126頁。pandas:concat/ append(略過) /merge 主要是講merge函數(shù)...
摘要:主成分分析就是降維,通過線性組合,把多個(gè)原始變量合并成若干個(gè)主成分,這樣每個(gè)主成分都變成原始變量的線性組合。相關(guān)系數(shù)系數(shù)為為為。從結(jié)果看,這個(gè)數(shù)據(jù)可能不太適合用來分析,因?yàn)榻档骄S后的代筆性不足。 這兩天用學(xué)了主成分分析,用的是PCA。主成分分析就是降維,通過線性組合,把多個(gè)原始變量合并成若干個(gè)主成分,這樣每個(gè)主成分都變成原始變量的線性組合。所以你想看具體哪個(gè)特征對(duì)結(jié)果的影響大,通過PC...
摘要:數(shù)據(jù)規(guī)整化清理轉(zhuǎn)換合并重塑數(shù)據(jù)聚合與分組運(yùn)算數(shù)據(jù)規(guī)整化清理轉(zhuǎn)換合并重塑合并數(shù)據(jù)集可根據(jù)一個(gè)或多個(gè)鍵將不同中的行鏈接起來。函數(shù)根據(jù)樣本分位數(shù)對(duì)數(shù)據(jù)進(jìn)行面元?jiǎng)澐?。字典或,給出待分組軸上的值與分組名之間的對(duì)應(yīng)關(guān)系。 本篇內(nèi)容為整理《利用Python進(jìn)行數(shù)據(jù)分析》,博主使用代碼為 Python3,部分內(nèi)容和書本有出入。 在前幾篇中我們介紹了 NumPy、pandas、matplotlib 三個(gè)...
閱讀 2868·2021-11-22 15:22
閱讀 19337·2021-09-22 15:00
閱讀 1448·2021-09-07 09:58
閱讀 1251·2019-08-30 13:01
閱讀 2456·2019-08-29 16:27
閱讀 2356·2019-08-26 13:25
閱讀 1628·2019-08-26 12:13
閱讀 951·2019-08-26 11:53