成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

數(shù)據(jù)科學(xué) 第 3 章 10 數(shù)據(jù)透視表

lily_wang / 1571人閱讀

摘要:官方文檔連接像其他函數(shù)一樣,官方文檔中的參數(shù)有很多,具體如下寫在前面,如果要對(duì)透視表中的字段進(jìn)行計(jì)數(shù),有時(shí)候用會(huì)報(bào)錯(cuò),可以用實(shí)例運(yùn)用簡(jiǎn)單版透視表上面以部門為索引,下面有二級(jí)索引,部門小組。

本節(jié)學(xué)習(xí)數(shù)據(jù)透視表

引用激勵(lì)數(shù)據(jù),連接數(shù)據(jù)庫jili表,jili這幾個(gè)太難打了,下文用df代表激勵(lì)數(shù)據(jù)(代碼省略)
之前在excel中用爛了的透視表,終于用python來實(shí)現(xiàn)了,其實(shí)主要是講pivot_table里面的參數(shù)怎么使用,但書中講的不是詳細(xì),還是要自己找一些文檔或者視頻輔助學(xué)習(xí)。

pivot_table 官方文檔連接
像其他函數(shù)一樣,官方文檔中的參數(shù)有很多,具體如下:
df.pivot_table(data, values=None, index=None, columns=None, aggfunc="mean", fill_value=None, margins=False, dropna=True, margins_name="All")

寫在前面,如果要對(duì)透視表中的字段進(jìn)行計(jì)數(shù),有時(shí)候用count會(huì)報(bào)錯(cuò),可以用len

實(shí)例運(yùn)用:

1、簡(jiǎn)單版透視表
df.pivot_table(index="dep",aggfunc="sum")
#上面以部門為索引,下面有二級(jí)索引,部門、小組。  不知道是不是叫二級(jí)索引,暫且這么命名吧
df.pivot_table(index=["dep","group"],aggfunc="sum")

2、升級(jí)版透視表:金額分組

對(duì)金額進(jìn)行分組,然后再來透視表(看了就懂了):

#金額分組
amount = pd.cut(df["allbones"],[0,1000,5000,10000,20000,40000])
df.pivot_table(index=["dep",amount],values= "allbones", aggfunc="count")

因?yàn)橹付酥祐alues = "allbones",所以結(jié)果中只包含allbones的計(jì)算結(jié)果,如果不指定values,則會(huì)像上面一樣計(jì)算滿足條件的所有字段的count值。

3、再升級(jí)版:多個(gè)計(jì)算方法

進(jìn)行多個(gè)值的計(jì)算,并指定計(jì)算方法。 如果有需要,還可以增加計(jì)算值。
為了方便查看每個(gè)參數(shù)的內(nèi)容,所以換行了。

df.pivot_table(index =[ "dep",amount],
              values = ["allbones","oldrate"],
              aggfunc = {"allbones":[np.sum,len,np.mean],  #一個(gè)字段進(jìn)行3中運(yùn)算
                         "oldrate":np.sum})

4、在透視表最后加一個(gè)匯總
df.pivot_table(index =[ "dep",amount],
              values = ["allbones","oldrate"],
              aggfunc = [np.sum,np.mean,len],
              margins = True)    #margins默認(rèn)為false,改成True后在表的最后顯示匯總
5、大boss版,在每個(gè)部門下面進(jìn)行分類匯總:不會(huì)

還沒找到方法

文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/44999.html

相關(guān)文章

  • 數(shù)據(jù)科學(xué) 3 : 9 累計(jì)與分組 groupby

    摘要:聚合后沒有用函數(shù),會(huì)返回一個(gè)用函數(shù)后會(huì)顯示計(jì)算結(jié)果組合之后,切片,查看的和??梢栽O(shè)定計(jì)算方法對(duì)列進(jìn)行了切片,如果的均值小于,則不顯示二部的均值低于,所以結(jié)果中沒有二部數(shù)據(jù)。 本節(jié)學(xué)習(xí)groupby 引用激勵(lì)數(shù)據(jù),連接數(shù)據(jù)庫jili表(代碼省略)數(shù)字簡(jiǎn)單計(jì)算本節(jié)內(nèi)容前面是運(yùn)用sum/mean等函數(shù)對(duì)數(shù)字簡(jiǎn)單計(jì)算 jili.mean() #求均值 jili.mean(axis = col...

    wemallshop 評(píng)論0 收藏0
  • 數(shù)據(jù)科學(xué) 3 12 處理時(shí)間序列,小時(shí)、分

    摘要:時(shí)間序列,日期格式處理原以為本章是講怎么用處理時(shí)間格式,比如提取年月之類的。新增一列日期,不要時(shí)分新增兩列年,月,以便后續(xù)分析。這個(gè)方法太復(fù)雜,而且處理時(shí)間可能會(huì)更長,看下面的簡(jiǎn)單方法新增月份年。 時(shí)間序列,日期格式處理 原以為本章是講怎么用python處理時(shí)間格式,比如提取年月之類的。 但本節(jié)寫的是時(shí)間格式已經(jīng)工整后的事,暫時(shí)不是我想學(xué)的,所以跳過,就沒有寫公式了。 下面的函數(shù)時(shí)之前...

    Atom 評(píng)論0 收藏0
  • 數(shù)據(jù)科學(xué) 3 : 7-8 合并、連接數(shù)據(jù)

    摘要:第章合并連接數(shù)據(jù)集包含三個(gè)函數(shù)省略,在頁。沒有對(duì)默認(rèn)合并兩個(gè)表的所有列,如果有列,有列,則結(jié)果為列多對(duì)保留多條記錄多對(duì)多會(huì)交叉每一條記錄通過參數(shù)設(shè)定連接方式兩個(gè)表都有兩個(gè)字段,則通過連接兩個(gè)表。 第3章 7-8:合并、連接數(shù)據(jù)集 包含三個(gè)函數(shù):numpy:concatenate 省略,在126頁。pandas:concat/ append(略過) /merge 主要是講merge函數(shù)...

    IntMain 評(píng)論0 收藏0
  • 數(shù)據(jù)科學(xué) 5 主成分分析(降維)、相關(guān)性

    摘要:主成分分析就是降維,通過線性組合,把多個(gè)原始變量合并成若干個(gè)主成分,這樣每個(gè)主成分都變成原始變量的線性組合。相關(guān)系數(shù)系數(shù)為為為。從結(jié)果看,這個(gè)數(shù)據(jù)可能不太適合用來分析,因?yàn)榻档骄S后的代筆性不足。 這兩天用學(xué)了主成分分析,用的是PCA。主成分分析就是降維,通過線性組合,把多個(gè)原始變量合并成若干個(gè)主成分,這樣每個(gè)主成分都變成原始變量的線性組合。所以你想看具體哪個(gè)特征對(duì)結(jié)果的影響大,通過PC...

    ixlei 評(píng)論0 收藏0
  • 數(shù)據(jù)科學(xué)系統(tǒng)學(xué)習(xí)】Python # 數(shù)據(jù)分析基本操作[四] 數(shù)據(jù)規(guī)整化和數(shù)據(jù)聚合與分組運(yùn)算

    摘要:數(shù)據(jù)規(guī)整化清理轉(zhuǎn)換合并重塑數(shù)據(jù)聚合與分組運(yùn)算數(shù)據(jù)規(guī)整化清理轉(zhuǎn)換合并重塑合并數(shù)據(jù)集可根據(jù)一個(gè)或多個(gè)鍵將不同中的行鏈接起來。函數(shù)根據(jù)樣本分位數(shù)對(duì)數(shù)據(jù)進(jìn)行面元?jiǎng)澐?。字典或,給出待分組軸上的值與分組名之間的對(duì)應(yīng)關(guān)系。 本篇內(nèi)容為整理《利用Python進(jìn)行數(shù)據(jù)分析》,博主使用代碼為 Python3,部分內(nèi)容和書本有出入。 在前幾篇中我們介紹了 NumPy、pandas、matplotlib 三個(gè)...

    The question 評(píng)論0 收藏0

發(fā)表評(píng)論

0條評(píng)論

lily_wang

|高級(jí)講師

TA的文章

閱讀更多
最新活動(dòng)
閱讀需要支付1元查看
<