成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

數(shù)據(jù)科學 第 3 章: 9 累計與分組 groupby

wemallshop / 1729人閱讀

摘要:聚合后沒有用函數(shù),會返回一個用函數(shù)后會顯示計算結果組合之后,切片,查看的和。可以設定計算方法對列進行了切片,如果的均值小于,則不顯示二部的均值低于,所以結果中沒有二部數(shù)據(jù)。

本節(jié)學習groupby

引用激勵數(shù)據(jù),連接數(shù)據(jù)庫jili表(代碼省略)
數(shù)字簡單計算
本節(jié)內容前面是運用sum/mean等函數(shù)對數(shù)字簡單計算

jili.mean() #求均值
jili.mean(axis = "columns") #求每行的均值
jili.sum()  #求和
groupby:切片計算

groupby的過程:
分割:把dataframe按指定的鍵分為若干組
應用:對每個組應用函數(shù),通常為累計、轉換或過濾
組合:將每組1的結果合并成一個輸出數(shù)組。

jili.groupby("dep")  #聚合后沒有用函數(shù),會返回一個dataframe
jili.groupby("dep").sum()   #用函數(shù)后會顯示計算結果

# 組合dep 之后,切片oldrate,查看group的和。這里是字符,所以顯示了group的所有值
jili.groupby("dep")["group"].sum()

#組合dep 之后,切片oldrate,查看oldrate的和
jili.groupby("dep")["oldrate"].sum()

# 對每個可以計算的字段進行了描述性統(tǒng)計,中間有省略
# unstack是上一節(jié)索引中的內容,是把多重索引轉換為行,具體可以看下面沒有用unstack的對比。
jili.groupby("dep").describe().unstack()

#對groupby之后的結果,切片allbones字段,進行描述性統(tǒng)計
jili.groupby("dep")["allbones"].describe()

groupby:4 種計算方法 1、aggregate:在groupby之后聚合的值上計算

計算方法。如 sum,count,max,std

2、filter:在原來的每個值上做計算,但是在groupby之后做計算

切片 注意filter切片器中一定要有計算方法(summean之類的),否則會報錯。

# aggregate可以設定計算方法
jili.groupby("dep").aggregate(["min","max"])

# filter對allbones列進行了切片,如果dep的allbones均值小于9000,則不顯示. 
# 二部的均值低于9000,所以結果中沒有二部數(shù)據(jù)。
jili.groupby("dep").filter(lambda x:x["allbones"].mean() >9000)

3、transform:在原來的每個值上做計算,但是在groupby之后做計算

轉換,把原來的值換為計算后的值

jili.groupby("dep").transform(lambda x:x -x.mean()).head(3)  
# x -x.mean()是減取本列的均值

def fun(x):
    x["allbones"] = x["newbones"]-x["oldbones"]
    return x
jili.groupby("dep").apply(fun)
4、apply:

把計算的結果運用到原數(shù)據(jù)(看下圖)

5、高級用法
#組合為兩層
jili.groupby(["dep","group"]).mean()

#組合為兩層后,只選allbones的值,然后再轉換行列
jili.groupby(["dep","group"])["allbones"].sum().unstack()

以上就是groupby的用法,之前跟著視頻學過,但看書的話更詳細,下節(jié)是透視表,拜拜。

文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉載請注明本文地址:http://systransis.cn/yun/45000.html

相關文章

  • 數(shù)據(jù)科學 4 1-3 畫圖的簡單設置

    摘要:保存打開執(zhí)行打開的時候要先加載一個包第二節(jié)畫個圖的方法風格面向對象畫圖第節(jié)簡易線型圖先設置。是一個可以裝圖形文字的容器是帶有刻度和標簽的矩形。 第 4 章是講用matplotlib畫圖 期待已久的內容,用可視化展示數(shù)據(jù)比丟一張數(shù)據(jù)表給他好的多,在建模的時候先畫個圖會清晰不少,下面進入正題: 數(shù)據(jù)源:當然是上一章最后一節(jié)的提取了小時的sougou數(shù)據(jù) 第一節(jié):保存就是教你怎么保存畫的圖,...

    ShevaKuilin 評論0 收藏0
  • 數(shù)據(jù)科學系統(tǒng)學習】Python # 數(shù)據(jù)分析基本操作[四] 數(shù)據(jù)規(guī)整化和數(shù)據(jù)聚合分組運算

    摘要:數(shù)據(jù)規(guī)整化清理轉換合并重塑數(shù)據(jù)聚合與分組運算數(shù)據(jù)規(guī)整化清理轉換合并重塑合并數(shù)據(jù)集可根據(jù)一個或多個鍵將不同中的行鏈接起來。函數(shù)根據(jù)樣本分位數(shù)對數(shù)據(jù)進行面元劃分。字典或,給出待分組軸上的值與分組名之間的對應關系。 本篇內容為整理《利用Python進行數(shù)據(jù)分析》,博主使用代碼為 Python3,部分內容和書本有出入。 在前幾篇中我們介紹了 NumPy、pandas、matplotlib 三個...

    The question 評論0 收藏0
  • 利用Pandas和matplotlib分析我愛我家房租區(qū)間頻率

    摘要:前幾天利用爬取了我愛我家的租房的一些數(shù)據(jù),就想著能不能對房租進行一波分析,于是通過書籍和博客等查閱了相關資料,進行了房租的區(qū)間分析。 前幾天利用python爬取了我愛我家的租房的一些數(shù)據(jù),就想著能不能對房租進行一波分析,于是通過書籍和博客等查閱了相關資料,進行了房租的區(qū)間分析。不得不說,用python做區(qū)間分析比我之前用sql關鍵字統(tǒng)計區(qū)間簡單多了,話不多說,上代碼 # coding=...

    huayeluoliuhen 評論0 收藏0
  • 【譯】技能測試解決方案:Python中的數(shù)據(jù)科學(三)

    摘要:在關聯(lián)該數(shù)據(jù)集時,重復行會帶來一定的困擾,為了避免這個困擾,我們只保留重復數(shù)據(jù)第一個出現(xiàn)的樣本。 本文是譯文,可以轉載,但需注明出處,點擊這里可以獲取原文,有刪減。本系列博文包含四篇文章:【譯】技能測試解決方案:Python中的數(shù)據(jù)科學(一)——Q1-Q15【譯】技能測試解決方案:Python中的數(shù)據(jù)科學(二)——Q16-Q30 【譯】技能測試解決方案:Python中的數(shù)據(jù)科學(三)...

    i_garfileo 評論0 收藏0
  • JavaScript 實現(xiàn)數(shù)組更多的高階函數(shù)

    摘要:實現(xiàn)數(shù)組更多的高階函數(shù)吾輩的博客原文場景雖說人人平等,但有些人更加平等。若是有一篇適合萌新閱讀的自己實現(xiàn)數(shù)組更多操作的文章,情況或許會發(fā)生一些變化。類似于的初始值,但它是一個函數(shù),避免初始值在所有分組中進行累加。 JavaScript 實現(xiàn)數(shù)組更多的高階函數(shù) 吾輩的博客原文: https://blog.rxliuli.com/p/fc... 場景 雖說人人平等,但有些人更加平等。 為...

    aervon 評論0 收藏0

發(fā)表評論

0條評論

最新活動
閱讀需要支付1元查看
<