摘要:聚合后沒有用函數(shù),會返回一個用函數(shù)后會顯示計算結果組合之后,切片,查看的和。可以設定計算方法對列進行了切片,如果的均值小于,則不顯示二部的均值低于,所以結果中沒有二部數(shù)據(jù)。
本節(jié)學習groupby
引用激勵數(shù)據(jù),連接數(shù)據(jù)庫jili表(代碼省略)
數(shù)字簡單計算
本節(jié)內容前面是運用sum/mean等函數(shù)對數(shù)字簡單計算
jili.mean() #求均值 jili.mean(axis = "columns") #求每行的均值 jili.sum() #求和groupby:切片計算
groupby的過程:
分割:把dataframe按指定的鍵分為若干組
應用:對每個組應用函數(shù),通常為累計、轉換或過濾
組合:將每組1的結果合并成一個輸出數(shù)組。
jili.groupby("dep") #聚合后沒有用函數(shù),會返回一個dataframe jili.groupby("dep").sum() #用函數(shù)后會顯示計算結果
# 組合dep 之后,切片oldrate,查看group的和。這里是字符,所以顯示了group的所有值 jili.groupby("dep")["group"].sum() #組合dep 之后,切片oldrate,查看oldrate的和 jili.groupby("dep")["oldrate"].sum()
# 對每個可以計算的字段進行了描述性統(tǒng)計,中間有省略 # unstack是上一節(jié)索引中的內容,是把多重索引轉換為行,具體可以看下面沒有用unstack的對比。 jili.groupby("dep").describe().unstack() #對groupby之后的結果,切片allbones字段,進行描述性統(tǒng)計 jili.groupby("dep")["allbones"].describe()groupby:4 種計算方法 1、aggregate:在groupby之后聚合的值上計算
計算方法。如 sum,count,max,std
2、filter:在原來的每個值上做計算,但是在groupby之后做計算切片 注意filter切片器中一定要有計算方法(summean之類的),否則會報錯。
# aggregate可以設定計算方法 jili.groupby("dep").aggregate(["min","max"]) # filter對allbones列進行了切片,如果dep的allbones均值小于9000,則不顯示. # 二部的均值低于9000,所以結果中沒有二部數(shù)據(jù)。 jili.groupby("dep").filter(lambda x:x["allbones"].mean() >9000)3、transform:在原來的每個值上做計算,但是在groupby之后做計算
轉換,把原來的值換為計算后的值
jili.groupby("dep").transform(lambda x:x -x.mean()).head(3) # x -x.mean()是減取本列的均值 def fun(x): x["allbones"] = x["newbones"]-x["oldbones"] return x jili.groupby("dep").apply(fun)4、apply:
把計算的結果運用到原數(shù)據(jù)(看下圖)
#組合為兩層 jili.groupby(["dep","group"]).mean() #組合為兩層后,只選allbones的值,然后再轉換行列 jili.groupby(["dep","group"])["allbones"].sum().unstack()
以上就是groupby的用法,之前跟著視頻學過,但看書的話更詳細,下節(jié)是透視表,拜拜。
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉載請注明本文地址:http://systransis.cn/yun/45000.html
摘要:保存打開執(zhí)行打開的時候要先加載一個包第二節(jié)畫個圖的方法風格面向對象畫圖第節(jié)簡易線型圖先設置。是一個可以裝圖形文字的容器是帶有刻度和標簽的矩形。 第 4 章是講用matplotlib畫圖 期待已久的內容,用可視化展示數(shù)據(jù)比丟一張數(shù)據(jù)表給他好的多,在建模的時候先畫個圖會清晰不少,下面進入正題: 數(shù)據(jù)源:當然是上一章最后一節(jié)的提取了小時的sougou數(shù)據(jù) 第一節(jié):保存就是教你怎么保存畫的圖,...
摘要:數(shù)據(jù)規(guī)整化清理轉換合并重塑數(shù)據(jù)聚合與分組運算數(shù)據(jù)規(guī)整化清理轉換合并重塑合并數(shù)據(jù)集可根據(jù)一個或多個鍵將不同中的行鏈接起來。函數(shù)根據(jù)樣本分位數(shù)對數(shù)據(jù)進行面元劃分。字典或,給出待分組軸上的值與分組名之間的對應關系。 本篇內容為整理《利用Python進行數(shù)據(jù)分析》,博主使用代碼為 Python3,部分內容和書本有出入。 在前幾篇中我們介紹了 NumPy、pandas、matplotlib 三個...
摘要:前幾天利用爬取了我愛我家的租房的一些數(shù)據(jù),就想著能不能對房租進行一波分析,于是通過書籍和博客等查閱了相關資料,進行了房租的區(qū)間分析。 前幾天利用python爬取了我愛我家的租房的一些數(shù)據(jù),就想著能不能對房租進行一波分析,于是通過書籍和博客等查閱了相關資料,進行了房租的區(qū)間分析。不得不說,用python做區(qū)間分析比我之前用sql關鍵字統(tǒng)計區(qū)間簡單多了,話不多說,上代碼 # coding=...
摘要:在關聯(lián)該數(shù)據(jù)集時,重復行會帶來一定的困擾,為了避免這個困擾,我們只保留重復數(shù)據(jù)第一個出現(xiàn)的樣本。 本文是譯文,可以轉載,但需注明出處,點擊這里可以獲取原文,有刪減。本系列博文包含四篇文章:【譯】技能測試解決方案:Python中的數(shù)據(jù)科學(一)——Q1-Q15【譯】技能測試解決方案:Python中的數(shù)據(jù)科學(二)——Q16-Q30 【譯】技能測試解決方案:Python中的數(shù)據(jù)科學(三)...
摘要:實現(xiàn)數(shù)組更多的高階函數(shù)吾輩的博客原文場景雖說人人平等,但有些人更加平等。若是有一篇適合萌新閱讀的自己實現(xiàn)數(shù)組更多操作的文章,情況或許會發(fā)生一些變化。類似于的初始值,但它是一個函數(shù),避免初始值在所有分組中進行累加。 JavaScript 實現(xiàn)數(shù)組更多的高階函數(shù) 吾輩的博客原文: https://blog.rxliuli.com/p/fc... 場景 雖說人人平等,但有些人更加平等。 為...
閱讀 2985·2021-09-22 15:18
閱讀 3401·2019-08-30 15:54
閱讀 3282·2019-08-30 15:53
閱讀 603·2019-08-30 14:12
閱讀 822·2019-08-29 17:01
閱讀 2209·2019-08-29 14:04
閱讀 1401·2019-08-29 13:09
閱讀 873·2019-08-26 17:40