pandas其實匯集了python函數(shù)的一個數(shù)據(jù)庫,主要是用來調(diào)用數(shù)據(jù)的,作為其中的聚合函數(shù),那么,其中的函數(shù)agg的具體用法是怎么樣的呢?下面就給大家詳細(xì)的解答下。
今天看到pandas的聚合函數(shù)agg,比較陌生,平時的工作中處理數(shù)據(jù)的時候使用的也比較少,為了加深印象,總結(jié)一下使用的方法,其實還是挺好用的。
DataFrame.agg(func,axis=0,*args,**kwargs)
func:函數(shù),函數(shù)名稱,函數(shù)列表,字典{‘行名/列名’,‘函數(shù)名’}
使用指定軸上的一個或多個操作進(jìn)行聚合。
agg是一個聚合函數(shù),聚合函數(shù)操作始終是在軸(默認(rèn)是列軸,也可設(shè)置行軸)上執(zhí)行,不同于numpy聚合函數(shù)
?。╪p.sum()//求和;np.prod()//所有元素相乘;np.mean()//平均值;np.std()//標(biāo)準(zhǔn)差;np.var()//方差;np.median()//中數(shù);np.power()//冪運算;np.sqrt()//開方;np.min()//最小值;np.max()//最大值;np.argmin()//最小值的下標(biāo);np.argmax()//最大值的下標(biāo);np.inf//無窮大;np.exp(10)//以e為底的指數(shù);np.log(10)//對數(shù))
下面示例展示agg具體用法:
定義一個列表值:
import pandasas pd df=pd.DataFrame([[1,2,3,4], [11,22,33,44], [111,222,333,444], [1111,2222,3333,4444] ], columns=['col1','col2','col3','col4'],)#列名 print(df)
在行上聚合這些函數(shù)
df_arows=df.agg(['max','min','mean']) col1 col2 col3 col4 max 1111.0 2222.0 3333.0 4444.0 min 1.0 2.0 3.0 4.0 mean 308.5 617.0 925.5 1234.0
每列不同的聚合
df_columns=df.agg({'col1':['sum','min'],'col2':['max','min'],'col3':['sum','min']}) col1 col2 col3 max NaN 2222.0 NaN min 1.0 2.0 3.0 sum 1234.0 NaN 3702.0
注:當(dāng)某列沒有其他聚合函數(shù)時,則用NaN填充。
總結(jié)
綜上所述,這篇文章就給大家介紹到這里了,希望可以給各位讀者帶來幫助。
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/128352.html
摘要:最后使用聚合函數(shù),就得到了結(jié)果。從實現(xiàn)上看,返回的是一個結(jié)構(gòu),這個結(jié)構(gòu)必須調(diào)用聚合函數(shù)如之后,才會得到結(jié)構(gòu)為的數(shù)據(jù)結(jié)果。 介紹 每隔一段時間我都會去學(xué)習(xí)、回顧一下python中的新函數(shù)、新操作。這對于你后面的工作是有一定好處的。本文重點介紹了pandas中g(shù)roupby、Grouper和agg函數(shù)的使用。這2個函數(shù)作用類似,都是對數(shù)據(jù)集中的一類屬性進(jìn)行聚合操作,比如統(tǒng)計一個用戶在每個月...
摘要:數(shù)據(jù)規(guī)整化清理轉(zhuǎn)換合并重塑數(shù)據(jù)聚合與分組運算數(shù)據(jù)規(guī)整化清理轉(zhuǎn)換合并重塑合并數(shù)據(jù)集可根據(jù)一個或多個鍵將不同中的行鏈接起來。函數(shù)根據(jù)樣本分位數(shù)對數(shù)據(jù)進(jìn)行面元劃分。字典或,給出待分組軸上的值與分組名之間的對應(yīng)關(guān)系。 本篇內(nèi)容為整理《利用Python進(jìn)行數(shù)據(jù)分析》,博主使用代碼為 Python3,部分內(nèi)容和書本有出入。 在前幾篇中我們介紹了 NumPy、pandas、matplotlib 三個...
摘要:是一個數(shù)據(jù)分析的開源庫。與表格或關(guān)系數(shù)據(jù)庫中的表非常神似。注意帶有一個索引,類似于關(guān)系數(shù)據(jù)庫中的主鍵。的統(tǒng)計函數(shù)分組與聚合通過方法,可以對數(shù)據(jù)組施加一系列的函數(shù)。函數(shù)的作用是串聯(lián),追加數(shù)據(jù)行使用函數(shù)。 pandas(Python data analysis)是一個Python數(shù)據(jù)分析的開源庫。pandas兩種數(shù)據(jù)結(jié)構(gòu):DataFrame和Series 安裝:pandas依賴于NumPy...
摘要:一大熊貓世界來去自如的老生常談,從基礎(chǔ)來看,我們?nèi)匀魂P(guān)心對于與外部數(shù)據(jù)是如何交互的。函數(shù)受限制問題唯一重要的參數(shù),標(biāo)志著一個的第個頁將會被取出。數(shù)據(jù)分析入門之總結(jié)基礎(chǔ)一歡迎來翔的博客查看完成版。 一.大熊貓世界來去自如:Pandas的I/O 老生常談,從基礎(chǔ)來看,我們?nèi)匀魂P(guān)心pandas對于與外部數(shù)據(jù)是如何交互的。 1.1 結(jié)構(gòu)化數(shù)據(jù)輸入輸出 read_csv與to_csv 是?對...
摘要:按照某一列的數(shù)值進(jìn)行排序后輸出。根據(jù)國籍這一列的屬性進(jìn)行分組,然后分別計算相同國籍的潛力的平均值。值得注意的是,在分組函數(shù)后面使用一個函數(shù)可以返回帶有分組大小的結(jié)果。 這篇文章中使用的數(shù)據(jù)集是一個足球球員各項技能及其身價的csv表,包含了60多個字段。數(shù)據(jù)集下載鏈接:數(shù)據(jù)集 1、DataFrame.info() 這個函數(shù)可以輸出讀入表格的一些具體信息。這對于加快數(shù)據(jù)預(yù)處理非常有幫助。 ...
閱讀 923·2023-01-14 11:38
閱讀 895·2023-01-14 11:04
閱讀 756·2023-01-14 10:48
閱讀 2055·2023-01-14 10:34
閱讀 961·2023-01-14 10:24
閱讀 840·2023-01-14 10:18
閱讀 510·2023-01-14 10:09
閱讀 588·2023-01-14 10:02