成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

PythonpandasDataFrame基礎(chǔ)運(yùn)算及空值填充詳解

89542767 / 1127人閱讀

  

  小編寫這篇文章的主要目的,是給大家介紹一下關(guān)于python中的一些實(shí)例,比如,其中,會(huì)給大家講到,Python中基礎(chǔ)值的一些運(yùn)算,以及當(dāng)我們遇到空的數(shù)值的時(shí)候,一些處理方法,下面給大家做一個(gè)詳細(xì)的解答。


  前言


  今天我們一起來(lái)聊聊DataFrame中的索引。


  上一篇文章當(dāng)中我們介紹了DataFrame數(shù)據(jù)結(jié)構(gòu)當(dāng)中一些常用的索引的使用方法,比如iloc、loc以及邏輯索引等等。今天的文章我們來(lái)看看DataFrame的一些基本運(yùn)算。


  數(shù)據(jù)對(duì)齊


  我們可以計(jì)算兩個(gè)DataFrame的加和,pandas會(huì)自動(dòng)將這兩個(gè)DataFrame進(jìn)行數(shù)據(jù)對(duì)齊,如果對(duì)不上的數(shù)據(jù)會(huì)被置為Nan(notanumber)。


  首先我們來(lái)創(chuàng)建兩個(gè)DataFrame:


 importnumpyasnp
  importpandasaspd
  df1=pd.DataFrame(np.arange(9).reshape((3,3)),columns=list('abc'),index=['1','2','3'])
  df2=pd.DataFrame(np.arange(12).reshape((4,3)),columns=list('abd'),index=['2','3','4','5'])


  得到的結(jié)果和我們?cè)O(shè)想的一致,其實(shí)只是通過(guò)numpy數(shù)組創(chuàng)建DataFrame,然后指定index和columns而已,這應(yīng)該算是很基礎(chǔ)的用法了。

0.png

  然后我們將兩個(gè)DataFrame相加,會(huì)得到:

1.png

  我們發(fā)現(xiàn)pandas將兩個(gè)DataFrame加起來(lái)合并了之后,凡是沒有在兩個(gè)DataFrame都出現(xiàn)的位置就會(huì)被置為Nan。這其實(shí)是很有道理的,實(shí)際上不只是加法,我們可以計(jì)算兩個(gè)DataFrame的加減乘除的四則運(yùn)算都是可以的。如果是計(jì)算兩個(gè)DataFrame相除的話,那么除了對(duì)應(yīng)不上的數(shù)據(jù)會(huì)被置為Nan之外,除零這個(gè)行為也會(huì)導(dǎo)致異常值的發(fā)生(可能不一定是Nan,而是inf)。


  fill_value


  如果我們要對(duì)兩個(gè)DataFrame進(jìn)行運(yùn)算,那么我們當(dāng)然不會(huì)希望出現(xiàn)空值。這個(gè)時(shí)候就需要對(duì)空值進(jìn)行填充了,我們直接使用運(yùn)算符進(jìn)行運(yùn)算是沒辦法傳遞參數(shù)進(jìn)行填充的,這個(gè)時(shí)候我們需要使用DataFrame當(dāng)中為我們提供的算術(shù)方法。


  DataFrame當(dāng)中常用的運(yùn)算符有這么幾種:

2.png

  add、sub、div這些我們都很好理解,那么這里的radd、rsub方法又是什么意思呢,為什么前面要加上一個(gè)r呢?


  看起來(lái)費(fèi)解,但是說(shuō)白了一文不值,radd是用來(lái)翻轉(zhuǎn)參數(shù)的。舉個(gè)例子,比如說(shuō)我們希望得到DataFrame當(dāng)中所有元素的倒數(shù),我們可以寫成1/df。由于1本身并不是一個(gè)DataFrame,所以我們不能用1來(lái)呼叫DataFrame當(dāng)中的方法,也就不能傳遞參數(shù),為了解決這種情況,我們可以把1/df寫成df.rdiv(1),這樣我們就可以在其中傳遞參數(shù)了。

3.png

  由于在算除法的過(guò)程當(dāng)中發(fā)生了除零,所以我們得到了一個(gè)inf,它表示無(wú)窮大。


  我們可以在add、div這些方法當(dāng)中傳入一個(gè)fill_value的參數(shù),這個(gè)參數(shù)可以在計(jì)算之前對(duì)于一邊出現(xiàn)缺失值的情況進(jìn)行填充。也就是說(shuō)對(duì)于對(duì)于只在一個(gè)DataFrame中缺失的位置會(huì)被替換成我們指定的值,如果在兩個(gè)DataFrame都缺失,那么依然還會(huì)是Nan。

4.png

  我們對(duì)比下結(jié)果就能發(fā)現(xiàn)了,相加之后的(1,d),(4,c)以及(5,c)的位置都是Nan,因?yàn)閐f1和df2兩個(gè)DataFrame當(dāng)中這些位置都是空值,所以沒有被填充。


  fill_value這個(gè)參數(shù)在很多api當(dāng)中都有出現(xiàn),比如reindex等,用法都是一樣的,我們?cè)诓殚哸pi文檔的時(shí)候可以注意一下。


  那么對(duì)于這種填充了之后還出現(xiàn)的空值我們應(yīng)該怎么辦呢?難道只能手動(dòng)找到這些位置進(jìn)行填充嗎?當(dāng)然是不現(xiàn)實(shí)的,pandas當(dāng)中還為我們提供了專門解決空值的api。


  空值api


  在填充空值之前,我們首先要做的是發(fā)現(xiàn)空值。針對(duì)這個(gè)問題,我們有isna這個(gè)api,它會(huì)返回一個(gè)bool型的DataFrame,DataFrame當(dāng)中的每一個(gè)位置表示了原DataFrame對(duì)應(yīng)的位置是否是空值。

5.png

  dropna


  當(dāng)然只是發(fā)現(xiàn)是否是空值肯定是不夠的,我們有時(shí)候會(huì)希望不要空值的出現(xiàn),這個(gè)時(shí)候我們可以選擇drop掉空值。針對(duì)這種情況,我們可以使用DataFrame當(dāng)中的dropna方法。


  我們發(fā)現(xiàn)使用了dropna之后,出現(xiàn)了空值的行都被拋棄了。只保留了沒有空值的行,有時(shí)候我們希望拋棄是的列而不是行,這個(gè)時(shí)候我們可以通過(guò)傳入axis參數(shù)進(jìn)行控制。

6.png

  這樣我們得到的就是不含空值的列,除了可以控制行列之外,我們還可以控制執(zhí)行drop的嚴(yán)格程度。我們可以通過(guò)how這個(gè)參數(shù)來(lái)判斷,how支持兩種值傳入,一種是'all',一種是'any'。all表示只有在某一行或者是某一列全為空值的時(shí)候才會(huì)拋棄,any與之對(duì)應(yīng)就是只要出現(xiàn)了空值就會(huì)拋棄。默認(rèn)不填的話認(rèn)為是any,一般情況下我們也用不到這個(gè)參數(shù),大概有個(gè)印象就可以了。


  fillna


  pandas除了可以drop含有空值的數(shù)據(jù)之外,當(dāng)然也可以用來(lái)填充空值,事實(shí)上這也是最常用的方法。


  我們可以很簡(jiǎn)單地傳入一個(gè)具體的值用來(lái)填充:


  fillna會(huì)返回一個(gè)新的DataFrame,其中所有的Nan值會(huì)被替換成我們指定的值。如果我們不希望它返回一個(gè)新的DataFrame,而是直接在原數(shù)據(jù)進(jìn)行修改的話,我們可以使用inplace參數(shù),表明這是一個(gè)inplace的操作,那么pandas將會(huì)在原DataFrame上進(jìn)行修改。

 

df3.fillna(3,inplace=True)


  除了填充具體的值以外,我們也可以和一些計(jì)算結(jié)合起來(lái)算出來(lái)應(yīng)該填充的值。比如說(shuō)我們可以計(jì)算出某一列的均值、最大值、最小值等各種計(jì)算來(lái)填充。fillna這個(gè)函數(shù)不僅可以使用在DataFrame上,也可以使用在Series上,所以我們可以針對(duì)DataFrame中的某一列或者是某些列進(jìn)行填充:

7.png

  除了可以計(jì)算出均值、最大最小值等各種值來(lái)進(jìn)行填充之外,還可以指定使用缺失值的前一行或者是后一行的值來(lái)填充。實(shí)現(xiàn)這個(gè)功能需要用到method這個(gè)參數(shù),它有兩個(gè)接收值,ffill表示用前一行的值來(lái)進(jìn)行填充,bfill表示使用后一行的值填充。


  我們可以看到,當(dāng)我們使用ffill填充的時(shí)候,對(duì)于第一行的數(shù)據(jù)來(lái)說(shuō)由于它沒有前一行了,所以它的Nan會(huì)被保留。同樣當(dāng)我們使用bfill的時(shí)候,最后一行也無(wú)法填充。

10.png

  總結(jié)


  今天的文章當(dāng)中我們主要介紹了DataFrame的一些基本運(yùn)算,比如最基礎(chǔ)的四則運(yùn)算。在進(jìn)行四則運(yùn)算的時(shí)候由于DataFrame之間可能存在行列索引不能對(duì)齊的情況,這樣計(jì)算得到的結(jié)果會(huì)出現(xiàn)空值,所以我們需要對(duì)空值進(jìn)行處理。我們可以在進(jìn)行計(jì)算的時(shí)候通過(guò)傳入fill_value進(jìn)行填充,也可以在計(jì)算之后對(duì)結(jié)果進(jìn)行fillna填充。


  在實(shí)際的運(yùn)用當(dāng)中,我們一般很少會(huì)直接對(duì)兩個(gè)DataFrame進(jìn)行加減運(yùn)算,但是DataFrame中出現(xiàn)空置是家常便飯的事情。因此對(duì)于空值的填充和處理非常重要,可以說(shuō)是學(xué)習(xí)中的重點(diǎn),大家千萬(wàn)注意。

文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/127849.html

相關(guān)文章

  • C語(yǔ)言基礎(chǔ)之操作符詳解

    摘要:語(yǔ)言基礎(chǔ)之操作符詳解操作符的分類算術(shù)操作符移位操作符位操作符邏輯操作符逗號(hào)表達(dá)式表達(dá)式求值隱式類型轉(zhuǎn)換算術(shù)轉(zhuǎn)換操作符的屬性今天就帶各位大佬來(lái)了解一波語(yǔ)言的操作符。 ...

    snowell 評(píng)論0 收藏0
  • ECMAScript6(6):數(shù)組的擴(kuò)展

    摘要:數(shù)組的擴(kuò)展將類數(shù)組對(duì)象和可遍歷對(duì)象轉(zhuǎn)化為真正的數(shù)組。這兩個(gè)函數(shù)的參數(shù)都是回調(diào)函數(shù)。遍歷數(shù)組找到符合條件回調(diào)函數(shù)返回為的第一個(gè)值返回其值返回其下標(biāo)。這三個(gè)方法用來(lái)遍歷數(shù)組返回一個(gè)遍歷器供使用其中是對(duì)鍵的遍歷是對(duì)值的遍歷是對(duì)鍵值對(duì)的遍歷。 數(shù)組的擴(kuò)展 Array, from() 將類數(shù)組對(duì)象和可遍歷對(duì)象轉(zhuǎn)化為真正的數(shù)組。 var arrayLike = { 0 : a, 1 : b...

    DrizzleX 評(píng)論0 收藏0

發(fā)表評(píng)論

0條評(píng)論

最新活動(dòng)
閱讀需要支付1元查看
<