摘要:以列表的形式顯示數(shù)據(jù)表的列名。返回索引值為行列的數(shù)據(jù)。將一列按照降序排列,且得到的數(shù)據(jù)替換原數(shù)據(jù)。返回為,也就是缺失的數(shù)據(jù),這時再調(diào)用函數(shù)即可求得缺失數(shù)據(jù)的個數(shù)。這是在中的自定義函數(shù)的使用方法,括號中傳入函數(shù)名。
pandas是python中的 一個數(shù)據(jù)處理庫,同樣在使用的時候我們要先輸入import pandas as pd引入。
1.df = pd.read_csv("文件路徑"):這是讀取csv文件的方法,如果要讀取excel或其他文檔,都有相應(yīng)的read函數(shù)。
2.df.dtypes:如果在文件中有字符型數(shù)據(jù)返回的是object。
3.df.head(n):將前n行數(shù)據(jù)顯示出來,如果不傳入?yún)?shù)則顯示前5行數(shù)據(jù)。
4.df.tail(n):將后n行數(shù)據(jù)顯示出來,如果不傳入?yún)?shù)則顯示后5行數(shù)據(jù)。
5.df.columns:以列表的形式顯示數(shù)據(jù)表的列名。
6.df.shape:以元組的形式顯示表中數(shù)據(jù)的行數(shù)和列數(shù)。
7.df.loc[n]:返回索引值為n的行。
8.df.loc[m][n]:返回索引值為m行n列的數(shù)據(jù)。
9.df.loc[m:n]:返回索引值為m到n的行。
10.df.loc[[m,n,k]]:返回索引值分別為m,n,k的行。
11.df["str"]:返回列名為str的這一列。
12.df.columns.tolist():將列名做成列表。
13.df["str"]*df["str"]:兩列維度相同,則兩列的對應(yīng)位置相乘。
14.df.sort_values("str",inplace=True,ascending=False):將str一列按照降序排列,且得到的數(shù)據(jù)替換原數(shù)據(jù)。inplace表示是否用排序后的數(shù)據(jù)替代原數(shù)據(jù),默認為False,也就是不替換。ascending表示排序的順序,默認為True,也就是按照升序排列。
15.judge = pd.isnull(df["str"]):返回bool型值,str這一列的數(shù)據(jù)是空值返回True,不是空值返回False。
16.a["judge"]:返回judge為True,也就是缺失的數(shù)據(jù),這時再調(diào)用len()函數(shù)即可求得缺失數(shù)據(jù)的個數(shù)。
17.df.pivot_table(index="a",values="b",aggfunc=np.mean):這是一個很重要的函數(shù),將b求平均值,按照a的類別進行分類,第三個參數(shù)默認為求平均值。
18.df.loc[n,"str"]:定位到第n行,列名為str處的數(shù)據(jù)。
19.sort_res.reset_index(drop=True):將排序后的數(shù)據(jù)的編號也重新排列,drop指是否丟棄原數(shù)據(jù)。運行后的結(jié)果與14的圖對比可以發(fā)現(xiàn),編號已經(jīng)重新排列了。
20.df.apply():這是在pandas中的自定義函數(shù)的使用方法,括號中傳入函數(shù)名。
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/43028.html
摘要:在使用之前,大多數(shù)數(shù)據(jù)分析師已經(jīng)掌握了和,并且在剛上手時會經(jīng)常習(xí)慣性想到老辦法。這種根據(jù)列值選取行數(shù)據(jù)的查詢操作,推薦使用方法。如果我又有一批數(shù)據(jù),需要將兩部分數(shù)據(jù)合并。 大毛 豈安科技業(yè)務(wù)風(fēng)險分析師 多年訂單業(yè)務(wù)反欺詐經(jīng)驗,負責豈安科技多款產(chǎn)品運營工作。 在使用Pandas之前,大多數(shù)數(shù)據(jù)分析師已經(jīng)掌握了Excel和SQL,并且在剛上手Pandas時會經(jīng)常習(xí)慣性想到老辦法。如果誰能把...
摘要:在這個教程中,我們將利用的和包來進行數(shù)據(jù)清洗。在很多情況下,使用唯一的值作為索引值識別數(shù)據(jù)字段是非常有幫助的。清洗數(shù)據(jù)字段到現(xiàn)在為止,我們移除了不必要的列并改變了我們的索引變得更有意義。 作者:xiaoyu微信公眾號:Python數(shù)據(jù)科學(xué)知乎:Python數(shù)據(jù)分析師 數(shù)據(jù)科學(xué)家花了大量的時間清洗數(shù)據(jù)集,并將這些數(shù)據(jù)轉(zhuǎn)換為他們可以處理的格式。事實上,很多數(shù)據(jù)科學(xué)家聲稱開始獲取和清洗數(shù)據(jù)...
摘要:在這里我分享下我個人入門機器學(xué)習(xí)的經(jīng)歷,希望能對大家能有所幫助。相關(guān)學(xué)習(xí)鏈接,,入門后的體驗在入門了機器學(xué)習(xí)之后,在實際工作中,絕大多數(shù)的情況下你并不需要去創(chuàng)造一個新的算法。 機器學(xué)習(xí)在很多眼里就是香餑餑,因為機器學(xué)習(xí)相關(guān)的崗位在當前市場待遇不錯,但同時機器學(xué)習(xí)在很多人面前又是一座大山,因為發(fā)現(xiàn)它太難學(xué)了。在這里我分享下我個人入門機器學(xué)習(xí)的經(jīng)歷,希望能對大家能有所幫助。 PS:這篇文章...
閱讀 3387·2021-11-11 16:54
閱讀 3554·2021-10-11 10:58
閱讀 1296·2021-08-30 09:41
閱讀 1827·2019-08-30 15:54
閱讀 2059·2019-08-30 14:00
閱讀 2728·2019-08-29 17:13
閱讀 1698·2019-08-29 15:19
閱讀 648·2019-08-29 15:14