{eval=Array;=+count(Array);}
這個(gè)非常簡(jiǎn)單,pandas內(nèi)置了大量函數(shù)和類(lèi)型,可以快速處理日常各種文件,下面我以txt,excel,csv,json和mysql這5種類(lèi)型文件為例,簡(jiǎn)單介紹一下pandas是如何快速讀取這些文件的:
這是最常見(jiàn)的一種文本文件格式,讀取的話,直接使用read_table函數(shù)就行,測(cè)試代碼如下,這里必須保證txt文件是格式化的,不然讀取的結(jié)果會(huì)有誤,filename是文件名,header是否包含列標(biāo)題,sep是每行數(shù)據(jù)的分隔符,最終讀取的數(shù)據(jù)類(lèi)型是DataFrame,方便后面程序進(jìn)行處理:
這也是一種比較常見(jiàn)的文件格式,讀取的話,直接使用read_excel函數(shù)就行,測(cè)試代碼如下,非常簡(jiǎn)單,直接傳入文件名就行,最終返回結(jié)果也是DataFrame類(lèi)型:
這也是一種比較常見(jiàn)的文件格式,讀取的話,直接使用read_csv函數(shù)就行,測(cè)試代碼如下,也非常簡(jiǎn)單,filename為文件名,header為是否包含列標(biāo)題,最終返回結(jié)果也是DataFrame類(lèi)型:
這也是一種比較常用的數(shù)據(jù)存儲(chǔ)格式,讀取的話,直接使用read_json函數(shù)就行,測(cè)試代碼如下,filename為文件名,如果出現(xiàn)中文亂碼的話,設(shè)置encoding編碼為uft-8就行,最終結(jié)果也是DataFrame類(lèi)型:
這里首先需要安裝sqlalchemy框架,之后才能借助read_sql_query函數(shù)直接從mysql數(shù)據(jù)庫(kù)讀取數(shù)據(jù),安裝的話,直接輸入命令“pip install sqlalchemy”就行,測(cè)試代碼如下,也非常簡(jiǎn)單,先創(chuàng)建一個(gè)connect連接,然后根據(jù)sql查詢(xún)語(yǔ)句,直接從數(shù)據(jù)庫(kù)中讀取數(shù)據(jù)就行:
至此,我們就完成了利用python的pandas模塊來(lái)讀取txt,excel,csv,json和mysql這5種類(lèi)型文件的數(shù)據(jù)??偟膩?lái)說(shuō),pandas這個(gè)模塊功能非常強(qiáng)大,尤其對(duì)于數(shù)據(jù)處理來(lái)說(shuō),可以說(shuō)是一個(gè)利器,在數(shù)據(jù)分析與處理中經(jīng)常會(huì)用到,只要你熟悉一下相關(guān)文檔和示例,很快就能掌握的,網(wǎng)上也有相關(guān)資料和教程,介紹的非常詳細(xì),感興趣的話,可以搜一下,希望以上分享的內(nèi)容能對(duì)你有所幫助吧,也歡迎大家評(píng)論、留言進(jìn)行補(bǔ)充。
0
回答0
回答0
回答0
回答0
回答0
回答0
回答0
回答0
回答10
回答