利用python合并csv文件的方式實(shí)例

89542767 發(fā)布于2022-09-26 21:55 / 1330人閱讀

　　小編寫(xiě)這篇文章的主要目的，主要是給大家做一個(gè)解答，解答有幾個(gè)方向，包括利用python合并csv文件的一些相關(guān)實(shí)例，下面就給大家做出一個(gè)解答。

　　1.用concat方法合并csv

　　將兩個(gè)相同的csv文件進(jìn)行數(shù)據(jù)合并，通過(guò)pandas的read_csv和to_csv來(lái)完成，即采用concat方法：

　#加載第三方庫(kù)
　　importpandasaspd
　　importnumpyasnp
　　#讀取文件
　　df1=pd.read_csv("文件-1.csv")
　　df2=pd.read_csv("文件-2.csv")
　　#合并
　　df=pd.concat([df1,df2])
　　df.drop_duplicates()#數(shù)據(jù)去重
　　#保存合并后的文件
　　df.to_csv('文件.csv',encoding='utf-8')
　　也可以增加一列標(biāo)簽，以區(qū)別兩個(gè)合并后的數(shù)據(jù)：
　　#加載第三方庫(kù)
　　importpandasaspd
　　importnumpyasnp
　　#讀取文件
　　df1=pd.read_csv("文件-1.csv")
　　df1["來(lái)自文件"]="文件-1"
　　df2=pd.read_csv("文件-2.csv")
　　df2["來(lái)自文件"]="文件-2"
　　#合并
　　df=pd.concat([df1,df2])
　　df.drop_duplicates()#數(shù)據(jù)去重
　　#保存合并后的文件
　　df.to_csv('文件.csv',encoding='utf-8')

　　2.glob模塊批量合并csv

　　在運(yùn)用合在一起少許文檔時(shí)，可以用里面的concat方法。如果遇到很多的相同文檔必須合在一起，這個(gè)時(shí)候應(yīng)當(dāng)做好快速?gòu)?fù)制粘貼，這樣可以提高工作效率，提升實(shí)際操作高效率。

　　運(yùn)用Python快速?gòu)?fù)制粘貼csv，這兒講解應(yīng)用的辦法是引進(jìn)glob模塊。

　　glob模塊是最簡(jiǎn)單控制模塊其一，具體內(nèi)容少，它能夠搜索合乎特殊規(guī)矩的文檔路徑名。

　　根據(jù)glob方法賦值所有文件夾，獲取數(shù)據(jù)并增加儲(chǔ)存到文檔中。

　importnumpyasnp
　　importpandasaspd
　　importglob
　　importre
　　csv_list=glob.glob('*.csv')
　　print('共發(fā)現(xiàn)%s個(gè)CSV文件'%len(csv_list))
　　print('正在處理............')
　　foriincsv_list:
　　fr=open(i,'r',encoding='utf-8').read()
　　withopen('文件合集.csv','a',encoding='utf-8')asf:
　　f.write(fr)
　　print('合并完畢！')

　　以上方法是合并csv文件，要合并excel文件同理。

　　補(bǔ)充：Python處理(加載、合并)多個(gè)csv文件

　　數(shù)據(jù)集介紹：本數(shù)據(jù)集是某化工系統(tǒng)的數(shù)據(jù)，一共有很多個(gè)月的，我這里就拿一個(gè)月的數(shù)據(jù)集，August_data（八月的數(shù)據(jù)集)，一共有31個(gè)csv文件。

　　方法一for循環(huán)遍歷+os.listdir(directory_path)+[forfileintqdm]+os.path.join(path,file)

　importpandasaspd
　　importnumpyasnp
　　fromtqdmimporttqdm
　　importos
　　defget_data(path):
　　df_list=[]
　　forfileintqdm(os.listdir(path)):##進(jìn)度條
　　file_path=os.path.join(path,file)
　　df=pd.read_csv(file_path)
　　df_list.append(df)
　　df=pd.concat(df_list)
　　returndf
　　cPath='.\August_data'
　　#cPath='F:/BaiduNetdiskDownload/寧東電廠數(shù)據(jù)及分析要求/寧東脫銷(xiāo)系統(tǒng)優(yōu)化-上海交大/SCR數(shù)據(jù)-2020-1/8月數(shù)據(jù)'#F:/BaiduNetdiskDownload/寧東電廠數(shù)據(jù)及分析要求/寧東脫銷(xiāo)系統(tǒng)優(yōu)化-上海交大/SCR數(shù)據(jù)-2020-1/8月數(shù)據(jù)
　　#uPath=str(cPath)#uPath=unicode(cPath,'utf-8')
　　#dirs=os.listdir(TEST_PATH)
　　#print(dirs)
　　test_df=get_data(cPath)
　　print(test_df.head())
　　#test_df.to_csv(path_or_buf="test.csv",index=False)#保存為CSV文件

　　方法二glob方法

　#!/usr/bin/envpython
　　#coding=utf-8
　　importglob
　　importtime
　　importcsv
　　importpandasaspd
　　fromtqdmimporttqdm
　　#anewfile
　　#openalltheCSVfile
　　#遍歷文件夾下所有csv文件
　　TEST_PATH='.\August_data'
　　csv_list=glob.glob(f'{TEST_PATH}\*.csv')
　　print('共有%s個(gè)CSV文件'%len(csv_list))
　　#print(csv_list)
　　defget_data():
　　df_list=[]
　　forcsv_fileincsv_list:
　　df=pd.read_csv(csv_file)
　　df_list.append(df)
　　df=pd.concat(df_list)
　　print("LoadingOer")
　　returndf
　　get_data()

　　小編就為大家介紹到這里了，希望能給各位讀者帶來(lái)幫助。

文章版權(quán)歸作者所有，未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址：http://systransis.cn/yun/127843.html

發(fā)表評(píng)論

登陸后可評(píng)論

0條評(píng)論

89542767

男|高級(jí)講師

我要關(guān)注我要私信

TA的文章

pythontime控制模塊時(shí)間格式與結(jié)構(gòu)型時(shí)長(zhǎng)詳細(xì)說(shuō)明

閱讀 928·2023-01-14 11:38
OpenMV與JSON編碼問(wèn)題分析

閱讀 902·2023-01-14 11:04
python中的特性管理模式詳細(xì)說(shuō)明

閱讀 759·2023-01-14 10:48
Python運(yùn)用fastapi完成上傳圖片

閱讀 2065·2023-01-14 10:34
pythonopencv圖象高通濾波和低通濾波器的范例編碼

閱讀 968·2023-01-14 10:24
Python根據(jù)ssh遠(yuǎn)程桌面連接Mysql數(shù)據(jù)庫(kù)操作

閱讀 844·2023-01-14 10:18
本文輕輕松松掌握Python中類(lèi)的繼承

閱讀 512·2023-01-14 10:09
python中wordcloud組裝方式總結(jié)

閱讀 591·2023-01-14 10:02

成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專(zhuān)欄INFORMATION COLUMN

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來(lái)選購(gòu)！

利用python合并csv文件的方式實(shí)例

相關(guān)文章

Python3網(wǎng)絡(luò)爬蟲(chóng)實(shí)戰(zhàn)---31、數(shù)據(jù)存儲(chǔ)：文件存儲(chǔ)

**聊聊 Jmeter 如何并發(fā)執(zhí)行 Python 腳本**

另類(lèi)爬蟲(chóng)：從PDF文件中爬取表格數(shù)據(jù)

**針對(duì)Python初學(xué)者，這13個(gè)好用到起飛的小技巧！**

**十三個(gè)好用到起飛的Python技巧！**

發(fā)表評(píng)論

0條評(píng)論

89542767

男|高級(jí)講師

TA的文章

pythontime控制模塊時(shí)間格式與結(jié)構(gòu)型時(shí)長(zhǎng)詳細(xì)說(shuō)明

OpenMV與JSON編碼問(wèn)題分析

python中的特性管理模式詳細(xì)說(shuō)明

Python運(yùn)用fastapi完成上傳圖片

pythonopencv圖象高通濾波和低通濾波器的范例編碼

Python根據(jù)ssh遠(yuǎn)程桌面連接Mysql數(shù)據(jù)庫(kù)操作

本文輕輕松松掌握Python中類(lèi)的繼承

python中wordcloud組裝方式總結(jié)

最新活動(dòng)

資訊專(zhuān)欄INFORMATION COLUMN

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來(lái)選購(gòu)！

利用python合并csv文件的方式實(shí)例

相關(guān)文章

發(fā)表評(píng)論

0條評(píng)論

男|高級(jí)講師

TA的文章

最新活動(dòng)

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來(lái)選購(gòu)！