Python如何讀取千萬(wàn)級(jí)數(shù)據(jù)并自動(dòng)寫(xiě)入MySQL數(shù)據(jù)庫(kù)

89542767 發(fā)布于2022-12-27 11:20 / 809人閱讀

　　小編寫(xiě)這篇文章的一個(gè)主要目的，主要是去給大家去做一些相關(guān)的一些介紹，涉及到內(nèi)容的還是比較多的，比如如何去進(jìn)行讀取千萬(wàn)級(jí)的一些數(shù)據(jù)，并且將這些數(shù)據(jù)去自動(dòng)錄入到系統(tǒng)里面。錄入到系統(tǒng)里面之后，怎么才能夠?qū)氲組ySQL數(shù)據(jù)庫(kù)呢？下面就給大家詳細(xì)解答下。

　　序言

　　Python數(shù)據(jù)如何去進(jìn)行讀取MySQL數(shù)據(jù)庫(kù)呢？這類(lèi)工作在生活當(dāng)中是比較的普遍的，涉及到的內(nèi)容也是相關(guān)的一些python數(shù)據(jù)庫(kù)，包括數(shù)據(jù)的聽(tīng)說(shuō)讀寫(xiě)等一些相關(guān)的數(shù)據(jù)工作。數(shù)據(jù)庫(kù)的內(nèi)容主要是涉及到mongodb、es，具體的一些相關(guān)內(nèi)容，下面就給大家詳細(xì)解答下。

　　場(chǎng)景一：數(shù)據(jù)不需要頻繁的寫(xiě)入mysql

　　使用navicat工具的導(dǎo)入向?qū)Чδ?。支持多種文件格式，可以根據(jù)文件的字段自動(dòng)建表，也可以在已有表中插入數(shù)據(jù)，非?？旖莘奖?。

　　場(chǎng)景二：數(shù)據(jù)是增量的，需要自動(dòng)化并頻繁寫(xiě)入mysql

　　測(cè)試數(shù)據(jù)：csv格式，大約1200萬(wàn)行

　　import pandas as pd
　　data=pd.read_csv('./tianchi_mobile_recommend_train_user.csv')
　　data.shape

　　打印結(jié)果：

　　方式一：python?pymysql庫(kù)

　　安裝pymysql命令：

　pip install pymysql

　　代碼實(shí)現(xiàn):

　　import pymysql
　　#數(shù)據(jù)庫(kù)連接信息
　　conn=pymysql.connect(
　　host='127.0.0.1',
　　user='root',
　　passwd='wangyuqing',
　　db='test01',
　　port=3306,
　　charset="utf8")
　　#分塊處理
　　big_size=100000
　　#分塊遍歷寫(xiě)入到mysql
　　with pd.read_csv('./tianchi_mobile_recommend_train_user.csv',chunksize=big_size)as reader:
　　for df in reader:
　　datas=[]
　　print('處理：',len(df))
　　#print(df)
　　for i,j in df.iterrows():
　　data=(j['user_id'],j['item_id'],j['behavior_type'],
　　j['item_category'],j['time'])
　　datas.append(data)
　　_values=",".join(['%s',]*5)
　　sql="""insert into users(user_id,item_id,behavior_type
　　,item_category,time)values(%s)"""%_values
　　cursor=conn.cursor()
　　cursor.executemany(sql,datas)
　　conn.commit()
　　#關(guān)閉服務(wù)
　　conn.close()
　　cursor.close()
　　print('存入成功！')

方式二：pandas?sqlalchemy：pandas需要引入sqlalchemy來(lái)支持sql，在sqlalchemy的支持下，它可以實(shí)現(xiàn)所有常見(jiàn)數(shù)據(jù)庫(kù)類(lèi)型的查詢(xún)、更新等操作。

　　代碼實(shí)現(xiàn)：

　　from sqlalchemy import create_engine
　　engine=create_engine('mysql+pymysql://root:wangyuqing localhost:3306/test01')
　　data=pd.read_csv('./tianchi_mobile_recommend_train_user.csv')
　　data.to_sql('user02',engine,chunksize=100000,index=None)
　　print('存入成功！')

　　總結(jié)

　　pymysql方法用時(shí)12分47秒，耗時(shí)還是比較長(zhǎng)的，代碼量大，而pandas僅需五行代碼就實(shí)現(xiàn)了這個(gè)需求，只用了4分鐘左右。最后補(bǔ)充下，方式一需要提前建表，方式二則不需要。所以推薦大家使用第二種方式，既方便又效率高。如果還覺(jué)得速度慢的小伙伴，可以考慮加入多進(jìn)程、多線(xiàn)程。

　　最全的三種將數(shù)據(jù)存入到MySQL數(shù)據(jù)庫(kù)方法：

　　直接存，利用navicat的導(dǎo)入向?qū)Чδ?/p>

　　Python pymysql

　　Pandas sqlalchemy

　　綜上所述，這篇文章就給大家介紹完畢了，希望可以給大家?guī)?lái)幫助。

云服務(wù)器 GPU云服務(wù)器 mysql千萬(wàn)級(jí)數(shù)據(jù) 千萬(wàn)級(jí) 千萬(wàn)級(jí)阿里云服務(wù)器價(jià)格 js讀取json數(shù)據(jù)并遍歷

文章版權(quán)歸作者所有，未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址：http://systransis.cn/yun/128824.html

發(fā)表評(píng)論

登陸后可評(píng)論

0條評(píng)論

89542767

男|高級(jí)講師

我要關(guān)注我要私信

TA的文章

pythontime控制模塊時(shí)間格式與結(jié)構(gòu)型時(shí)長(zhǎng)詳細(xì)說(shuō)明

閱讀 928·2023-01-14 11:38
OpenMV與JSON編碼問(wèn)題分析

閱讀 902·2023-01-14 11:04
python中的特性管理模式詳細(xì)說(shuō)明

閱讀 759·2023-01-14 10:48
Python運(yùn)用fastapi完成上傳圖片

閱讀 2065·2023-01-14 10:34
pythonopencv圖象高通濾波和低通濾波器的范例編碼

閱讀 968·2023-01-14 10:24
Python根據(jù)ssh遠(yuǎn)程桌面連接Mysql數(shù)據(jù)庫(kù)操作

閱讀 844·2023-01-14 10:18
本文輕輕松松掌握Python中類(lèi)的繼承

閱讀 512·2023-01-14 10:09
python中wordcloud組裝方式總結(jié)

閱讀 591·2023-01-14 10:02

成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專(zhuān)欄INFORMATION COLUMN

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來(lái)選購(gòu)！

Python如何讀取千萬(wàn)級(jí)數(shù)據(jù)并自動(dòng)寫(xiě)入MySQL數(shù)據(jù)庫(kù)

相關(guān)文章

**UPYUN Open Talk ：同盾，從零打造千萬(wàn)級(jí)實(shí)時(shí)風(fēng)控云服務(wù)**

三款新功能發(fā)布，助力阿里云表格存儲(chǔ)再次升級(jí)

**從0到千萬(wàn)級(jí)并發(fā)服務(wù)架構(gòu)演化**

發(fā)表評(píng)論

0條評(píng)論

89542767

男|高級(jí)講師

TA的文章

pythontime控制模塊時(shí)間格式與結(jié)構(gòu)型時(shí)長(zhǎng)詳細(xì)說(shuō)明

OpenMV與JSON編碼問(wèn)題分析

python中的特性管理模式詳細(xì)說(shuō)明

Python運(yùn)用fastapi完成上傳圖片

pythonopencv圖象高通濾波和低通濾波器的范例編碼

Python根據(jù)ssh遠(yuǎn)程桌面連接Mysql數(shù)據(jù)庫(kù)操作

本文輕輕松松掌握Python中類(lèi)的繼承

python中wordcloud組裝方式總結(jié)

最新活動(dòng)

資訊專(zhuān)欄INFORMATION COLUMN

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來(lái)選購(gòu)！

Python如何讀取千萬(wàn)級(jí)數(shù)據(jù)并自動(dòng)寫(xiě)入MySQL數(shù)據(jù)庫(kù)

相關(guān)文章

發(fā)表評(píng)論

0條評(píng)論

男|高級(jí)講師

TA的文章

最新活動(dòng)

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來(lái)選購(gòu)！