成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

量化交易之股票數(shù)據(jù)的獲取——同花順軟件

Chaz / 4618人閱讀

摘要:將另存為格式時,文件將工作表中的單元格所顯示的文本和數(shù)值以逗號分離進行保存。方法此處使用模塊的函數(shù)讀取文件,函數(shù)以字典形式返回,字典的鍵則是這個單元格的標(biāo)題即列頭,每一個單元格內(nèi)容放在字典的值內(nèi)。

前言

數(shù)據(jù)是進行量化交易的基礎(chǔ)和關(guān)鍵,目前國內(nèi)做量化產(chǎn)品的金融機構(gòu)大部分是從券商獲取高頻實時行情數(shù)據(jù)的,另外很多金融網(wǎng)站也提供了數(shù)據(jù)接口,可以調(diào)用接口方式獲取,也可以用爬蟲的方式獲取。文本講述一種更經(jīng)濟便捷的方式來獲取數(shù)據(jù),即通過同花順交易軟件來導(dǎo)出股票數(shù)據(jù),并且將數(shù)據(jù)轉(zhuǎn)換為DataFrame 表格型的數(shù)據(jù)結(jié)構(gòu),以csv的格式存儲,便于后續(xù)進行量化交易分析。


同花順交易數(shù)據(jù)導(dǎo)出

1.打開同花順軟件,點擊“分析”欄,選擇“歷史成交”,此時會出現(xiàn)股票的日線交易數(shù)據(jù)。

2.點擊“右鍵”,選擇“數(shù)據(jù)導(dǎo)出”—>“導(dǎo)出所有數(shù)據(jù)”,選擇導(dǎo)出的類型為Excel,執(zhí)行下一步直到完成,即得到了2004年至今的該股交易數(shù)據(jù)。

3.打開EXCEL文檔已經(jīng)可以查看到導(dǎo)出的數(shù)據(jù)了,不過在量化領(lǐng)域中最常用使用的是CSV格式,這里將EXCEL另存為CSV格式。CSV文件是一種文本文件,用記事本就能打開。文件的數(shù)據(jù)列以半角逗號分隔,每一行數(shù)據(jù)都以回車符結(jié)束。它可以非常容易地被導(dǎo)入各種PC表格及數(shù)據(jù)庫中。將EXCEL另存為CSV格式時,CSV文件將EXCEL工作表中的單元格所顯示的文本和數(shù)值以逗號分離進行保存。



注:如果單元格中包含逗號,則該單元格中的內(nèi)容以雙引號引起。


轉(zhuǎn)換為DataFrame格式

在Python中,pandas是數(shù)據(jù)處理方面功能最為強大的擴展模塊了,包含了高級的數(shù)據(jù)結(jié)構(gòu)Series和DataFrame,使得在Python中處理數(shù)據(jù)變得非常方便、快速和簡單,后續(xù)我們在應(yīng)用中會深有體會。

方法1:通過pandas模塊自帶的read_csv函數(shù)可直接得到DataFrame格式數(shù)據(jù),注意編碼格式為“GB2132”,否則控制臺會將中文解析為亂碼。

 df_csvload = pd.read_csv("C:programPYCSV_RWdata_ForNewFileDataChange.csv",parse_dates=True,index_col=0,encoding="gb2312")

方法2:此處使用CSV模塊的DictReader函數(shù)讀取CSV文件,DictReader函數(shù)以字典形式返回,字典的鍵則是這個單元格的標(biāo)題(即列頭),每一個單元格內(nèi)容放在字典的值內(nèi)。DataFrame的創(chuàng)建方式有numpy二維數(shù)組、列表、Series序列以及字典方式等,此處DictReader函數(shù)返回的字典形式數(shù)據(jù)可直接創(chuàng)建,字典中的keys就是DataFrame里面的columns,但是沒有index的值,默認(rèn)是從零開始計數(shù)。

f=codecs.open("C:programPYCSV_RWdata_ForNewFileDataChange.csv","rb","gb2312")#GB2312編碼
reader = csv.DictReader(f)
rows = [row for row in reader]
df = pd.DataFrame(rows)
f.close()

該方法需要增加額外的處理,將“時間”列作為index索引,同時將日期信息去除星期幾

df.rename(columns={ "時間":"time" },inplace=True)#替換為英文columns         

for index,colstr in enumerate(df["time"]):
    colstr = colstr.split(",",1)#去除日期中的星期幾
    df.loc[index, "time"] = colstr[0]
df.index = df["time"].tolist()#time作為index
del df["time"]#數(shù)據(jù)中刪除time列


數(shù)據(jù)保存

數(shù)據(jù)處理后使用pandas模塊自帶的to_csv可將數(shù)據(jù)直接存儲為CSV。

df.to_csv("C:programPYCSV_RWdata_ForNewFileDataCheck.csv",columns=df.columns,index=True)

更多python量化交易內(nèi)容互動請加微信公眾號:PythonQT-YuanXiao
歡迎訂閱量化交易課程:鏈接地址

文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/41160.html

相關(guān)文章

  • 量化易之股票數(shù)據(jù)獲取——Pandas API接口

    摘要:前言庫提供了專門從財經(jīng)網(wǎng)站獲取金融數(shù)據(jù)的接口,可作為量化交易股票數(shù)據(jù)獲取的另一種途徑,該接口在庫基礎(chǔ)上實現(xiàn)了以客戶端身份訪問網(wǎng)站的股票數(shù)據(jù)。第三四個參數(shù)為股票數(shù)據(jù)的起始時間斷。遍歷每個交易日后將符合跳空缺口條件的交易日增加缺口數(shù)值。 前言 Pandas庫提供了專門從財經(jīng)網(wǎng)站獲取金融數(shù)據(jù)的API接口,可作為量化交易股票數(shù)據(jù)獲取的另一種途徑,該接口在urllib3庫基礎(chǔ)上實現(xiàn)了以客戶端身份...

    yuanxin 評論0 收藏0
  • 基于Java同花股票數(shù)據(jù)爬蟲

    摘要:問題來源今天與同學(xué)聊天,得知他有個任務(wù)是抓取同花順網(wǎng)站上的股票數(shù)據(jù),有點興趣,便做了相關(guān)實驗。由于時間關(guān)系,以上代碼只是把數(shù)據(jù)所在的網(wǎng)頁抓取到本地,沒有進行解析。 問題來源 今天與同學(xué)聊天,得知他有個任務(wù)是抓取同花順網(wǎng)站上的股票數(shù)據(jù),有點興趣,便做了相關(guān)實驗。 介紹 網(wǎng)站地址:http://q.10jqka.com.cn/ 網(wǎng)站界面:showImg(https://segmentf...

    EasonTyler 評論0 收藏0
  • AI Challenger開賽,千萬量級數(shù)據(jù)開放,AI高手將上演巔峰對決

    摘要:月日,各項競賽的排名將決定最終的成績排名。選手通過訓(xùn)練模型,對虛擬股票走勢進行預(yù)測。冠軍將獲得萬元人民幣的獎勵。 showImg(https://segmentfault.com/img/bVUzA7?w=477&h=317); 2017年9月4日,AI challenger全球AI挑戰(zhàn)賽正式開賽,來自世界各地的AI高手,將展開為期三個多月的比拼,獲勝團隊將分享總額超過200萬人民幣的...

    Ali_ 評論0 收藏0
  • Python量化易基礎(chǔ)講堂——管理概率==理性

    摘要:那么我們改變概率這個因子,將它放大到,我們邀請個人參與局看下效果看來結(jié)果還不錯,只要增加盈利的概率,就可以在市場中獲得收益,這就是量化交易的魅力管理概率理性交易。 在《Python實戰(zhàn)-構(gòu)建基于股票的量化交易系統(tǒng)》小冊子中,我們以股票為交易標(biāo)的講解量化交易的學(xué)習(xí),主要原因是股票的風(fēng)險和收益介于期貨和基金之間。期貨一方面加了杠桿,另一方面走勢變化非常迅速,稍有不慎有可能血本無歸,這不太適...

    AWang 評論0 收藏0

發(fā)表評論

0條評論

最新活動
閱讀需要支付1元查看
<