Python一階矩馬爾可夫過程形成任意DNA序列完成實例

89542767 發(fā)布于2022-12-22 14:15 / 563人閱讀

　　此篇文章關(guān)鍵給大家介紹了Python完成一階矩馬爾可夫過程形成任意DNA序列實例詳細說明，感興趣的小伙伴可以參考借鑒一下，希望可以有一定的幫助，祝愿大家多多的發(fā)展，盡早漲薪。

　　1.基本原理

　　針對DNA序列，一階矩馬爾可夫過程可以看作現(xiàn)階段堿基對的種類僅在于上一位堿基對種類。如下圖1所示，1條編碼序列的開始（由B逐漸）有可能是A、T、G、C4種堿基對（且概率同樣，均是0.25），若編碼序列某還有一位A，則下一個堿基對是A、T、G、C的幾率依次為0.25、0.20、0.20、0.20，下一個無堿基對（即編碼序列完畢，情況為E）的幾率為0.15。

　　圖1 DNA序列的一階馬爾科夫鏈

　　2.代碼實現(xiàn)

　　以下代碼運行于Jupyter Notebook(Python 3.7)；代碼功能是隨機生成一定數(shù)量的DNA序列，統(tǒng)計序列長度并繪制分布圖。若希望顯示隨機生成的序列，將代碼#print(''.join(Seq))前的#刪除即可。

　　import numpy
　　import random
　　import seaborn as sns
　　import matplotlib.pyplot as plt
　　#狀態(tài)空間
　　states=["A","G","C","T","E"]
　　#可能的事件序列
　　transitionName=[["AA","AG","AC","AT","AE"],
　　["GA","GG","GC","GT","GE"],
　　["CA","CG","CC","CT","CE"],
　　["TA","TG","TC","TT","TE"],]
　　#概率矩陣（轉(zhuǎn)移矩陣）
　　transitionMatrix=[[0.25,0.20,0.20,0.20,0.15],
　　[0.20,0.25,0.20,0.20,0.15],
　　[0.20,0.20,0.25,0.20,0.15],
　　[0.20,0.20,0.20,0.25,0.15]]
　　def RandomDNAs(Num):
　　max_len=0
　　i=0
　　Seq=[]#創(chuàng)建列表(Seq)用于添加堿基，以組成DNA序列
　　Len=[]#創(chuàng)建列表(Len)用于記錄每條生成序列的長度
　　while i!=Num:
　　Base=["A","G","C","T"]
　　START=random.choice(Base)#隨機從堿基中選擇一個作為序列的起始堿基
　　Seq.append(START)#將起始堿基添加至Seq中
　　while START!="E":
　　if START=="A":
　　change=numpy.random.choice(transitionName[0],p=transitionMatrix[0])
　　#以transitionMatrix矩陣第一行的概率分布隨機抽取transitionName第一行包含的事件
　　if change=="AA":
　　START="A"#如果轉(zhuǎn)移狀態(tài)是AA(即A堿基接下來的堿基是A，則將起始堿基設(shè)為A)
　　elif change=="AG":
　　START="G"
　　elif change=="AC":
　　START="C"
　　elif change=="AT":
　　START="T"
　　elif change=="AE":
　　START="E"
　　elif START=="G":
　　change=numpy.random.choice(transitionName[1],p=transitionMatrix[1])
　　if change=="GA":
　　START="A"
　　elif change=="GG":
　　START="G"
　　elif change=="GC":
　　START="C"
　　elif change=="GT":
　　START="T"
　　elif change=="GE":
　　START="E"
　　elif START=="C":
　　change=numpy.random.choice(transitionName[2],p=transitionMatrix[2])
　　if change=="CA":
　　START="A"
　　elif change=="CG":
　　START="G"
　　elif change=="CC":
　　START="C"
　　elif change=="CT":
　　START="T"
　　elif change=="CE":
　　START="E"
　　elif START=="T":
　　change=numpy.random.choice(transitionName[3],p=transitionMatrix[3])
　　if change=="TA":
　　START="A"
　　elif change=="TG":
　　START="G"
　　elif change=="TC":
　　START="C"
　　elif change=="TT":
　　START="T"
　　elif change=="TE":
　　START="E"
　　if START!="E":
　　Seq.append(START)#如果狀態(tài)轉(zhuǎn)移后不為End(E)，則將轉(zhuǎn)移后的堿基加到Seq序列中
　　i+=1
　　Len.append(len(Seq))
　　if len(Seq)&gt;max_len:
　　max_len=len(Seq)
　　#print(''.join(Seq))
　　Seq.clear()
　　plt.hist(numpy.array(Len),bins=max_len,edgecolor="white")
　　#顯示橫軸標簽
　　plt.xlabel("DNA Sequence Length")
　　#顯示縱軸標簽
　　plt.ylabel("Frequency")
　　#顯示圖標題
　　plt.title("Histogram of frequency distribution of DNA sequence length")
　　plt.show()
　　print("DNA序列的最大長度為:",max_len)
　　print("DNA序列長度的眾數(shù)為:",max(Len,key=Len.count))
　　%matplotlib notebook#若未使用Jupyter Notebook，此句不需要
　　RandomDNAs(1000)#1000表示隨機生成1000條序列

　　3.運行結(jié)果

　　從以下4個序列長度分布統(tǒng)計可以看到，隨著隨機生成的序列數(shù)量增多，序列長度分布愈發(fā)集中，且長度為1bp的序列占比最多且逐漸增加。

　　圖2 10,000條DNA序列的序列長度分布統(tǒng)計

　　10,000條DNA序列的序列中

　　DNA序列的最大長度為:65

　　DNA序列長度的眾數(shù)為:1

　　圖3 100,000條DNA序列的序列長度分布統(tǒng)計

　　100,000條DNA序列的序列中

　　DNA序列的最大長度為:71

　　DNA序列長度的眾數(shù)為:1

　　綜上所述，這篇文章就給大家介紹到這里了，希望可以給大家?guī)韼椭?/p>

GPU云服務(wù)器云服務(wù)器馬爾可夫決策過程 DNA序列 python 任意鍵 python任意鍵

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://systransis.cn/yun/128699.html

發(fā)表評論

登陸后可評論

0條評論

89542767

男|高級講師

我要關(guān)注我要私信

TA的文章

pythontime控制模塊時間格式與結(jié)構(gòu)型時長詳細說明

閱讀 928·2023-01-14 11:38
OpenMV與JSON編碼問題分析

閱讀 902·2023-01-14 11:04
python中的特性管理模式詳細說明

閱讀 759·2023-01-14 10:48
Python運用fastapi完成上傳圖片

閱讀 2065·2023-01-14 10:34
pythonopencv圖象高通濾波和低通濾波器的范例編碼

閱讀 968·2023-01-14 10:24
Python根據(jù)ssh遠程桌面連接Mysql數(shù)據(jù)庫操作

閱讀 844·2023-01-14 10:18
本文輕輕松松掌握Python中類的繼承

閱讀 512·2023-01-14 10:09
python中wordcloud組裝方式總結(jié)

閱讀 591·2023-01-14 10:02

成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

Python一階矩馬爾可夫過程形成任意DNA序列完成實例

相關(guān)文章

一文讀懂貝葉斯推理問題：MCMC方法和變分推斷

一文概覽深度學(xué)習(xí)中的五大正則化方法和七大優(yōu)化策略

神經(jīng)網(wǎng)絡(luò)

發(fā)表評論

0條評論

89542767

男|高級講師

TA的文章

pythontime控制模塊時間格式與結(jié)構(gòu)型時長詳細說明

OpenMV與JSON編碼問題分析

python中的特性管理模式詳細說明

Python運用fastapi完成上傳圖片

pythonopencv圖象高通濾波和低通濾波器的范例編碼

Python根據(jù)ssh遠程桌面連接Mysql數(shù)據(jù)庫操作

本文輕輕松松掌握Python中類的繼承

python中wordcloud組裝方式總結(jié)

最新活動

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

Python一階矩馬爾可夫過程形成任意DNA序列完成實例

相關(guān)文章

發(fā)表評論

0條評論

男|高級講師

TA的文章

最新活動

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！