小編寫這篇文章的目的,主要是給大家來做一個(gè)比較詳細(xì)的解答,解答一下其具體的相關(guān)知識,還有一些相關(guān)的代碼解析,下面就給大家進(jìn)行一個(gè)比較詳細(xì)的解答。
什么是Numpy
NumPy,是Numerical Python的簡稱,用于性能比較高的基礎(chǔ)分析數(shù)據(jù)包,可以對其進(jìn)行用來進(jìn)行數(shù)據(jù)分析,像數(shù)學(xué)科學(xué)工具(pandas)和框架(Scikit-learn)中都使用到了NumPy這個(gè)包。
NumPy中的基本數(shù)據(jù)結(jié)構(gòu)是ndarray或者N維數(shù)值數(shù)組,在形式上來說,它的結(jié)構(gòu)有點(diǎn)像Python的基礎(chǔ)類型——Python列表。
但本質(zhì)上,這兩者并不同,可以看到一個(gè)簡單的對比。
我們創(chuàng)建兩個(gè)列表,當(dāng)我們創(chuàng)建好了之后,可以使用+運(yùn)算符進(jìn)行連接:
list1=[i for i in range(1,11)] list2=[i**2 for i in range(1,11)] print(list1+list2) #[1,2,3,4,5,6,7,8,9,10,1,4,9,16,25,36,49,64,81,100]
列表中元素的處理感覺像對象,不是很數(shù)字,不是嗎?如果這些是數(shù)字向量而不是簡單的數(shù)字列表,您會期望+運(yùn)算符的行為略有不同,并將第一個(gè)列表中的數(shù)字按元素添加到第二個(gè)列表中的相應(yīng)數(shù)字中。
接下來看一下Nympy的數(shù)組版本:
import numpy as np arr1=np.array(list1) arr2=np.array(list2) arr1+arr2 #array([2,6,12,20,30,42,56,72,90,110])
通過numpy的np.array數(shù)組方法實(shí)現(xiàn)了兩個(gè)列表內(nèi)的逐個(gè)值進(jìn)行相加。
我們通過dir函數(shù)來看兩者的區(qū)別,先看Python內(nèi)置列表list1的內(nèi)置方法:
再用同樣的方法看一下arr1中的方法:
NumPy數(shù)組對象還有更多可用的函數(shù)和屬性。特別要注意諸如mean、std和sum之類的方法,因?yàn)樗鼈兦宄乇砻髦攸c(diǎn)關(guān)注使用這種數(shù)組對象的數(shù)值/統(tǒng)計(jì)計(jì)算。而且這些操作也很快。
NumPy數(shù)組和Python內(nèi)置計(jì)算對比
NumPy的速度要快得多,因?yàn)樗氖噶炕瘜?shí)現(xiàn)以及它的許多核心例程最初是用C語言(基于CPython框架)編寫的。NumPy數(shù)組是同構(gòu)類型的密集排列的數(shù)組。相比之下,Python列表是指向?qū)ο蟮闹羔様?shù)組,即使它們都屬于同一類型。因此,我們得到了參考局部性的好處。
許多NumPy操作是用C語言實(shí)現(xiàn)的,避免了Python中的循環(huán)、指針間接和逐元素動態(tài)類型檢查的一般成本。特別是,速度的提升取決于您正在執(zhí)行的操作。對于數(shù)據(jù)科學(xué)和ML任務(wù),這是一個(gè)無價(jià)的優(yōu)勢,因?yàn)樗苊饬碎L和多維數(shù)組中的循環(huán)。
讓我們使用timing計(jì)時(shí)裝飾器來說明這一點(diǎn)。這是一個(gè)圍繞兩個(gè)函數(shù)std_dev和std_dev_python包裝裝飾器的代碼,分別使用NumPy和本機(jī)Python代碼實(shí)現(xiàn)列表/數(shù)組的標(biāo)準(zhǔn)差計(jì)算。
函數(shù)計(jì)算時(shí)間裝飾器
我們可以使用Python裝飾器和functools模塊的wrapping來寫一個(gè)時(shí)間裝飾器timing:
def timing(func): wraps(func) def wrap(*args,**kw): begin_time=time() result=func(*args,**kw) end_time=time() print(f"Function'{func.__name__}'took{end_time-begin_time}seconds to run") return result return wrap
標(biāo)準(zhǔn)差計(jì)算公式
然后利用這個(gè)時(shí)間裝飾器來看Numpy數(shù)組和Python內(nèi)置的列表,然后計(jì)算他們的標(biāo)準(zhǔn)差,
公式如圖:
定義Numpy計(jì)算標(biāo)準(zhǔn)差的函數(shù)std_dev(),numpy模塊中內(nèi)置了標(biāo)準(zhǔn)差公式的函數(shù)a.std(),我們可以直接調(diào)用
列表計(jì)算公式方法需要按照公式一步一步計(jì)算:
先求求出宗和s
然后求出平均值average
計(jì)算每個(gè)數(shù)值與平均值的差的平方,再求和sumsq
再求出sumsq的平均值sumsq_average
得到最終的標(biāo)準(zhǔn)差結(jié)果result
代碼如下:
from functools import wraps from time import time import numpy as np from math import sqrt def timing(func): wraps(func) def wrap(*args,**kw): begin_time=time() result=func(*args,**kw) end_time=time() #print(f"Function'{func.__name__}'with arguments{args},keywords{kw}took{end_time-begin_time}seconds to run") print(f"Function'{func.__name__}'took{end_time-begin_time}seconds to run") return result return wrap timing def std_dev(a): if isinstance(a,list): a=np.array(a) s=a.std() return s timing def std_dev_python(lst): length=len(lst) s=sum(lst) average=s/length sumsq=0 for i in lst: sumsq+=(i-average)**2 sumsq_average=sumsq/length result=sqrt(sumsq_average) return result
運(yùn)行結(jié)果,最終可以看到1000000個(gè)值得標(biāo)準(zhǔn)差的值為288675.13459,而Numpy計(jì)算時(shí)間為0.0080 s,而Python原生計(jì)算方式為0.2499 s:
由此可見,Numpy的方式明顯更快。
5總結(jié)
NumPy是專門針對數(shù)組的操作和運(yùn)算進(jìn)行了設(shè)計(jì),所以數(shù)組的存儲效率和輸入輸出性能遠(yuǎn)優(yōu)于Python中的嵌套列表,數(shù)組越大,NumPy的優(yōu)勢就越明顯。
綜上所述,相關(guān)內(nèi)容解答就為大家介紹這里了,希望可以給各位讀者帶來幫助。
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/127780.html
小編寫這篇文章的主要目的,主要是給大家進(jìn)行介紹,關(guān)于NumPy與Python內(nèi)置列表計(jì)算標(biāo)準(zhǔn)差區(qū)別的相關(guān)介紹,希望可以給各位讀者帶來幫助?! ?什么是Numpy NumPy,是NumericalPython的通稱,用以性能卓越計(jì)算機(jī)的應(yīng)用和數(shù)據(jù)統(tǒng)計(jì)分析的前提包,像數(shù)理科學(xué)專用工具(pandas)和架構(gòu)(Scikit-learn)中都采用上了NumPy這個(gè)包?! umPy中的基本數(shù)據(jù)結(jié)構(gòu)是n...
摘要:下文統(tǒng)一稱為數(shù)組是存儲單一數(shù)據(jù)類型的多維數(shù)組同語言數(shù)組直接保存數(shù)值而則是能夠?qū)?shù)組進(jìn)行處理的函數(shù)。動態(tài)數(shù)據(jù)類型與的數(shù)組和的這些不可變數(shù)據(jù)類型的適用場景等可變數(shù)據(jù)類型適用于需要不斷對原始數(shù)據(jù)進(jìn)行修改的場景。 showImg(https://segmentfault.com/img/remote/1460000018925396);Numpy,是python中的一個(gè)矩陣計(jì)算包,功能類似ma...
摘要:鋪墊已了,進(jìn)入今天的正題,貓薦書系列之五高性能編程本書適合已入門還想要進(jìn)階和提高的讀者閱讀。書中列舉了兩個(gè)慘痛的教訓(xùn)華爾街公司騎士資本由于軟件升級引入的錯誤,損失億美元公司小時(shí)全球中斷的嚴(yán)重事故。 showImg(https://segmentfault.com/img/bVbm92w?w=6720&h=4480); 稍微關(guān)心編程語言的使用趨勢的人都知道,最近幾年,國內(nèi)最火的兩種語言非...
摘要:鋪墊已了,進(jìn)入今天的正題,貓薦書系列之五高性能編程本書適合已入門還想要進(jìn)階和提高的讀者閱讀。書中列舉了兩個(gè)慘痛的教訓(xùn)華爾街公司騎士資本由于軟件升級引入的錯誤,損失億美元公司小時(shí)全球中斷的嚴(yán)重事故。 showImg(https://segmentfault.com/img/bVbm92w?w=6720&h=4480); 稍微關(guān)心編程語言的使用趨勢的人都知道,最近幾年,國內(nèi)最火的兩種語言非...
閱讀 1029·2023-01-14 11:38
閱讀 1025·2023-01-14 11:04
閱讀 862·2023-01-14 10:48
閱讀 2306·2023-01-14 10:34
閱讀 1098·2023-01-14 10:24
閱讀 1000·2023-01-14 10:18
閱讀 625·2023-01-14 10:09
閱讀 692·2023-01-14 10:02