成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

當(dāng)談?wù)摰鲿r,我談些什么?

王軍 / 3447人閱讀

摘要:示例代碼如下此示例中可以看出,當(dāng)?shù)鹘K止時,通過拋出異常告知迭代器已耗盡。但如果迭代器所指向的數(shù)據(jù)結(jié)構(gòu)在其存在時發(fā)生了插入或刪除操作,則迭代器將可能失效。與的情形類似,對進(jìn)行任何插入操作也將損壞迭代器。

花下貓語:之前說過,我對于編程語言跟其它學(xué)科的融合非常感興趣,但我還說漏了一點(diǎn),就是我對于 Python 跟其它編程語言的對比學(xué)習(xí),也很感興趣。所以,我一直希望能聚集一些有其它語言基礎(chǔ)的同學(xué),一起討論共通的語言特性間的話題。不同語言的碰撞,常常能帶給人更高維的視角,也能觸及到語言的根基,這個過程是極有益的。

這篇文章是群內(nèi) 櫻雨樓 小姐姐的投稿,她是我們學(xué)習(xí)群里的真·大佬,說到對 Python 的研究以及高階知識的水平,無人能出其右(群里很多同學(xué)都被她實(shí)力圈粉啦)。除了 Python,她對 C++、Perl、Go 與 Fortran 等語言都有涉獵,本文主要是對比了 Python 與 C++,來深入談?wù)劦?。話不多說,請看正文。

櫻雨樓 | 原創(chuàng)作者

豌豆花下貓 | 編輯潤色

本文原創(chuàng)并首發(fā)于公眾號【Python貓】,未經(jīng)授權(quán),請勿轉(zhuǎn)載。

原文地址:https://mp.weixin.qq.com/s/Be...

0 前言

迭代器(Iterator)是 Python 以及其他各種編程語言中的一個非常常見且重要,但又充滿著神秘感的概念。無論是 Python 的基礎(chǔ)內(nèi)置函數(shù),還是各類高級話題,都處處可見迭代器的身影。

那么,迭代器究竟是怎樣的一個概念?其又為什么會廣泛存在于各種編程語言中?本文將基于 C++ 與 Python,深入討論這一系列問題。

1 什么是迭代器?我們?yōu)槭裁匆褂玫鳎?/b>

什么是迭代器?當(dāng)我初學(xué) Python 的時候,我將迭代器理解為一種能夠放在“for xxx in ...”的“...”位置的東西;后來隨著學(xué)習(xí)的深入,我了解到迭代器就是一種實(shí)現(xiàn)了迭代器協(xié)議的對象;學(xué)習(xí) C++ 時,我了解到迭代器是一種行為和指針類似的對象...

事實(shí)上,迭代器是一個伴隨著迭代器模式(Iterator Pattern)而生的抽象概念,其目的是分離并統(tǒng)一不同的數(shù)據(jù)結(jié)構(gòu)訪問其中數(shù)據(jù)的方式,從而使得各種需要訪問數(shù)據(jù)結(jié)構(gòu)的函數(shù),對于不同的數(shù)據(jù)結(jié)構(gòu)可以保持相同的接口。

在很多討論 Python 迭代器的書籍與文章中,我看到這樣兩種觀點(diǎn):1. 迭代器是為了節(jié)約數(shù)據(jù)結(jié)構(gòu)所產(chǎn)生的內(nèi)存;2. 遍歷迭代器效率更高。

這兩點(diǎn)論斷都是很不準(zhǔn)確的:首先,除了某些不定義在數(shù)據(jù)結(jié)構(gòu)上的迭代器(如文件句柄,itertools 模塊的 count、cycle 等無限迭代器等),其他迭代器都定義在某種數(shù)據(jù)結(jié)構(gòu)上,所以不存在節(jié)約內(nèi)存的優(yōu)勢;其次,由于迭代器是一種高度泛化的實(shí)現(xiàn),其需要在每一次迭代器移動時都做一些額外工作(如 Python 需要不斷檢測迭代器是否耗盡,并進(jìn)行異常監(jiān)測;C++ 的 deque 容器需要對其在堆上用于存儲的多段不連續(xù)內(nèi)存進(jìn)行銜接等),故遍歷迭代器的效率一定低于或幾乎接近于直接遍歷容器,而不太可能高于直接遍歷原容器。

綜上所述,迭代器存在的意義,不是為了空間換時間,也不是為了時間換空間,而是一種適配器(Adapter)。迭代器的存在,使得我們可以使用同樣的 for 語句去遍歷各種容器,或是像 C++ 的 algorithm 模塊所示的那樣,使用同樣的接口去處理各種容器。

這些容器可以是一個連續(xù)內(nèi)存的數(shù)組或列表,或是一個多段連續(xù)內(nèi)存的 deque,甚至是一個完全不連續(xù)內(nèi)存的鏈表或是哈希表等等,我們完全不需要關(guān)注迭代器對于不同的容器究竟是怎么取得數(shù)據(jù)的。

2 C++中的迭代器 2.1 泛化指針

在 C++ 中,迭代器通過泛化指針(Generalized Pointer)的形式呈現(xiàn)。泛化指針與仿函數(shù)(Functor)的定義類似,其包含以下兩種情況:

是一個真正的指針

不是指針,但重載了某些指針運(yùn)算符(如“*,++,--,!=” 等),使得其行為和指針相似

根據(jù)泛化指針為了將其“偽裝”成一個真正的指針從而重載的運(yùn)算符的數(shù)量,迭代器被分為五種,如下文所示。

2.2 C++的迭代器分類

C++ 中,迭代器按照其所支持的行為被分為五類:

輸入迭代器(Input Iterator):僅可作為右值(rvalue),不可作為左值(lvalue)??梢赃M(jìn)行比較(“== 與 !=”)

輸出迭代器(Output Iterator):僅可作為左值,不可作為右值

前向迭代器(Forward Iterator):支持一切輸入迭代器的操作,以及單步前進(jìn)操作(++)

雙向迭代器(Bidirectional Iterator):支持一切前向迭代器的操作,以及單步后退操作(--)

隨機(jī)訪問迭代器(Random Access Iterator):支持一切雙向迭代器操作,以及非單步雙向移動操作

對于前向迭代器,雙向迭代器,以及隨機(jī)訪問迭代器,如果其不存在底層 const(Low-Level Const)限定,則同時也支持一切輸出迭代器操作。

2.3 迭代器適配器

C++ 中還存在一系列迭代器適配器,用于使得一些非迭代器對象的行為類似于迭代器,或修改迭代器的一些默認(rèn)行為,大致包含如下幾個類別:

插入迭代器(Insert Iterator):使得對迭代器左值的寫入操作變?yōu)橄蛉萜髦胁迦霐?shù)據(jù)的操作,按插入位置的不同,可分為 front_insert_iterator,back_insert_iterator 和 insert_iterator

反向迭代器(Reverse Iterator):對調(diào)迭代器的移動方向。使得“+”操作變?yōu)橄蜃笠苿樱瑫r“-”操作變?yōu)橄蛴乙苿樱愃朴?Python 的 reversed 函數(shù))

移動迭代器(Move Iterator):使得對迭代器的取值變?yōu)橛抑狄茫≧value Reference)

流迭代器(Stream Iterator):使流對象的行為適配迭代器(類似于 Python 的文件句柄)

3 Python中的迭代器 3.1 迭代器協(xié)議

在 Python 中,迭代器基于鴨子類型(Duck Type)下的迭代器協(xié)議(Iterator Protocol)實(shí)現(xiàn)。迭代器協(xié)議規(guī)定:如果一個類想要成為可迭代對象(Iterable Object),則其必須實(shí)現(xiàn)__iter__方法,且其返回值需要是一個實(shí)現(xiàn)了__next__方法的對象。即:實(shí)現(xiàn)了__iter__方法的類將成為可迭代對象,而實(shí)現(xiàn)了__next__方法的類將成為迭代器。

顯然,__iter__方法是iter函數(shù)所對應(yīng)的魔法方法,__next__方法是 next 函數(shù)所對應(yīng)的魔法方法。

對于一個可迭代對象,針對“誰實(shí)現(xiàn)了__next__方法?”這一問題進(jìn)行討論,可將可迭代對象的實(shí)現(xiàn)分為兩種情況:

self 未實(shí)現(xiàn)__next__:如果__iter__方法的返回值就是一個 Iterator,則此時 self 即為一個可迭代對象。此時,self 將迭代操作“委托”到了另一個數(shù)據(jù)結(jié)構(gòu)上。示例代碼如下:

class SampleIterator:
    def __iter__(self):
        return iter(...)

self 實(shí)現(xiàn)了__next__:如果__iter__方法返回 self,則說明 self 本身將作為迭代器,此時 self 本身需要繼續(xù)實(shí)現(xiàn)__next__方法,以實(shí)現(xiàn)完整的迭代器協(xié)議。示例代碼如下:

class SampleIterator:
    def __iter__(self):
        return self
    
    def __next__(self):
        # Not The End
        if ...:
            return ...
        # Reach The End
        else:
            raise StopIteration

此示例中可以看出,當(dāng)?shù)鹘K止時,通過拋出 StopIteration 異常告知 Python 迭代器已耗盡。

3.2 生成器

生成器(Generator)是 Python 特有的一組特殊語法,其主要目的為提供一個基于函數(shù)而不是類的迭代器定義方式。同時,Python 也具有生成器推導(dǎo)式,其基于推導(dǎo)式語法快速建立迭代器。生成器一般適用于需要創(chuàng)建簡單邏輯的迭代器的場合。

只要一個函數(shù)的定義中出現(xiàn)了 yield 關(guān)鍵詞,則此函數(shù)將不再是一個函數(shù),而成為一個“生成器構(gòu)造函數(shù)”,調(diào)用此構(gòu)造函數(shù)即可產(chǎn)生一個生成器對象。

由此可見,如果僅討論該語法本身,而不關(guān)心實(shí)現(xiàn)的話:生成器只是“借用”了函數(shù)定義的語法,實(shí)際上與函數(shù)并無關(guān)系(并不代表生成器的底層實(shí)現(xiàn)也與函數(shù)無關(guān))。示例代碼如下:

def SampleGenerator():
    yield ...
    yield ...
    yield ...

生成器推導(dǎo)式則更為簡單,只需要將列表推導(dǎo)式的中括號換為小括號即可:

(... for ... in ...)

綜上所述,生成器是 Python 獨(dú)有的一類迭代器的特殊構(gòu)造方式。生成器一旦被構(gòu)造,其會自動實(shí)現(xiàn)完整的迭代器協(xié)議。

3.3 無限迭代器

itertools 模塊中實(shí)現(xiàn)了三個特殊的無限迭代器(Infinite Iterator):count,cycle 以及 repeat,其有別于普通的表示范圍的迭代器。如果對無限迭代器進(jìn)行迭代將導(dǎo)致無限循環(huán),故無限迭代器通常只可使用 next 函數(shù)進(jìn)行取值。

關(guān)于無限迭代器的詳細(xì)內(nèi)容,可參閱 Python 文檔。(注:舊文 Python進(jìn)階:設(shè)計(jì)模式之迭代器模式 也介紹過)

3.4 與C++迭代器的比較

經(jīng)過上文的討論可以發(fā)現(xiàn),Python 只有一種迭代器,此種迭代器只能進(jìn)行單向,單步前進(jìn)操作,且不可作為左值。故 Python 的迭代器在 C++ 中應(yīng)屬于單向只讀迭代器,這是一種很低級的迭代器。

此外,由于迭代器只支持單向移動,故一旦向前移動便不可回頭,如果遍歷一個已耗盡迭代器,則 for 循環(huán)將直接退出,且無任何錯誤產(chǎn)生,此種行為往往會產(chǎn)生一些難以察覺的 bug,實(shí)際使用時請務(wù)必注意。

綜上所述,Python 對于迭代器的實(shí)現(xiàn)其實(shí)是高度匱乏的,應(yīng)謹(jǐn)慎使用。

4 迭代器有效性 4.1 什么是迭代器有效性?

由于迭代器本身并不是獨(dú)立的數(shù)據(jù)結(jié)構(gòu),而是指向其他數(shù)據(jù)結(jié)構(gòu)中的值的泛化指針,故和普通指針一樣,一旦指針指向的內(nèi)存發(fā)生變動,則迭代器也將隨之失效。

如果迭代器指向的數(shù)據(jù)結(jié)構(gòu)是只讀的,則顯然,直到析構(gòu)函數(shù)被調(diào)用,迭代器都不會失效。但如果迭代器所指向的數(shù)據(jù)結(jié)構(gòu)在其存在時發(fā)生了插入或刪除操作,則迭代器將可能失效。故討論某個操作是否會導(dǎo)致指向容器的迭代器失效,是一個很重要的話題。

4.2 C++的迭代器有效性

由于 Python 中沒有 C++ 的 list、deque 等數(shù)據(jù)結(jié)構(gòu)實(shí)現(xiàn),故本文只簡單地討論 vector 與 unordered_map 這兩種數(shù)據(jù)結(jié)構(gòu)的迭代器有效性。

對于 vector,由于其存在內(nèi)存擴(kuò)容與轉(zhuǎn)移操作,故任何會潛在導(dǎo)致內(nèi)存擴(kuò)容的方法都將損壞迭代器,包括 push_back、emplace_back、insert、emplace 等。

unordered_map 與 vector 的情形類似,對 unordered_map 進(jìn)行任何插入操作也將損壞迭代器。

4.3 Python的迭代器有效性

注:本節(jié)所討論全部內(nèi)容均基于實(shí)際行為進(jìn)行猜想和推論,并沒有經(jīng)過對 Python 源代碼的考察和驗(yàn)證,僅供讀者參考。

4.3.1 尾插入操作不會損壞指向當(dāng)前元素的List迭代器

考察如下代碼:

numList = [1, 2, 3]
numListIter = iter(numList)
next(numListIter)

for i in range(1000000):
    numList.append(i)
    
# print 2
print(next(numListIter))

如果在 C++ 中對一個 vector 執(zhí)行這么多次的 push_back,則指向第二個元素的迭代器一定早已失效。但在 Python 中可以看到,指向 List 的迭代器并未失效,其仍然返回了 2。

故可猜想:Python 對于 List 所產(chǎn)生的迭代器并不跟蹤指向 List 元素的指針,而僅僅跟蹤的是容器的索引值。

4.3.2 尾插入操作會損壞List尾迭代器
numList = [1,2]
numListIter = iter(numList)

# 1
next(numList)
numList.append(3)

# 2 
next(numListIter)

# 3
print(next(numListIter))

首先,Python 不存在尾迭代器這一概念。但由上述代碼可知,當(dāng)?shù)魉赶虻?List 變長后,迭代器的終止點(diǎn)也隨之變化,即:原先的尾迭代器將不再適用。

按照“迭代器僅跟蹤元素索引值”這一推斷,也能解釋這一行為。

4.3.3 迭代器一旦耗盡,則將永久損壞

考察如下代碼:

numList = [1,2]
numListIter = iter(numList)
for _ in numListIter:
    pass

numList.append(3)

# StopIteration
print(next(numListIter))

當(dāng)完整的 for 一個迭代器后,迭代器將耗盡,在 C++ 中,這將導(dǎo)致頭尾迭代器相等,但由上述代碼可知, Python 的迭代器一旦耗盡,便不再可以使用,即使繼續(xù)往容器中增加元素也不行。

由此可見, Python 的迭代器中可能存在某種用于指示迭代器是否被耗盡的標(biāo)記,一旦迭代器被標(biāo)記為耗盡狀態(tài),便永遠(yuǎn)不可繼續(xù)使用了。

4.3.4 任何插入操作都將損壞Dict迭代器

考察如下代碼:

numDict = {1:2}
numDictIter = iter(numDict)
numDict[3] = 4

# RuntimeError
next(numDictIter)

當(dāng)對一個 Dict 進(jìn)行插入操作后,原 Dict 迭代器將立即失效,并拋出 RuntimeError。這與 C++ 中的行為是一致的,且更為安全。

Set 與 Dict 具有相同的迭代器失效性質(zhì),不再重復(fù)討論。

5 后記

迭代器的故事到這里就結(jié)束了。總的看來,Python 中的迭代器雖應(yīng)用廣泛,但并不是一種高級的,靈活的實(shí)現(xiàn),且存在著一些黑魔法。 故唯有深入的去理解,才能真正的用好迭代器。祝編程愉快~

(花下貓注:鑒于有同學(xué)看完本文,可能想要加群交流,我補(bǔ)充兩句。我們?nèi)弘m然是免費(fèi)群,但一直想走高質(zhì)量的技術(shù)交流路線,因此既限制人數(shù),也嚴(yán)審核。公眾號菜單欄有我聯(lián)系方式,感興趣的同學(xué)歡迎查看了解。)

公眾號【Python貓】, 本號連載優(yōu)質(zhì)的系列文章,有喵星哲學(xué)貓系列、Python進(jìn)階系列、好書推薦系列、技術(shù)寫作、優(yōu)質(zhì)英文推薦與翻譯等等,歡迎關(guān)注哦。

文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/44144.html

相關(guān)文章

  • 對比 C++ 和 Python,談?wù)勚羔樑c引用

    摘要:本文基于與,討論了中與指針及引用相關(guān)的一些行為。在這些場合中,移動構(gòu)造函數(shù)和移動賦值操作通過右值引用接管被移動對象。而由于對象從構(gòu)造函數(shù)而來,至此我們可知的構(gòu)造函數(shù)將構(gòu)造匿名對象,且返回此對象的一個指針。 花下貓語:本文是學(xué)習(xí)群內(nèi) 櫻雨樓 小姐姐的投稿。之前已發(fā)布過她的一篇作品《當(dāng)談?wù)摰鲿r,我談些什么?》,大受好評。本文依然是對比 C++ 與 Python,來探討編程語言中極其重要...

    tracy 評論0 收藏0
  • 當(dāng)我談Proxy與Adpater模式時,談些什么

    摘要:適配器模式屬于兩種適應(yīng)設(shè)計(jì)模式中的其中一種,另外一種是迭代器模式,下次有機(jī)會再仔細(xì)聊聊它。設(shè)計(jì)模式的書很喜歡以電源適配器插頭作為適配器模式的范例范例,那么我們也從這個例子開始吧。 當(dāng)我談Proxy與Adpater模式時,我談些什么 前言 今天跟同事談起了一道面試題:Proxy模式跟Adpater模式的區(qū)別,這兩個設(shè)計(jì)模式都是很相似的模式,很多有點(diǎn)經(jīng)驗(yàn)的程序員都可能會聊的頭頭是道,但是恐...

    incredible 評論0 收藏0

發(fā)表評論

0條評論

最新活動
閱讀需要支付1元查看
<