同樣是Python，Python3和Python2怎么區(qū)別這么大？

Raaabbit 發(fā)布于2019-07-31 10:33 / 2993人閱讀

摘要：可是當(dāng)我測試，我就懵逼了，中文真都驗證通過，不對啊，我以前也是這么過濾參數(shù)的，測試沒問題啊唯一的區(qū)別是現(xiàn)在用的是。

上周，我的測試同事告訴我，你的用戶名怎么還允許中文?。慨?dāng)時我心里就想，你們測試肯定又搞錯接口了，我用的是正則w過濾了參數(shù)，怎么可能出錯，除非Python正則系統(tǒng)出錯了，那是不可能的。本著嚴(yán)謹(jǐn)?shù)淖黠L(fēng)，我自己先測試一下，沒問題看我怎么懟回去?？墒钱?dāng)我測試，我就懵逼了，中文真TM都驗證通過，不對啊，我以前也是這么過濾參數(shù)的，測試沒問題??？唯一的區(qū)別是現(xiàn)在用的是Python3。
上網(wǎng)搜了一圈，發(fā)現(xiàn)沒有一篇文章講述Python2和Python3的正則在處理字符串是的區(qū)別，都是一視同仁，知道我去翻了一遍官方文檔，才明白怎么回事。

問題復(fù)現(xiàn)

我們都知道，Python有個正則規(guī)則w，幾乎所有的網(wǎng)上博客文章都告訴你，這個規(guī)則匹配字母數(shù)字及下劃線，但實際并不是這樣：
有Python2代碼如下：

~|? pythonPython 2.7.10 (default, Aug 17 2018, 19:45:58)
[GCC 4.2.1 Compatible Apple LLVM 10.0.0 (clang-1000.0.42)] on darwinType "help", "copyright", "credits" or "license" for more information.>>> import re>>> aa = "捕蛇者說">>> re.match("w{1,20}", aa)>>> bb = "abc123ADB">>> re.match("w{1,20}", bb)
<_sre.SRE_Match object at 0x1031b0b28>

我們可以看到，在python2中，w是無法匹配中文的。那么，同樣的代碼在Python3中運行結(jié)果是什么樣子的了？

~|? python3Python 3.7.1 (default, Nov 28 2018, 11:55:14)
[Clang 9.0.0 (clang-900.0.39.2)] on darwinType "help", "copyright", "credits" or "license" for more information.>>> import re>>> aa = "捕蛇者說">>> re.match("w{1,20}", aa)
>>> bb = "abc123ADB">>> re.match("w{1,20}", bb)

但在Python3中w是可以匹配中文的，這是怎么回事了？要回答這個問題，我們要回到Python官方文檔中來尋找答案。

解決問題

當(dāng)我們仔細(xì)閱讀Python的官方文檔時，就會發(fā)現(xiàn)，對于同樣的正則規(guī)則w，Python2和Python3區(qū)別好大，我們先來看看Python2：

When the LOCALE and UNICODE flags are not specified, matches any alphanumeric character and the underscore; this is equivalent to the set [a-zA-Z0-9_]. With LOCALE, it will match the set [0-9_] plus whatever characters are defined as alphanumeric for the current locale. If UNICODE is set, this will match the characters [0-9_] plus whatever is classified as alphanumeric in the Unicode character properties database.

翻譯一下：當(dāng)沒有設(shè)置LOCALE(re.L)和UNICODE(re.U)標(biāo)志，匹配數(shù)字字母和下劃線，如果設(shè)置了LOCALE(re.L)則匹配數(shù)字下劃線和LOCALE文字。如果設(shè)置了UNICODE(re.U)標(biāo)志，匹配數(shù)字下劃線和Unicode字符集里的字符。

那么Python3了：

對于 Unicode (str) 樣式：
匹配Unicode詞語的字符，包含了可以構(gòu)成詞語的絕大部分字符，也包括數(shù)字和下劃線。如果設(shè)置了 ASCII 標(biāo)志，就只匹配 [a-zA-Z0-9_] 。
對于8位(bytes)樣式：
匹配ASCII字符中的數(shù)字和字母和下劃線，就是 [a-zA-Z0-9_] 。如果設(shè)置了 LOCALE 標(biāo)記，就匹配當(dāng)前語言區(qū)域的數(shù)字和字母和下劃線。

到此，我明白了，默認(rèn)情況下，不設(shè)置任何標(biāo)志，Python2 w匹配ASCII字符集里的字符，包括數(shù)字字符和下劃線，Python3 w匹配數(shù)字下劃線和Unicode字符集。所以，為了遷移方便，如果你想匹配ASCII字符集里的字符，指定標(biāo)志為re.A，如果你想匹配Unicode字符集里的字符，指定標(biāo)志為re.U。

總結(jié)

到此，我的問題是徹底解決了，但也有兩個教訓(xùn)：

看網(wǎng)上的教程要多注意，特別是教程里的環(huán)境和自己環(huán)境的區(qū)別

多看官方文檔

關(guān)于Python2和Python3，還有很多區(qū)別，這里就不一一列舉了，歡迎大家留言討論。

GPU云服務(wù)器云服務(wù)器 python2和python3的區(qū)別 python3和python2的區(qū)別 python2與python3的區(qū)別兼容python2和python3

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://systransis.cn/yun/44014.html

發(fā)表評論

登陸后可評論

0條評論

Raaabbit

男|高級講師

我要關(guān)注我要私信

TA的文章

C語言中break和continue的用法和區(qū)別

閱讀 1428·2021-10-08 10:05
vinahost：便宜越南vps,100Mbps不限流量,月付35元起;泰國vps,2核1G價格12

閱讀 3079·2021-09-26 10:10
CSS3常見技巧（一）：如何禁止文本選擇高亮

閱讀 890·2019-08-30 15:55
【題目】【4天2】會移動的汽車

閱讀 515·2019-08-26 11:51
git使用

閱讀 451·2019-08-23 18:10
Leaflet中L.Point與L.LatLng的區(qū)別聯(lián)系

閱讀 3870·2019-08-23 15:39
正則表達(dá)式學(xué)習(xí)

閱讀 672·2019-08-23 14:50
解決sublime text3安裝Package Control問題

閱讀 777·2019-08-23 14:46

成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

同樣是Python，Python3和Python2怎么區(qū)別這么大？

相關(guān)文章

**同樣是Python，怎么區(qū)別這么大**

**學(xué)了這么久的Python，這些知識點都掌握了嗎？**

Jupyter Notebook之初識及入門

Jupyter Notebook之初識及入門

發(fā)表評論

0條評論

Raaabbit

男|高級講師

TA的文章

C語言中break和continue的用法和區(qū)別

vinahost：便宜越南vps,100Mbps不限流量,月付35元起;泰國vps,2核1G價格12

CSS3常見技巧（一）：如何禁止文本選擇高亮

【題目】【4天2】會移動的汽車

git使用

Leaflet中L.Point與L.LatLng的區(qū)別聯(lián)系

正則表達(dá)式學(xué)習(xí)

解決sublime text3安裝Package Control問題

最新活動

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

同樣是Python，Python3和Python2怎么區(qū)別這么大？

相關(guān)文章

發(fā)表評論

0條評論

男|高級講師

TA的文章

最新活動

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

同樣是Python，Python3和Python2怎么區(qū)別這么大？