摘要:問題如何比較兩個(gè)字面一樣,但字節(jié)不一樣的字符串例如人口膾炙人口膾這里的和字符串是一樣的,但仔細(xì)觀察可以發(fā)現(xiàn),其中字符串是,字符串對(duì)應(yīng)的是所以雖然和是字面上一模一樣的字符串,但實(shí)際上和是不等的解決方案使用庫的將兩個(gè)字符串標(biāo)準(zhǔn)化后,再進(jìn)行比較就
問題
如何比較兩個(gè)字面一樣,但字節(jié)不一樣的字符串
例如:
>>> a = u"u4ebau53e3u3058u3093u3053u3046u306bu81beu7099u304bu3044u3057u3083u3059u308b" >>> b = u"u4ebau53e3u3058u3093u3053u3046u306bu81beuf9fbu304bu3044u3057u3083u3059u308b" >>> print(a, b, sep=" ") 人口じんこうに膾炙かいしゃする 人口じんこうに膾炙かいしゃする
這里的a和b字符串是一樣的,但仔細(xì)觀察可以發(fā)現(xiàn),其中a字符串是u7099,b字符串對(duì)應(yīng)的是uf9fb
所以雖然a和b是字面上一模一樣的字符串,但a實(shí)際上和b是不等的
>>> a == b False解決方案
使用unicodedata庫的normalize將兩個(gè)字符串標(biāo)準(zhǔn)化后,再進(jìn)行比較就可以了
>>> import unicodedata >>> normalize_a = unicodedata.normalize("NFC", a) >>> normalize_b = unicodedata.normalize("NFC", b) >>> print(normalize_a) 人口じんこうに膾炙かいしゃする >>> print(normalize_b) 人口じんこうに膾炙かいしゃする >>> print(normalize_a == normalize_b) True討論
這個(gè)問題是最近在Stack Overflow上很熱的一個(gè)問題,原問題見:https://stackoverflow.com/que...
關(guān)于Unicode對(duì)這個(gè)問題的介紹可以見:http://www.unicode.org/faq/no...
來源Stack Overflow
關(guān)注歡迎關(guān)注我的微信公眾號(hào):python每日一練
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/41503.html
摘要:問題在每日一練中介紹了如何一個(gè)可迭代對(duì)象,使用運(yùn)算符即可但往往我們遇到的問題是可迭代對(duì)象中的數(shù)量是不確定的這個(gè)時(shí)候該如何拿到我們想要的元素,比如我們只需要可迭代對(duì)象的第一個(gè)或者最后一個(gè)元素而已解決方案使用中的運(yùn)算符例如我們需要拿到一個(gè)元組的 問題 在每日一練0001中介紹了如何unpack一個(gè)可迭代對(duì)象,使用,運(yùn)算符即可 但往往我們遇到的問題是可迭代對(duì)象中的數(shù)量是不確定的 這個(gè)時(shí)候該如...
摘要:問題如何序列化輸出元素包含字符串元組的字符串元組好繞舉個(gè)例子將輸出為解決方案容易想到使用函數(shù),但函數(shù)要求元素必須都是字符串類型,否則會(huì)拋出錯(cuò)誤一個(gè)比較簡單的方法是將給進(jìn)中,然后再將給進(jìn)函數(shù),最后指定函數(shù)的參數(shù)來輸出如果想要將結(jié)果存儲(chǔ)起來,那 問題 如何序列化輸出元素包含字符串元組的字符串元組(好繞) 舉個(gè)例子 >>> zoo1 = (monkey, elephant) >>> zoo2...
摘要:問題如何執(zhí)行外部命令,如解決方案使用庫在之前,使用函數(shù)在及之后,使用函數(shù)討論命令的執(zhí)行默認(rèn)不需要環(huán)境,所以當(dāng)你使用作為參數(shù)時(shí),需要將置位,否則會(huì)報(bào)錯(cuò)誤通常來說對(duì)于執(zhí)行系統(tǒng)命令,我們會(huì)想到,但在官方文檔中已經(jīng)建議了使 問題 如何執(zhí)行外部命令,如ls -l 解決方案 使用subprocess庫 在Python 3.5之前,使用subprocess.call()函數(shù) >>> import s...
摘要:問題如何判斷一個(gè)文件是否存在解決方案這個(gè)問題可以分成幾類問題如果這里的文件指的是文件或目錄,我們可以用方法如果這里的文件指的是普通的文件,我們可以用方法如果這里的文件指的是目錄,我們可以用方法并且在之后,可以使用面向?qū)ο蟮姆椒ㄊ褂脦靵砼袛啵? 問題 如何判斷一個(gè)文件是否存在 解決方案 這個(gè)問題可以分成幾類問題 如果這里的文件指的是文件或目錄,我們可以用os.path.exists()方法...
摘要:問題你需要執(zhí)行簡單的日期操作,計(jì)算兩個(gè)日期間隔多少天某個(gè)日期后的多少天是幾月幾日轉(zhuǎn)換時(shí)間字符串的格式等解決方案使用庫中的和類其中類代表一個(gè)日期時(shí)間,例如年月日點(diǎn)分秒類代表一個(gè)日期間隔對(duì)于實(shí)例,可以直接進(jìn)行數(shù)學(xué)運(yùn)算得到一個(gè)實(shí)例,也就是兩個(gè)日 問題 你需要執(zhí)行簡單的日期操作,計(jì)算兩個(gè)日期間隔多少天、某個(gè)日期后的多少天是幾月幾日、轉(zhuǎn)換時(shí)間字符串的格式等 解決方案 使用datetime庫中的d...
閱讀 1476·2021-11-22 14:44
閱讀 2851·2021-11-16 11:44
閱讀 3219·2021-10-13 09:40
閱讀 2013·2021-10-08 10:04
閱讀 2374·2021-09-24 10:28
閱讀 2921·2021-09-06 15:02
閱讀 2971·2019-08-30 15:52
閱讀 2409·2019-08-30 13:20