摘要:函數(shù)匹配能力介于簡(jiǎn)單的字符串方法和強(qiáng)大的正則表達(dá)式之間,如果在數(shù)據(jù)處理操作中只需要簡(jiǎn)單的通配符就能完成的時(shí)候,這通常是一個(gè)比較合理的方案。此模塊的主要作用是文件名稱的匹配,并且匹配的模式使用的風(fēng)格。
fnmatch()函數(shù)匹配能力介于簡(jiǎn)單的字符串方法和強(qiáng)大的正則表達(dá)式之間,如果在數(shù)據(jù)處理操作中只需要簡(jiǎn)單的通配符就能完成的時(shí)候,這通常是一個(gè)比較合理的方案。此模塊的主要作用是文件名稱的匹配,并且匹配的模式使用的Unix shell風(fēng)格。源碼很簡(jiǎn)單:
"""Filename matching with shell patterns. fnmatch(FILENAME, PATTERN) matches according to the local convention. fnmatchcase(FILENAME, PATTERN) always takes case in account. The functions operate by translating the pattern into a regular expression. They cache the compiled regular expressions for speed. The function translate(PATTERN) returns a regular expression corresponding to PATTERN. (It does not compile it.) """ import os import posixpath import re import functools __all__ = ["filter", "fnmatch", "fnmatchcase", "translate"] def fnmatch(name, pat): """Test whether FILENAME matches PATTERN. Patterns are Unix shell style: * matches everything ? matches any single character [seq] matches any character in seq [!seq] matches any char not in seq An initial period in FILENAME is not special. Both FILENAME and PATTERN are first case-normalized if the operating system requires it. If you don"t want this, use fnmatchcase(FILENAME, PATTERN). """ name = os.path.normcase(name) pat = os.path.normcase(pat) return fnmatchcase(name, pat) @functools.lru_cache(maxsize=256, typed=True) def _compile_pattern(pat): if isinstance(pat, bytes): pat_str = str(pat, "ISO-8859-1") res_str = translate(pat_str) res = bytes(res_str, "ISO-8859-1") else: res = translate(pat) return re.compile(res).match def filter(names, pat): """Return the subset of the list NAMES that match PAT.""" result = [] pat = os.path.normcase(pat) match = _compile_pattern(pat) if os.path is posixpath: # normcase on posix is NOP. Optimize it away from the loop. for name in names: if match(name): result.append(name) else: for name in names: if match(os.path.normcase(name)): result.append(name) return result def fnmatchcase(name, pat): """Test whether FILENAME matches PATTERN, including case. This is a version of fnmatch() which doesn"t case-normalize its arguments. """ match = _compile_pattern(pat) return match(name) is not None def translate(pat): """Translate a shell PATTERN to a regular expression. There is no way to quote meta-characters. """ i, n = 0, len(pat) res = "" while i < n: c = pat[i] i = i+1 if c == "*": res = res + ".*" elif c == "?": res = res + "." elif c == "[": j = i if j < n and pat[j] == "!": j = j+1 if j < n and pat[j] == "]": j = j+1 while j < n and pat[j] != "]": j = j+1 if j >= n: res = res + "[" else: stuff = pat[i:j].replace("","") i = j+1 if stuff[0] == "!": stuff = "^" + stuff[1:] elif stuff[0] == "^": stuff = "" + stuff res = "%s[%s]" % (res, stuff) else: res = res + re.escape(c) return r"(?s:%s)" % res
fnmatch的中的5個(gè)函數(shù)["filter", "fnmatch", "fnmatchcase", "translate"]
filter 返回列表形式的結(jié)果
def gen_find(filepat, top): """ 查找符合Shell正則匹配的目錄樹(shù)下的所有文件名 :param filepat: shell正則 :param top: 目錄路徑 :return: 文件絕對(duì)路徑生成器 """ for path, _, filenames in os.walk(top): for file in fnmatch.filter(filenames, filepat): yield os.path.join(path, file)
fnmatch
# 列出元組中所有的python文件 pyfiles = [py for py in ("restart.py", "index.php", "file.txt") if fnmatch(py, "*.py")] # 字符串的 startswith() 和 endswith() 方法對(duì)于過(guò)濾一個(gè)目錄的內(nèi)容也是很有用的
fnmatchcase 區(qū)分大小寫(xiě)的文件匹配
# 這兩個(gè)函數(shù)通常會(huì)被忽略的一個(gè)特性是在處理非文件名的字符串時(shí)候它們也是很有用的。 比如,假設(shè)你有一個(gè)街道地址的列表數(shù)據(jù) address = [ "5412 N CLARK ST", "1060 W ADDISON ST", "1039 W GRANVILLE AVE", "2122 N CLARK ST", "4802 N BROADWAY", ] print([addr for addr in address if fnmatchcase(addr, "* ST")])
translate 這個(gè)似乎很少有人用到,前面說(shuō)了fnmatch是Unix shell匹配風(fēng)格,可以使用translate將其轉(zhuǎn)換為正則表達(dá)式,舉個(gè)栗子
shell_match = "Celery_?*.py" print(translate(shell_match)) # 輸出結(jié)果:(?s:Celery_..*.py)
Celery_..*.py就是正則表達(dá)式的寫(xiě)法。
程序員交流群,干貨分享,加我拉你入群。
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/42698.html
摘要:函數(shù)匹配能力介于簡(jiǎn)單的字符串方法和強(qiáng)大的正則表達(dá)式之間,如果在數(shù)據(jù)處理操作中只需要簡(jiǎn)單的通配符就能完成的時(shí)候,這通常是一個(gè)比較合理的方案。此模塊的主要作用是文件名稱的匹配,并且匹配的模式使用的風(fēng)格。 fnmatch()函數(shù)匹配能力介于簡(jiǎn)單的字符串方法和強(qiáng)大的正則表達(dá)式之間,如果在數(shù)據(jù)處理操作中只需要簡(jiǎn)單的通配符就能完成的時(shí)候,這通常是一個(gè)比較合理的方案。此模塊的主要作用是文件名稱的匹配...
摘要:函數(shù)匹配能力介于簡(jiǎn)單的字符串方法和強(qiáng)大的正則表達(dá)式之間,如果在數(shù)據(jù)處理操作中只需要簡(jiǎn)單的通配符就能完成的時(shí)候,這通常是一個(gè)比較合理的方案。此模塊的主要作用是文件名稱的匹配,并且匹配的模式使用的風(fēng)格。 fnmatch()函數(shù)匹配能力介于簡(jiǎn)單的字符串方法和強(qiáng)大的正則表達(dá)式之間,如果在數(shù)據(jù)處理操作中只需要簡(jiǎn)單的通配符就能完成的時(shí)候,這通常是一個(gè)比較合理的方案。此模塊的主要作用是文件名稱的匹配...
摘要:如果在數(shù)據(jù)處理操作中只需要簡(jiǎn)單的通配符就能完成的時(shí)候,這通常是一個(gè)比較合理的方案。 問(wèn)題 你想使用 Unix Shell 中常用的通配符(比如 *.py , Dat[0-9]*.csv 等)去匹配文本字符串 解決方案 使用fnmatch模塊的fnmatch或fnmatchcase函數(shù) >>> import fnmatch >>> print(fnmatch.fnmatch(hello....
閱讀 2225·2021-09-30 09:47
閱讀 987·2021-08-27 13:01
閱讀 2971·2019-08-30 15:54
閱讀 3695·2019-08-30 15:53
閱讀 835·2019-08-29 14:07
閱讀 725·2019-08-28 18:16
閱讀 811·2019-08-26 18:37
閱讀 1420·2019-08-26 13:27