摘要:匹配次匹配次匹配次匹配次匹配次,等價于匹配次,等價于元字符在正則表達(dá)式中有一些具有特殊含義的字母,被稱為元字符,簡言之,元字符就是描述字符的字符,它用于對字符表達(dá)式的內(nèi)容轉(zhuǎn)換及各種操作信息進(jìn)行描述。
正則表達(dá)式是很多程序員,甚至是一些有了多年經(jīng)驗的開發(fā)者薄弱的一項技能。大家都很多時候都會覺得正則表達(dá)式難記、難學(xué)、難用,但不可否認(rèn)的是正則表達(dá)式是一項很重要的技能,所有我將學(xué)習(xí)和使用正則表達(dá)式時的關(guān)鍵點(diǎn)整理如下,供大家參考。
不同語言中的正則表達(dá)式寫法有少許差異,本文將使用Javascript中的語法。
什么是正則表達(dá)式?正則表達(dá)式(Regular Expression或Regex),是用于定義某種特定搜索模式的字符組合。正則表達(dá)式可用于匹配、查找和替換文本中的字符,進(jìn)行輸入數(shù)據(jù)的驗證,查找英文單詞的拼寫錯誤等。
調(diào)試工具下面列出了幾款優(yōu)秀的在線調(diào)試工具,如果你想創(chuàng)建或者調(diào)試正則表達(dá)式可能會需要。個人比較偏好Regex101,regex101支持在正則表達(dá)式的不同flavor之間切換、解釋你的正則表達(dá)式、顯示匹配信息、提供常用語法參考等功能,非常強(qiáng)大。
Regex101
Regexr
Regexpal
開始在Javascript中,一個正則表達(dá)式以 / 開頭和結(jié)尾,所以簡單至 /hello regexp/ 就是一個正則表達(dá)式。
Flags(標(biāo)志符或修飾符)Flags寫在結(jié)束的/之后,可以影響整個正則表達(dá)式的匹配行為。常見的flags有:
g:全局匹配(global);正則表達(dá)式默認(rèn)只會返回第一個匹配結(jié)果,使用標(biāo)志符g則可以返回所有匹配
i:忽略大小寫(case-insensitive);在匹配時忽略英文字母的大小寫
m:多行匹配(multiline);將開始和結(jié)束字符(^和$)視為在多行上工作,即分別匹配每一行(由 或 分割)的開始和結(jié)束,而不只是只匹配整個輸入字符串的最開始和最末尾處
Flags可以組合使用,如:
Character Sets(字符集合)用于匹配字符集合中的任意一個字符,常見的字符集有:
[xyz]:匹配 "x"或"y"`"z"`
[^xyz]:補(bǔ)集,匹配除 "x" "y" "z"的其他字符
[a-z]:匹配從 "a" 到 "z" 的任意字符
[^a-n]:補(bǔ)集,匹配除 "a" 到 "n" 的其他字符
[A-Z]:匹配從 "A" 到 "Z" 的任意字符
[0-9]:匹配從 "0" 到 "9" 的任意數(shù)字
比如匹配所有的字母和數(shù)字可以寫成:/[a-zA-Z0-9]/ 或者 /[a-z0-9]/i。
Quantifiers (量詞)在實際使用中,我們常常需要匹配同一類型的字符多次,比如匹配11位的手機(jī)號,我們不可能將 [0-9] 寫11遍,此時我們可以使用Quantifiers來實現(xiàn)重復(fù)匹配。
{n}:匹配 n 次
{n,m}:匹配 n-m 次
{n,}:匹配 >=n 次
?:匹配 0 || 1 次
*:匹配 >=0 次,等價于 {0,}
+:匹配 >=1 次,等價于 {1,}
Metacharacters(元字符)在正則表達(dá)式中有一些具有特殊含義的字母,被稱為元字符,簡言之,元字符就是描述字符的字符,它用于對字符表達(dá)式的內(nèi)容、轉(zhuǎn)換及各種操作信息進(jìn)行描述。
常見的元字符有:
d:匹配任意數(shù)字,等價于 [0-9]
D:匹配任意非數(shù)字字符;d 的補(bǔ)集
w:匹配任意基本拉丁字母表中的字母和數(shù)字,以及下劃線;等價于 [A-Za-z0-9_]
W:匹配任意非基本拉丁字母表中的字母和數(shù)字,以及下劃線;w 的補(bǔ)集
s:匹配一個空白符,包括空格、制表符、換頁符、換行符和其他Unicode空格
S:匹配一個非空白符;s的補(bǔ)集
:匹配一個零寬單詞邊界,如一個字母與一個空格之間;例如,/no/ 匹配 "at noon" 中的 "no",/ly/ 匹配 "possibly yesterday." 中的 "ly"
B:匹配一個零寬非單詞邊界,如兩個字母之間或兩個空格之間;例如,/Bon/ 匹配 "at noon" 中的 "on",/yeB/ 匹配 "possibly yesterday." 中的 "ye"
:匹配一個水平制表符(tab)
:匹配一個換行符(newline)
:匹配一個回車符(carriage return)
Special Characters (特殊字符)正則中存在一些特殊字符,它們不會按照字面意思進(jìn)行匹配,而有特殊的意義,比如前文講過用于量詞的?、*、+。其他常見的特殊字符有:
:轉(zhuǎn)義字符,可以將普通字符轉(zhuǎn)成特殊字符。比如 w;也可以將特殊字符轉(zhuǎn)成字面意思,比如 + 匹配 "+"
.:匹配任意單個字符,但是換行符除外: , , u2028 或 u2029;在字符集中([.]),無特殊含義,即表示 "." 的字面意思
|:替換字符(alternate character),匹配 | 前或后的表達(dá)式。比如需要同時匹配 "bear" 和 "pear",可以使用 /(b|p)ear/ 或者 /bear|pear/;但是不能用 /b|pear/,該表達(dá)式只能匹配 "b" 和 "pear"
^:匹配輸入的開始。比如,/^A/ 不匹配 "an Apple" 中的 "A",但匹配 "An apple" 中的 "A"
$:匹配輸入的結(jié)尾。比如,/t$/ 不匹配 "eater" 中的 "t",但匹配 "eat" 中的 "t"。^ 和 $ 在表單驗證時常需要使用,因為需要驗證從開始到結(jié)尾的一個完整輸入,而不是匹配輸入中的某一段
Groups(分組)(xyz):捕獲分組(Capturing Group),匹配并捕獲匹配項;例如,/(foo)/ 匹配且捕獲 "foo bar." 中的 "foo"。被匹配的子字符串可以在結(jié)果數(shù)組的元素 [1], ..., [n] 中找到,或在被定義的 RegExp 對象的屬性 $1, ..., $9 中找到
(?:xyz):非捕獲分組(Non-capturing Group),匹配但不會捕獲匹配項;匹配項不能再次被訪問到
:n 是一個正整數(shù),表示反向引用(back reference),指向正則表達(dá)式中第n個括號(從左開始數(shù))中匹配的子字符串;例如,/apple(,)sorange1/ 匹配 "apple, orange, cherry, peach." 中的 "apple,orange,"
Assertion(斷言)x(?=y):僅匹配被y跟隨的x;例如,/bruce(?=wayne)/,如果"bruce"后面跟著wayne,則匹配之。/bruce(?=wayne|banner)/ ,如果"bruce"后面跟著"wayne"或者banner,則匹配之。但是,"wayne" 和 "banner" 都不會在匹配結(jié)果中出現(xiàn)
x(?!y):僅匹配不被y跟隨的x;例如,/d+(?!.)/ 只會匹配不被 "." 跟隨的數(shù)字。
/d+(?!.)/.exec("3.141") 匹配 "141",而不是 "3.141"
應(yīng)用上面羅列出了這么多正則表達(dá)式的語法和規(guī)則,可以在一定程度上幫助我們分析和理解一段正則表達(dá)式的作用,但是如何將這些規(guī)則組合并創(chuàng)造出有特定作用的表達(dá)式還需要我們自己多加練習(xí),下面舉幾個例子來說明運(yùn)用這些規(guī)則。
1. 匹配手機(jī)號碼我們先從比較簡單的匹配手機(jī)號碼開始。目前國內(nèi)的手機(jī)號碼是1(3/4/5/7/8)開頭的11位數(shù)字,因此手機(jī)號碼的正則可以分解為以下幾部分:
以 1 開頭:/^1/
第2位為3、4、5、7、8中的一個:/[34578]/ 或 /(3|4|5|7|8)/
剩余3-11位均為數(shù)字,并以數(shù)字結(jié)尾:/d{9}$/
組合起來即為 /^1[34578]d{9}$/ 或 /^1(3|4|5|7|8)d{9}$/,因為使用捕獲括號存在性能損失,所以推薦使用第一種寫法。
2. 匹配電子郵件標(biāo)準(zhǔn)的電子郵件組成為
每部分的格式標(biāo)準(zhǔn)為(進(jìn)行了相應(yīng)的簡化,主要為展示如何書寫正則):
yourname:任意英文字母(a-z/A-Z)、數(shù)字(0-9)、下劃線(_)、英文句點(diǎn)(.)、連字符(-),長度大于0
domain:任意英文字母(a-z/A-Z)、數(shù)字(0-9)、連字符(-),長度大于0
extension:任意英文字母(a-z/A-Z),長度2-8
optional-extension:"."開頭,后面跟任意英文字母(a-z/A-Z),長度2-8,可選
每部分的正則表達(dá)式為:
yourname:/[a-zd._-]+/
domain:/[a-zd-]+/
extension: /[a-z]{2,8}/
optional-extension:/(.[a-z]{2,8})?/
組合起來形成最后的正則表達(dá)式:/^([a-zd._-]+)@([a-zd-]+).([a-z]{2,8})(.[a-z]{2,8})?$/;為了增加可讀性可以將每部分用"()"包起來,并不要忘記起始和結(jié)束符 ^$。
結(jié)語今天關(guān)于正則表達(dá)式的普及就先到這兒,希望對大家以后寫正則能有一點(diǎn)幫助。關(guān)于本文中沒有涉及到的知識可以參考以下鏈接:
Wikipedia - Regular Expression
MDN - Regular Expression
Microsoft - Regular Expression Reference
W3schools - Regexp
最后,推薦大家使用Fundebug,一款很好用的BUG監(jiān)控工具~
我的博客即將同步至騰訊云+社區(qū),邀請大家一同入駐:https://cloud.tencent.com/dev...
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/109168.html
摘要:如果遇到非常的復(fù)雜的匹配,正則表達(dá)式的優(yōu)勢就更加明顯了。關(guān)于正則表達(dá)式書寫規(guī)則,可查看,上面說的很清楚了,我就不貼出來了。替換與正則表達(dá)式匹配的子串,并返回替換后的字符串。結(jié)語正則表達(dá)式并不難,懂了其中的套路之后,一切都變得簡單了。 前言 在正文開始前,先說說正則表達(dá)式是什么,為什么要用正則表達(dá)式?正則表達(dá)式在我個人看來就是一個瀏覽器可以識別的規(guī)則,有了這個規(guī)則,瀏覽器就可以幫我們判斷...
本文收集學(xué)習(xí)過程中使用到的資源。 持續(xù)更新中…… 項目地址 https://github.com/abc-club/f... 目錄 vue react react-native Weex typescript Taro nodejs 常用庫 css js es6 移動端 微信公眾號 小程序 webpack GraphQL 性能與監(jiān)控 高質(zhì)文章 趨勢 動效 數(shù)據(jù)結(jié)構(gòu)與算法 js core 代碼規(guī)范...
摘要:攻擊中文名稱跨站請求偽造,也被稱為前端跨域問題及解決方案前端掘金同源策略同源策略限制從一個源加載的文檔或腳本如何與來自另一個源的資源進(jìn)行交互。二叉搜索樹是二的數(shù)據(jù)結(jié)構(gòu)與算法三集合前端掘金集合集合是由一組無序且唯一的項組成的。 你真的懂 JavaScript 的正則嗎? - 掘金本文內(nèi)容主要出處為《JavaScript權(quán)威指南》(第六版),筆者只是在搬磚的同時整理思路,有誤望及時指出,感...
摘要:縮進(jìn)不一致,會導(dǎo)致運(yùn)行錯誤。變量變量在使用前必須先定義即賦予變量一個值,否則會報錯數(shù)據(jù)類型布爾只有和兩個值,表示真或假。 簡介 Python 是一種高層次的結(jié)合了解釋性、編譯性、互動性和面向?qū)ο蟮哪_本語言。Python 由 Guido van Rossum 于 1989 年底在荷蘭國家數(shù)學(xué)和計算機(jī)科學(xué)研究所發(fā)明,第一個公開發(fā)行版發(fā)行于 1991 年。 特點(diǎn) 易于學(xué)習(xí):Python ...
摘要:正則表達(dá)式等待匹配的字符這里可以輸入任何繼承了的類返回一個值說明是否匹配這里需要注意的是,和均不允許通過構(gòu)造器新建一個對象。 前言 之前一直想要做一個自己的爬蟲,然后從nba數(shù)據(jù)相關(guān)的網(wǎng)上【虎撲,騰訊,官網(wǎng)等,要視網(wǎng)站是否支持】爬點(diǎn)數(shù)據(jù)寫數(shù)據(jù)分析和圖形化展示。雖然年輕的時候就實現(xiàn)過這個功能,但是當(dāng)時直接借用了一個網(wǎng)上現(xiàn)成的jar包,然后在那個基礎(chǔ)上寫了一個非常簡陋的正則表達(dá)式來提取數(shù)據(jù)...
閱讀 1513·2021-10-11 10:59
閱讀 1887·2021-09-09 11:36
閱讀 1402·2019-08-30 15:55
閱讀 1332·2019-08-29 11:20
閱讀 3066·2019-08-26 13:39
閱讀 1472·2019-08-26 13:37
閱讀 1966·2019-08-26 12:11
閱讀 1328·2019-08-23 14:28