摘要:在默認(rèn)的模式下,元字符和分別匹配字符串的開頭和結(jié)尾處,模式改變了這倆元字符的定義,讓他們匹配一行的開頭和結(jié)尾。可以使用非捕獲元字符或來忽略對這部分正則表達式的保存。
一、背景
工作上遇到一個這樣的需求:
用正則表達式將一個字符串中的span標(biāo)簽替換為img標(biāo)簽,并將原span標(biāo)簽的內(nèi)容放到img標(biāo)簽的src中,問題詳細描述:點我
看到這個需求,我知道應(yīng)該可以用正則表達式,可是由于之前沒怎么用,一想到正則表達式就頭大,一堆各種各樣的特殊符號,似乎沒有規(guī)律可循,有點難以理解。不過知道自己不能逃避,于是自己就去嘗試怎么寫這個正則表達式來解決我的需求,上述中提到的問題詳細描述,大概就是我思考的過程,問題提出后立馬有人解答,看完他們的答案后,慚愧,感覺到自己知識的欠缺,再不學(xué)習(xí)就老了(┬_┬)
二、正則表達式基礎(chǔ) 2.1 元字符介紹"^":^會匹配行或者字符串的起始位置,有時還會匹配整個文檔的起始位置。
"$":$會匹配行或字符串的結(jié)尾。
"b":不會消耗任何字符只匹配一個位置,常用于匹配單詞邊界 如:我想從字符串中"This is Regex"匹配多帶帶的單詞 "is" 正則就要寫成:"This is Regex".match(/is/); "b" 不會匹配is 兩邊的字符,但它會識別is 兩邊是否為單詞的邊界。
"d":匹配數(shù)字。
"w":匹配字母,數(shù)字,下劃線。等價于"[A-Za-z0-9_]"。
"s":匹配空格。
".":匹配除了換行符以外的任何字符。
"[a-zA-Z]":字符組 匹配包含括號內(nèi)元素的字符。
幾種反義:改成大寫,意思就與原來的相反。
如:
"W":匹配任何非單詞字符。等價于"1"。
"2":匹配除了abc以外的任意字符。
字符轉(zhuǎn)義:在正則表達式中元字符是有特殊的含義的,當(dāng)我們要匹配元字符本身時,就需要用到字符轉(zhuǎn)義,如:/./.test("."); // true
2.2 量詞 2.2.1 常用量詞"*"(貪婪)重復(fù)零次或更多,貪婪量詞會首先匹配整個字符串,嘗試匹配時,它會選定盡可能多的內(nèi)容,如果 失敗則回退一個字符,然后再次嘗試回退的過程就叫做回溯,它會每次回退一個字符,直到找到匹配的內(nèi)容或者沒有字符可以回退。如:
"aaaaaa".match(/a*/) // ["aaaaaa"]
"?"(懶惰)重復(fù)零次或一次,懶惰量詞使用另一種方式匹配,它從目標(biāo)的起始位置開始嘗試匹配,每次檢查一個字符,并尋找它要匹配的內(nèi)容,如此循環(huán)直到字符結(jié)尾處。如:"aaaaaa".match(/a?/) // ["a"]
"+"(占有)重復(fù)零次或更多次,占有量詞會覆蓋事個目標(biāo)字符串,然后嘗試尋找匹配內(nèi)容 ,但它只嘗試一次,不會回溯。如:
"aaaaaa".match(/a+/) // ["aaaaaa"]
"{n}" 重復(fù)n次;如:
"aaaaaa".match(/a{3}/) // ["aaa"]
"{n,m}" 重復(fù)n到m次;如:
"aaaaaa".match(/a{3,4}/) // ["aaaa"]
"{n,}" 重復(fù)n次或更多次;如:
"aaaaaa".match(/a{3,}/) // ["aaaaaa"]
"*?" 重復(fù)任意次,但盡可能少重復(fù);如:"aabab".match(/a.*?b/) // ["aab"] 為什么第一個匹配是aab(第一到第三個字符)而不是ab(第二到第三個字符)?簡單地說,因為正則表達式有另一條規(guī)則,比懶惰/貪婪規(guī)則的優(yōu)先級更高:最先開始的匹配擁有最高的優(yōu)先權(quán)。
"+?" 重復(fù)1次或更多次,但盡可能少重復(fù),與上面一樣,只是至少要重復(fù)1次。如:"aabab".match(/a.+?b/) // ["aab"]
"??" 重復(fù)0次或1次,但盡可能少重復(fù)。如:"aabab".match(/a.??b/) // ["aab"]
"{n,m}?" 重復(fù)n到m次,但盡可能少重復(fù)。如:"aaa".match(/a{1,3}?/) // ["a"]
"{n,}?" 重復(fù)n次以上,但盡可能少重復(fù)。如:"aaa".match(/a{1,}?/) // ["a"]
2.2.2 處理選項javascript中正則表達式支持的正則表達式有三個,g、i、m,分別代表全局匹配、忽略大小寫、多行模式。三種屬性可以自由組合共存。
在默認(rèn)的模式下,元字符 ^ 和 $ 分別匹配字符串的開頭和結(jié)尾處,模式 m 改變了這倆元字符的定義,讓他們匹配一行的開頭和結(jié)尾。
三、正則進階 3.1 捕獲分組正則表達式一個最重要的特性就是將匹配成功的模式的某部分進行存儲供以后使用這一能力。對一個正則表達式模式或部分模式兩邊添加圓括號將導(dǎo)致這部分表達式存儲到一個臨時緩沖區(qū)中。(可以使用非捕獲元字符 "?:", "?=", 或 "?!" 來忽略對這部分正則表達式的保存。)
所捕獲的每個子匹配都按照在正則表達式模式中從左至右所遇到的內(nèi)容存儲。存儲子匹配的緩沖區(qū)編號從 1 開始,連續(xù)編號直至最大 99 個子表達式。每個緩沖區(qū)都可以使用 "n" 訪問,其中 n 為一個標(biāo)識特定緩沖區(qū)的一位或兩位十進制數(shù)。
后向引用一個最簡單,最有用的應(yīng)用是提供了確定文字中連續(xù)出現(xiàn)兩個相同單詞的位置的能力。舉個例子:
/([a-zA-Z]+)s+1/.exec(" asd sf hello hello asd"); //["hello hello", "hello"]
解釋這個例子:
1、(b[a-zA-Z]+b) 是一個捕獲分組,它捕獲所有的單詞,
" asd sf hello hello asd".match(/([a-zA-Z]+)/g) // ["asd", "sf", "hello", "hello", "asd"]
注:加上/g這個處理選項是便于我理解,沒有這個選項的時候,只輸出第一個單詞asd。
2、s加了一個空格限制條件,所以最后一個單詞被排除,
" asd sf hello hello asd".match(/([a-zA-Z]+)s/g) ["asd ", "sf ", "hello ", "hello "]
3、"1"后向引用,
" asd sf hello hello asd".match(/([a-zA-Z]+)s+1/g) ["hello hello"]
說實話,這個例子花了我很長時間去理解,有一點點想通,感覺這個概念看起來容易,寫起來并不容易啊。
3.2 捕獲分組常有的用法(斷言)"(exp)" 匹配exp,并捕獲文本到自動命名的組里;如:
/(hello)sworld/.exec("asdadasd hello world asdasd") // ["hello world", "hello"]
"(?:exp)" 匹配exp,不捕獲匹配的文本,也不給此分組分配組號;如:
/(?:hello)sworld/.exec("asdadasd hello world asdasd") // ["hello world"]
"(?=exp)" 用來捕獲exp前面的字符,分組中的內(nèi)容不會被捕獲,也不分配組號;如:
/hellos(?=world)/.exec("asdadasd hello world asdasd") // ["hello "]
"(?!exp)" 捕獲后面不是exp的字符,同樣不捕獲分組的內(nèi)容,也不分配組號;如:
/hellos(?!world)/.exec("asdadasd hello world asdasd") //null world改變一下: /hellos(?!world)/.exec("asdadasd hello wosrlds asdasd") //["hello "]
"(?
/(?!四、Javascript中正則表達式的使用 在JavaScript中定義一個正則表達式語法為:
var reg=/hello/ 或者 var reg=new RegExp("hello")接著列舉一下JavaScript中可以使用正則表達式的函數(shù),并簡單介紹一下這些函數(shù)的作用。
4.1 String.prototype.search方法用來找出原字符串中某個子字符串首次出現(xiàn)的索引index,沒有則返回-1??梢栽诠俜轿臋n中了解更多。
"abchello".search(/hello/); // 34.2 String.prototype.replace方法用來替換字符串中的子串。簡單例子:
"abchello".replace(/hello/,"hi"); // "abchi"在官方文檔中有提到:
如果第一個參數(shù)是 RegExp對象,那么替換字符串可以插入特殊變量名$n,n是個小于100的非負整數(shù),表示插入第 n 個括號匹配的字符串。
所以我在文中一開始提到的需求就可以用
4.3 String.prototype.split方法
str.replace(/(.*?)/g, "") [$1表示/(.?)/g中的“(.?)”)匹配的字符串]
答案來解答。用來分割字符串
"abchelloasdasdhelloasd".split(/hello/); //["abc", "asdasd", "asd"]4.4 String.prototype.match方法用來捕獲字符串中的子字符串到一個數(shù)組中。默認(rèn)情況下只捕獲一個結(jié)果到數(shù)組中,正則表達式有”全局捕獲“的屬性時(定義正則表達式的時候添加參數(shù)g),會捕獲所有結(jié)果到數(shù)組中。
"abchelloasdasdhelloasd".match(/hello/); //["hello"] "abchelloasdasdhelloasd".match(/hello/g); //["hello","hello"]4.5 RegExp.prototype.exec方法和字符串的match方法類似,這個方法也是從字符串中捕獲滿足條件的字符串到數(shù)組中,但是也有兩個區(qū)別。
1、exec方法一次只能捕獲一份子字符串到數(shù)組中,無論正則表達式是否有全局屬性/hello/g.exec("abchelloasdasdhelloasd"); // ["hello"]2、正則表達式對象(也就是JavaScript中的RegExp對象)有一個lastIndex屬性,用來表示下一次從哪個位置開始捕獲,每一次執(zhí)行exec方法后,lastIndex就會往后推,直到找不到匹配的字符返回null,然后又從頭開始捕獲。 這個屬性可以用來遍歷捕獲字符串中的子串。
var reg=/hello/g; reg.lastIndex; //0 reg.exec("abchelloasdasdhelloasd"); // ["hello"] reg.lastIndex; //8 reg.exec("abchelloasdasdhelloasd"); // ["hello"] reg.lastIndex; //19 reg.exec("abchelloasdasdhelloasd"); // null reg.lastIndex; //04.6 RegExp.prototype.test方法用來測試字符串中是否含有子字符串
/hello/.test("abchello"); // true五、總結(jié)總算是對正則表達式了解了一些,要熟練掌握還需后面多多實踐^_^
參考資料:
1.http://www.cnblogs.com/zery/p...
2.http://www.cnblogs.com/tzyy/p...
3.http://www.codeyyy.com/regex/...A-Za-z0-9_ ?
abc ?
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/92369.html
摘要:改為后,顯示出文件的大概大小,單位是或者或者默認(rèn)為,顯示的文件時間為時間。 這是 Nginx 學(xué)習(xí)總結(jié)的第三篇,上一篇介紹到了 Nginx 學(xué)習(xí)總結(jié)(2) —— 基本配置,這一篇會對Location 模塊 做一些總結(jié)。我們知道,Location 模塊 主要是用于針對某些特定的 URL 進行配置,可以由前綴字符串定義,也可以由正則表達式定義。 Location 匹配規(guī)則 location...
摘要:首先推薦幾個正則表達式編輯器正則表達式是一種查找以及字符串替換操作。此表所列的常用正則表達式,除個別外均未在前后加上任何限定,請根據(jù)需要,自行處理。例如對而言,則采用一對引號來確定正則表達式的邊界。 這篇文章本來很早就要寫的,拖了挺久的,現(xiàn)在整理下,供大家學(xué)習(xí)交流哈! 基本概念 正則表達式是一種文本模式,包括普通字符(例如,a 到 z 之間的字母)和特殊字符(稱為元字符)。模式描述在搜...
摘要:用匹配的模式切割,第二個參數(shù)是限制返回結(jié)果的最大數(shù)量匹配規(guī)則字面量字符和元字符大部分字符在正則表達式中,就是字面的含義,比如匹配,匹配。它們叫做元字符,主要有以下幾個。相比之下,點號作為元字符是不包括換行符的。 1.概述 正則表達式(regular expression)是一種表達文本模式(即字符串結(jié)構(gòu))的方法。 創(chuàng)建方式有兩種方式: 一種是使用字面量,以斜杠表示開始和結(jié)束。 var ...
閱讀 2715·2021-11-25 09:43
閱讀 2097·2021-11-24 09:39
閱讀 1990·2021-11-17 09:33
閱讀 2765·2021-09-27 14:11
閱讀 1876·2019-08-30 15:54
閱讀 3237·2019-08-26 18:27
閱讀 1273·2019-08-23 18:00
閱讀 1821·2019-08-23 17:53