成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

基于PHP/CURL/codeIgniter的Spider Webbot爬蟲[7]常用正則表達(dá)式

wow_worktile / 2154人閱讀

摘要:驗(yàn)證是否含有等字符只能輸入漢字驗(yàn)證地址驗(yàn)證驗(yàn)證電話號(hào)碼正確格式為,,,,,。驗(yàn)證身份證號(hào)位或位數(shù)字驗(yàn)證一年的個(gè)月正確格式為和驗(yàn)證一個(gè)月的天正確格式為和。

一、校驗(yàn)數(shù)字的表達(dá)式
1 數(shù)字:^[0-9]*$
2 n位的數(shù)字:^d{n}$
3 至少n位的數(shù)字:^d{n,}$
4 m-n位的數(shù)字:^d{m,n}$
5 零和非零開頭的數(shù)字:^(0|1-9*)$
6 非零開頭的最多帶兩位小數(shù)的數(shù)字:^(1-9*)+(.[0-9]{1,2})?$
7 帶1-2位小數(shù)的正數(shù)或負(fù)數(shù):^(-)?d+(.d{1,2})?$
8 正數(shù)、負(fù)數(shù)、和小數(shù):^(-|+)?d+(.d+)?$
9 有兩位小數(shù)的正實(shí)數(shù):^[0-9]+(.[0-9]{2})?$
10 有1~3位小數(shù)的正實(shí)數(shù):^[0-9]+(.[0-9]{1,3})?$
11 非零的正整數(shù):^[1-9]d$ 或 ^([1-9][0-9]*){1,3}$ 或 ^+?1-9$
12 非零的負(fù)整數(shù):^-[1-9][]0-9"*$ 或 ^-[1-9]d*$
13 非負(fù)整數(shù):^d+$ 或 ^[1-9]d*|0$
14 非正整數(shù):^-[1-9]d*|0$ 或 ^((-d+)|(0+))$
15 非負(fù)浮點(diǎn)數(shù):^d+(.d+)?$ 或 ^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$
16 非正浮點(diǎn)數(shù):^((-d+(.d+)?)|(0+(.0+)?))$ 或 ^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$
17 正浮點(diǎn)數(shù):^[1-9]d.d|0.d[1-9]d$ 或 ^(([0-9]+.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*.[0-9]+)|([0-9]*[1-9][0-9]*))$
18 負(fù)浮點(diǎn)數(shù):^-([1-9]d.d|0.d[1-9]d)$ 或 ^(-(([0-9]+.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*.[0-9]+)|([0-9]*[1-9][0-9]*)))$
19 浮點(diǎn)數(shù):^(-?d+)(.d+)?$ 或 ^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$
二、校驗(yàn)字符的表達(dá)式
1 漢字:^[u4e00-u9fa5]{0,}$
2 英文和數(shù)字:^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$
3 長(zhǎng)度為3-20的所有字符:^.{3,20}$
4 由26個(gè)英文字母組成的字符串:^[A-Za-z]+$
5 由26個(gè)大寫英文字母組成的字符串:^[A-Z]+$
6 由26個(gè)小寫英文字母組成的字符串:^[a-z]+$
7 由數(shù)字和26個(gè)英文字母組成的字符串:^[A-Za-z0-9]+$
8 由數(shù)字、26個(gè)英文字母或者下劃線組成的字符串:^w+$ 或 ^w{3,20}$
9 中文、英文、數(shù)字包括下劃線:^[u4E00-u9FA5A-Za-z0-9_]+$
10 中文、英文、數(shù)字但不包括下劃線等符號(hào):^[u4E00-u9FA5A-Za-z0-9]+$ 或 ^[u4E00-u9FA5A-Za-z0-9]{2,20}$
11 可以輸入含有^%&",;=?$"等字符:[^%&",;=?$x22]+
12 禁止輸入含有~的字符:1+
三、特殊需求表達(dá)式
1 Email地址:^w+([-+.]w+)@w+([-.]w+).w+([-.]w+)*$
2 域名:a-zA-Z0-9{0,62}(/.a-zA-Z0-9{0,62})+/.?
3 InternetURL:[a-zA-z]+://2 或 ^http://([w-]+.)+[w-]+(/[w-./?%&=])?$
4 手機(jī)號(hào)碼:^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])d{8}$
5 電話號(hào)碼("XXX-XXXXXXX"、"XXXX-XXXXXXXX"、"XXX-XXXXXXX"、"XXX-XXXXXXXX"、"XXXXXXX"和"XXXXXXXX):^((d{3,4}-)|d{3.4}-)?d{7,8}$
6 國(guó)內(nèi)電話號(hào)碼(0511-4405222、021-87888822):d{3}-d{8}|d{4}-d{7}
7 身份證號(hào)(15位、18位數(shù)字):^d{15}|d{18}$
8 短身份證號(hào)碼(數(shù)字、字母x結(jié)尾):^([0-9]){7,18}(x|X)?$ 或 ^d{8,18}|[0-9x]{8,18}|[0-9X]{8,18}?$
9 帳號(hào)是否合法(字母開頭,允許5-16字節(jié),允許字母數(shù)字下劃線):^a-zA-Z{4,15}$
10 密碼(以字母開頭,長(zhǎng)度在6~18之間,只能包含字母、數(shù)字和下劃線):^[a-zA-Z]w{5,17}$
11 強(qiáng)密碼(必須包含大小寫字母和數(shù)字的組合,不能使用特殊字符,長(zhǎng)度在8-10之間):^(?=.d)(?=.[a-z])(?=.*[A-Z]).{8,10}$
12 日期格式:^d{4}-d{1,2}-d{1,2}
13 一年的12個(gè)月(01~09和1~12):^(0?[1-9]|1[0-2])$
14 一個(gè)月的31天(01~09和1~31):^((0?[1-9])|((1|2)[0-9])|30|31)$
15 錢的輸入格式:
16 1.有四種錢的表示形式我們可以接受:"10000.00" 和 "10,000.00", 和沒有 "分" 的 "10000" 和 "10,000":^1-9*$
17 2.這表示任意一個(gè)不以0開頭的數(shù)字,但是,這也意味著一個(gè)字符"0"不通過(guò),所以我們采用下面的形式:^(0|1-9*)$
18 3.一個(gè)0或者一個(gè)不以0開頭的數(shù)字.我們還可以允許開頭有一個(gè)負(fù)號(hào):^(0|-?1-9*)$
19 4.這表示一個(gè)0或者一個(gè)可能為負(fù)的開頭不為0的數(shù)字.讓用戶以0開頭好了.把負(fù)號(hào)的也去掉,因?yàn)殄X總不能是負(fù)的吧.下面我們要加的是說(shuō)明可能的小數(shù)部分:^[0-9]+(.[0-9]+)?$
20 5.必須說(shuō)明的是,小數(shù)點(diǎn)后面至少應(yīng)該有1位數(shù),所以"10."是不通過(guò)的,但是 "10" 和 "10.2" 是通過(guò)的:^[0-9]+(.[0-9]{2})?$
21 6.這樣我們規(guī)定小數(shù)點(diǎn)后面必須有兩位,如果你認(rèn)為太苛刻了,可以這樣:^[0-9]+(.[0-9]{1,2})?$
22 7.這樣就允許用戶只寫一位小數(shù).下面我們?cè)摽紤]數(shù)字中的逗號(hào)了,我們可以這樣:^[0-9]{1,3}(,[0-9]{3})*(.[0-9]{1,2})?$
23 8.1到3個(gè)數(shù)字,后面跟著任意個(gè) 逗號(hào)+3個(gè)數(shù)字,逗號(hào)成為可選,而不是必須:^([0-9]+|[0-9]{1,3}(,[0-9]{3})*)(.[0-9]{1,2})?$
24 備注:這就是最終結(jié)果了,別忘了"+"可以用"*"替代如果你覺得空字符串也可以接受的話(奇怪,為什么?)最后,別忘了在用函數(shù)時(shí)去掉去掉那個(gè)反斜杠,一般的錯(cuò)誤都在這里
25 xml文件:^([a-zA-Z]+-?)+[a-zA-Z0-9]+.x|X[l|L]$
26 中文字符的正則表達(dá)式:[u4e00-u9fa5]
27 雙字節(jié)字符:3 (包括漢字在內(nèi),可以用來(lái)計(jì)算字符串的長(zhǎng)度(一個(gè)雙字節(jié)字符長(zhǎng)度計(jì)2,ASCII字符計(jì)1))
28 空白行的正則表達(dá)式:ns*r (可以用來(lái)刪除空白行)
29 HTML標(biāo)記的正則表達(dá)式:<(S?)4>.?|<.? /> (網(wǎng)上流傳的版本太糟糕,上面這個(gè)也僅僅能部分,對(duì)于復(fù)雜的嵌套標(biāo)記依舊無(wú)能為力)
30 首尾空白字符的正則表達(dá)式:^s|s$或(^s*)|(s*$) (可以用來(lái)刪除行首行尾的空白字符(包括空格、制表符、換頁(yè)符等等),非常有用的表達(dá)式)
31 騰訊QQ號(hào):1-9{4,} (騰訊QQ號(hào)從10000開始)
32 中國(guó)郵政編碼:[1-9]d{5}(?!d) (中國(guó)郵政編碼為6位數(shù)字)
33 IP地址:d+.d+.d+.d+ (提取IP地址時(shí)有用)

======================================================

匹配中文字符的正則表達(dá)式: [u4e00-u9fa5]
  評(píng)注:匹配中文還真是個(gè)頭疼的事,有了這個(gè)表達(dá)式就好辦了
  匹配雙字節(jié)字符(包括漢字在內(nèi)):3
  評(píng)注:可以用來(lái)計(jì)算字符串的長(zhǎng)度(一個(gè)雙字節(jié)字符長(zhǎng)度計(jì)2,ASCII字符計(jì)1)
  匹配空白行的正則表達(dá)式:ns*r
  評(píng)注:可以用來(lái)刪除空白行
  匹配HTML標(biāo)記的正則表達(dá)式:<(S?)4>.?|<.? />
  評(píng)注:網(wǎng)上流傳的版本太糟糕,上面這個(gè)也僅僅能匹配部分,對(duì)于復(fù)雜的嵌套標(biāo)記依舊無(wú)能為力
  匹配首尾空白字符的正則表達(dá)式:^s|s$
  評(píng)注:可以用來(lái)刪除行首行尾的空白字符(包括空格、制表符、換頁(yè)符等等),非常有用的表達(dá)式
  匹配Email地址的正則表達(dá)式:w+([-+.]w+)@w+([-.]w+).w+([-.]w+)*
  評(píng)注:表單驗(yàn)證時(shí)很實(shí)用
  匹配網(wǎng)址URL的正則表達(dá)式:[a-zA-z]+://2*
  評(píng)注:網(wǎng)上流傳的版本功能很有限,上面這個(gè)基本可以滿足需求
  匹配帳號(hào)是否合法(字母開頭,允許5-16字節(jié),允許字母數(shù)字下劃線):^a-zA-Z{4,15}$
  評(píng)注:表單驗(yàn)證時(shí)很實(shí)用
  匹配國(guó)內(nèi)電話號(hào)碼:d{3}-d{8}|d{4}-d{7}
  評(píng)注:匹配形式如 0511-4405222 或 021-87888822
  匹配騰訊QQ號(hào):1-9{4,}
  評(píng)注:騰訊QQ號(hào)從10000開始
  匹配中國(guó)郵政編碼:[1-9]d{5}(?!d)
  評(píng)注:中國(guó)郵政編碼為6位數(shù)字
  匹配身份證:d{15}|d{18}
  評(píng)注:中國(guó)的身份證為15位或18位
  匹配ip地址:d+.d+.d+.d+
  評(píng)注:提取ip地址時(shí)有用
  匹配特定數(shù)字:
  ^[1-9]d*$    //匹配正整數(shù)
  ^-[1-9]d*$   //匹配負(fù)整數(shù)
  ^-?[1-9]d*$   //匹配整數(shù)
  ^[1-9]d*|0$  //匹配非負(fù)整數(shù)(正整數(shù) + 0)
  ^-[1-9]d*|0$   //匹配非正整數(shù)(負(fù)整數(shù) + 0)
  ^[1-9]d.d|0.d[1-9]d$   //匹配正浮點(diǎn)數(shù)
  ^-([1-9]d.d|0.d[1-9]d)$  //匹配負(fù)浮點(diǎn)數(shù)
  ^-?([1-9]d.d|0.d[1-9]d|0?.0+|0)$  //匹配浮點(diǎn)數(shù)
  ^[1-9]d.d|0.d[1-9]d|0?.0+|0$   //匹配非負(fù)浮點(diǎn)數(shù)(正浮點(diǎn)數(shù) + 0)
  ^(-([1-9]d.d|0.d[1-9]d))|0?.0+|0$  //匹配非正浮點(diǎn)數(shù)(負(fù)浮點(diǎn)數(shù) + 0)
  評(píng)注:處理大量數(shù)據(jù)時(shí)有用,具體應(yīng)用時(shí)注意修正
  匹配特定字符串:
  ^[A-Za-z]+$  //匹配由26個(gè)英文字母組成的字符串
  ^[A-Z]+$  //匹配由26個(gè)英文字母的大寫組成的字符串
  ^[a-z]+$  //匹配由26個(gè)英文字母的小寫組成的字符串
  ^[A-Za-z0-9]+$  //匹配由數(shù)字和26個(gè)英文字母組成的字符串
  ^w+$  //匹配由數(shù)字、26個(gè)英文字母或者下劃線組成的字符串
  在使用RegularExpressionValidator驗(yàn)證控件時(shí)的驗(yàn)證功能及其驗(yàn)證表達(dá)式介紹如下:
  只能輸入數(shù)字:“^[0-9]*$”
  只能輸入n位的數(shù)字:“^d{n}$”
  只能輸入至少n位數(shù)字:“^d{n,}$”
  只能輸入m-n位的數(shù)字:“^d{m,n}$”
  只能輸入零和非零開頭的數(shù)字:“^(0|1-9*)$”
  只能輸入有兩位小數(shù)的正實(shí)數(shù):“^[0-9]+(.[0-9]{2})?$”
  只能輸入有1-3位小數(shù)的正實(shí)數(shù):“^[0-9]+(.[0-9]{1,3})?$”
  只能輸入非零的正整數(shù):“^+?1-9*$”
  只能輸入非零的負(fù)整數(shù):“^-1-9*$”
  只能輸入長(zhǎng)度為3的字符:“^.{3}$”
  只能輸入由26個(gè)英文字母組成的字符串:“^[A-Za-z]+$”
  只能輸入由26個(gè)大寫英文字母組成的字符串:“^[A-Z]+$”
  只能輸入由26個(gè)小寫英文字母組成的字符串:“^[a-z]+$”
  只能輸入由數(shù)字和26個(gè)英文字母組成的字符串:“^[A-Za-z0-9]+$”
  只能輸入由數(shù)字、26個(gè)英文字母或者下劃線組成的字符串:“^w+$”
  驗(yàn)證用戶密碼:“^[a-zA-Z]w{5,17}$”正確格式為:以字母開頭,長(zhǎng)度在6-18之間,
  只能包含字符、數(shù)字和下劃線。
  驗(yàn)證是否含有^%&"",;=?$"等字符:“[^%&"",;=?$x22]+”
  只能輸入漢字:“^[u4e00-u9fa5],{0,}$”
  驗(yàn)證Email地址:“^w+[-+.]w+)@w+([-.]w+).w+([-.]w+)*$”
  驗(yàn)證InternetURL:“^http://([w-]+.)+[w-]+(/[w-./?%&=]*)?$”
  驗(yàn)證電話號(hào)碼:“^((d{3,4})|d{3,4}-)?d{7,8}$”
  正確格式為:“XXXX-XXXXXXX”,“XXXX-XXXXXXXX”,“XXX-XXXXXXX”,
  “XXX-XXXXXXXX”,“XXXXXXX”,“XXXXXXXX”。
  驗(yàn)證身份證號(hào)(15位或18位數(shù)字):“^d{15}|d{}18$”
  驗(yàn)證一年的12個(gè)月:“^(0?[1-9]|1[0-2])$”正確格式為:“01”-“09”和“1”“12”
  驗(yàn)證一個(gè)月的31天:“^((0?[1-9])|((1|2)[0-9])|30|31)$”
  正確格式為:“01”“09”和“1”“31”。
  匹配中文字符的正則表達(dá)式: [u4e00-u9fa5]
  匹配雙字節(jié)字符(包括漢字在內(nèi)):3
  匹配空行的正則表達(dá)式:n[s| ]*r
  匹配HTML標(biāo)記的正則表達(dá)式:/<(.)>.|<(.*) />/
  匹配首尾空格的正則表達(dá)式:(^s)|(s$)
  匹配Email地址的正則表達(dá)式:w+([-+.]w+)@w+([-.]w+).w+([-.]w+)*
  匹配網(wǎng)址URL的正則表達(dá)式:http://([w-]+.)+[w-]+(/[w- ./?%&=]*)?

匹配東京很熱的正則表達(dá)式:.*[a-zA-Z0-9]{2,5}-[0-9]{2,5}.*
匹配大阪也很熱的正則表達(dá)式.*[a-zA-Z0-9]{2,5}[0-9]{2,5}.*

 


  • ~x22 ?

  • s ?

  • x00-xff ?

  • > ?

  • 文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

    轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/31861.html

    相關(guān)文章

    • 基于PHP/CURL/codeIgniterSpider Webbot爬蟲[6]-PHP關(guān)于正則

      摘要:模式,其實(shí)就是要查找的字段。不能是數(shù)字,字母。如果是數(shù)字和字母的話,要用來(lái)表示替換字段要替換上的,可以是任意操作目標(biāo),這里可以是一段,也可以使一個(gè)變量,或者一個(gè)。 preg_replace(pattern,replacement,subject) pattern模式,其實(shí)就是要查找的字段。不能是數(shù)字,字母。如果是數(shù)字和字母的話,要用/string/來(lái)表示 replacement替換字...

      yzd 評(píng)論0 收藏0
    • 基于PHP/CURL/codeIgniterSpider Webbot爬蟲[5]-常用字符串處理函

      stristr(haystack,needle) 區(qū)分大小寫 干草堆和縫衣針//判斷haystack中是否存在needle。輸出bool真假 strstr不區(qū)分大小寫 strip_tags($string) 移除其中的HTML和PHP標(biāo)記 str_replace( ,,$string)//移除定位符號(hào) str_replace(?,,$string)//移除連續(xù)的空白 str_replace(...

      HackerShell 評(píng)論0 收藏0
    • 基于PHP/CURL/codeIgniterSpider Webbot爬蟲[0]-使用原生PHP

      摘要:學(xué)了天的,寫了一個(gè)爬蟲開源項(xiàng)目?,F(xiàn)在把所有的筆記放到記錄下來(lái),算是一個(gè)紀(jì)念。定義抓取下載的檔案對(duì)目標(biāo)檔案建立一個(gè)網(wǎng)絡(luò)連接。 學(xué)了7天的PHP/CURL,寫了一個(gè)爬蟲開源項(xiàng)目。 現(xiàn)在把所有的筆記放到Segmentfault記錄下來(lái),算是一個(gè)紀(jì)念。 https://github.com/hosinoruri/Omoikane $target=http://www.WebbotsSp...

      masturbator 評(píng)論0 收藏0
    • 基于PHP/CURL/codeIgniterSpider Webbot爬蟲[8]-預(yù)判網(wǎng)站支持壓縮

      摘要:預(yù)判壓縮,如果支持壓縮則優(yōu)先使用捕捉檔案并且壓縮范例得到捕捉到的檔案,并且進(jìn)行壓縮,并且輸出壓縮前后的大小移除標(biāo)簽還可以添加移除所有空格輸出一張顯示用的表格 預(yù)判壓縮,如果支持壓縮則優(yōu)先使用 $header[]=Accept-Encoding:compress,gzip; curl_setopt($curl_session,CURLOPT_HTTPHEADER,$header); ...

      Java3y 評(píng)論0 收藏0
    • 基于PHP/CURL/codeIgniterSpider Webbot爬蟲[9]捕捉圖像并且建立t

      1.配置好PHP的gd2模塊 2.調(diào)用LIB_thumbnail.php模塊 Full-size imageshowImg(test.jpg src=https://cdn.segmentfault.com/v-5cc2cd8e/global/img/squares.svg> Thumbnail imageshowImg(thumbnail.jpg src=https://cdn.segme...

      hss01248 評(píng)論0 收藏0

    發(fā)表評(píng)論

    0條評(píng)論

    最新活動(dòng)
    閱讀需要支付1元查看
    <