成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

基于PHP/CURL/codeIgniter的Spider Webbot爬蟲[6]-PHP關(guān)于正則表

yzd / 3362人閱讀

摘要:模式,其實(shí)就是要查找的字段。不能是數(shù)字,字母。如果是數(shù)字和字母的話,要用來表示替換字段要替換上的,可以是任意操作目標(biāo),這里可以是一段,也可以使一個(gè)變量,或者一個(gè)。

preg_replace(pattern,replacement,subject)

pattern模式,其實(shí)就是要查找的字段。不能是數(shù)字,字母。如果是數(shù)字和字母的話,要用/string/來表示
replacement替換字段 要替換上的string,可以是任意
subject操作目標(biāo),這里可以是一段string,也可以使一個(gè)變量,或者一個(gè)http_get()。

preg_match(pattern,subject)這個(gè)只返回bool真假
preg_match_all(pattern,subject,result_array)這個(gè)在返回bool真假的同時(shí),還會(huì)返回一個(gè)二維數(shù)組,里面有相似的字符,還有把這個(gè)string作為一個(gè)數(shù)組元素
preg_split(pattern,subject)
如果在subject中找到了pattern,就在該處進(jìn)行切割,并且不保留pattern
//返回result_array[0]=前半段,result_array[1]=后半段

$subject_string="there are 129 stories about Tim and another 3129 about Tom";
/這是要匹配的內(nèi)容/ 這是pattern
$subject_string //這是target字符串

preg_match_all("/d/",$subject_string,$matches_array);

$matches_array=Array([0]=>1 [1]=>2 [2]=>9)

跳脫符

匹配數(shù)字
d可以表示多帶帶一個(gè)數(shù)字,這樣一個(gè)下標(biāo)代表一個(gè)數(shù)字
ffffd 可以代表3個(gè)數(shù)字,并且一個(gè)下標(biāo)代表三個(gè)數(shù)字
d+表示取一整塊數(shù)字,直到最后一位不是數(shù)字

匹配字母
D匹配一個(gè)字母,
DDD匹配3個(gè)字母,但是,如果不加上進(jìn)行邊界定位,就會(huì)匹配所有含有三個(gè)字母的情況
比如Tom,Tom,There之中的the,也會(huì)被抓取

/DDD/這樣可以正確匹配3個(gè)字母,等價(jià)于/D{3}/

萬用字元

文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/20805.html

相關(guān)文章

  • 基于PHP/CURL/codeIgniterSpider Webbot爬蟲[0]-使用原生PHP

    摘要:學(xué)了天的,寫了一個(gè)爬蟲開源項(xiàng)目。現(xiàn)在把所有的筆記放到記錄下來,算是一個(gè)紀(jì)念。定義抓取下載的檔案對(duì)目標(biāo)檔案建立一個(gè)網(wǎng)絡(luò)連接。 學(xué)了7天的PHP/CURL,寫了一個(gè)爬蟲開源項(xiàng)目。 現(xiàn)在把所有的筆記放到Segmentfault記錄下來,算是一個(gè)紀(jì)念。 https://github.com/hosinoruri/Omoikane $target=http://www.WebbotsSp...

    masturbator 評(píng)論0 收藏0
  • 基于PHP/CURL/codeIgniterSpider Webbot爬蟲[8]-預(yù)判網(wǎng)站支持壓縮

    摘要:預(yù)判壓縮,如果支持壓縮則優(yōu)先使用捕捉檔案并且壓縮范例得到捕捉到的檔案,并且進(jìn)行壓縮,并且輸出壓縮前后的大小移除標(biāo)簽還可以添加移除所有空格輸出一張顯示用的表格 預(yù)判壓縮,如果支持壓縮則優(yōu)先使用 $header[]=Accept-Encoding:compress,gzip; curl_setopt($curl_session,CURLOPT_HTTPHEADER,$header); ...

    Java3y 評(píng)論0 收藏0
  • 基于PHP/CURL/codeIgniterSpider Webbot爬蟲[7]常用正則達(dá)式

    摘要:驗(yàn)證是否含有等字符只能輸入漢字驗(yàn)證地址驗(yàn)證驗(yàn)證電話號(hào)碼正確格式為,,,,,。驗(yàn)證身份證號(hào)位或位數(shù)字驗(yàn)證一年的個(gè)月正確格式為和驗(yàn)證一個(gè)月的天正確格式為和。 一、校驗(yàn)數(shù)字的表達(dá)式 1 數(shù)字:^[0-9]*$ 2 n位的數(shù)字:^d{n}$ 3 至少n位的數(shù)字:^d{n,}$ 4 m-n位的數(shù)字:^d{m,n}$ 5 零和非零開頭的數(shù)字:^(0|1-9*)$ 6 非零開頭的最多帶兩位小數(shù)的數(shù)字...

    wow_worktile 評(píng)論0 收藏0
  • 基于PHP/CURL/codeIgniterSpider Webbot爬蟲[9]捕捉圖像并且建立t

    1.配置好PHP的gd2模塊 2.調(diào)用LIB_thumbnail.php模塊 Full-size imageshowImg(test.jpg src=https://cdn.segmentfault.com/v-5cc2cd8e/global/img/squares.svg> Thumbnail imageshowImg(thumbnail.jpg src=https://cdn.segme...

    hss01248 評(píng)論0 收藏0
  • 基于PHP/CURL/codeIgniterSpider Webbot爬蟲[5]-常用字符串處理函

    stristr(haystack,needle) 區(qū)分大小寫 干草堆和縫衣針//判斷haystack中是否存在needle。輸出bool真假 strstr不區(qū)分大小寫 strip_tags($string) 移除其中的HTML和PHP標(biāo)記 str_replace( ,,$string)//移除定位符號(hào) str_replace(?,,$string)//移除連續(xù)的空白 str_replace(...

    HackerShell 評(píng)論0 收藏0

發(fā)表評(píng)論

0條評(píng)論

最新活動(dòng)
閱讀需要支付1元查看
<