成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

基于PHP/CURL/codeIgniter的Spider Webbot爬蟲[8]-預(yù)判網(wǎng)站支持壓縮

Java3y / 2768人閱讀

摘要:預(yù)判壓縮,如果支持壓縮則優(yōu)先使用捕捉檔案并且壓縮范例得到捕捉到的檔案,并且進(jìn)行壓縮,并且輸出壓縮前后的大小移除標(biāo)簽還可以添加移除所有空格輸出一張顯示用的表格

預(yù)判壓縮,如果支持壓縮則優(yōu)先使用

$header[]="Accept-Encoding:compress,gzip";
curl_setopt($curl_session,CURLOPT_HTTPHEADER,$header);

捕捉檔案并且壓縮范例

include("LIB_http.php");

// define the page
$target="http://xxx";
$ref="";
$method="GET";
$data_array="";
$web_page=http_get($target,$ref,$method,$data_array,EXCL_HEAD);

// 得到捕捉到的檔案,并且進(jìn)行壓縮,并且輸出壓縮前后的大小
$unzip_size=strlen($webpage["FILE]);
$zip_size=strlen(gzcompress($web_page["FILE"],$compression_value=9));
//$noformat_size=strlen(strip_tags($web_page["FILE"]));//strip_tags移除HTML標(biāo)簽
// 還可以添加trim移除所有空格

輸出一張顯示用的HTML表格(size)






Welcome to Omoikane

Compression report for
Unzip zip
bytes bytes







文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/31860.html

相關(guān)文章

  • 基于PHP/CURL/codeIgniterSpider Webbot爬蟲[2]-使用LIB_pa

    摘要:類似于返回的是數(shù)組格式,,其中,是需要被解釋的字符串,這里使用獲得中的網(wǎng)站首頁作為目標(biāo)是開始的字符,這里抓取作為開始因?yàn)闃?biāo)簽的屬性是這樣做就得到一個(gè)網(wǎng)站的所有關(guān)鍵字屬性可以把抓取的之類的標(biāo)簽轉(zhuǎn)化成字符串,不讓服務(wù)器進(jìn)行解釋插入到輸出的前后, ===================================================== parse_array類似于re...

    light 評(píng)論0 收藏0
  • 基于PHP/CURL/codeIgniterSpider Webbot爬蟲[0]-使用原生PHP

    摘要:學(xué)了天的,寫了一個(gè)爬蟲開源項(xiàng)目?,F(xiàn)在把所有的筆記放到記錄下來,算是一個(gè)紀(jì)念。定義抓取下載的檔案對(duì)目標(biāo)檔案建立一個(gè)網(wǎng)絡(luò)連接。 學(xué)了7天的PHP/CURL,寫了一個(gè)爬蟲開源項(xiàng)目。 現(xiàn)在把所有的筆記放到Segmentfault記錄下來,算是一個(gè)紀(jì)念。 https://github.com/hosinoruri/Omoikane $target=http://www.WebbotsSp...

    masturbator 評(píng)論0 收藏0
  • 基于PHP/CURL/codeIgniterSpider Webbot爬蟲[6]-PHP關(guān)于正則表

    摘要:模式,其實(shí)就是要查找的字段。不能是數(shù)字,字母。如果是數(shù)字和字母的話,要用來表示替換字段要替換上的,可以是任意操作目標(biāo),這里可以是一段,也可以使一個(gè)變量,或者一個(gè)。 preg_replace(pattern,replacement,subject) pattern模式,其實(shí)就是要查找的字段。不能是數(shù)字,字母。如果是數(shù)字和字母的話,要用/string/來表示 replacement替換字...

    yzd 評(píng)論0 收藏0
  • 基于PHP/CURL/codeIgniterSpider Webbot爬蟲[9]捕捉圖像并且建立t

    1.配置好PHP的gd2模塊 2.調(diào)用LIB_thumbnail.php模塊 Full-size imageshowImg(test.jpg src=https://cdn.segmentfault.com/v-5cc2cd8e/global/img/squares.svg> Thumbnail imageshowImg(thumbnail.jpg src=https://cdn.segme...

    hss01248 評(píng)論0 收藏0
  • 基于PHP/CURL/codeIgniterSpider Webbot爬蟲[5]-常用字符串處理函

    stristr(haystack,needle) 區(qū)分大小寫 干草堆和縫衣針//判斷haystack中是否存在needle。輸出bool真假 strstr不區(qū)分大小寫 strip_tags($string) 移除其中的HTML和PHP標(biāo)記 str_replace( ,,$string)//移除定位符號(hào) str_replace(?,,$string)//移除連續(xù)的空白 str_replace(...

    HackerShell 評(píng)論0 收藏0

發(fā)表評(píng)論

0條評(píng)論

最新活動(dòng)
閱讀需要支付1元查看
<