摘要:星座屋運(yùn)勢(shì)界面最終爬取數(shù)據(jù)結(jié)果展示在上的效果下面就是使用正則實(shí)現(xiàn)的代碼,是自己一年多前花了半天時(shí)間寫的。
星座屋(http://www.xzw.com/fortune/)運(yùn)勢(shì)界面:
最終爬取數(shù)據(jù)結(jié)果展示在APP上的效果:
下面就是使用正則實(shí)現(xiàn)的代碼,是自己一年多前花了半天時(shí)間寫的?,F(xiàn)在想來(lái),如果使用Scrapy或者phpspider只用幾行代碼就搞定了,不用這么費(fèi)力氣了~
array("aries", "03/21-04/19"), "金牛座" => array("taurus", "04/20-05/20"), "雙子座" => array("gemini", "05/21-06/21"), "巨蟹座" => array("cancer", "06/22-07/22"), "獅子座" => array("leo", "07/23-08/22"), "處女座" => array("virgo", "08/23-09/22"), "天秤座" => array("libra", "09/23-10/23"), "天蝎座" => array("scorpio", "10/24-11/22"), "射手座" => array("sagittarius", "11/23-12/21"), "魔羯座" => array("capricorn", "12/22-01/19"), "水瓶座" => array("aquarius", "01/20-02/18"), "雙魚座" => array("pisces", "02/19-03/20") );*/ $constellation = isset($_REQUEST["xingzuo"]) && !empty($_REQUEST["xingzuo"]) ? trim($_REQUEST["xingzuo"]) : null; $category = isset($_REQUEST["category"]) && !empty($_REQUEST["category"]) ? intval($_REQUEST["category"]) : null; $all_xingzuo = array( "aries", "taurus", "gemini", "cancer", "leo", "virgo", "libra", "scorpio", "sagittarius", "capricorn", "aquarius", "pisces" ); $all_category = array(0,1,2,3,4,5); if(!in_array($constellation, $all_xingzuo) || !in_array($category, $all_category)){ exit("Params error"); } $domain = "http://www.xzw.com/fortune/"; $apiUrl = ""; if($category){ $apiUrl = $domain.$constellation."/".$category.".html"; } else { $apiUrl = $domain.$constellation."/"; } header("Content-type: text/html; charset=utf-8"); function getFortuneData($url){ $fortune_data = array(); $data = file_get_contents($url); $data = mb_convert_encoding($data, "utf-8", "gbk"); preg_match("/(.*)/ism", $data, $div_c_main); preg_match("/
", "{p}", $p_cont); $p_cont = preg_replace(""<[/!]*?[^<>]*?>"si","",$p_cont); $p_cont = preg_replace("/s+/","",$p_cont); //$p_cont = preg_replace(""([rn])[s]+"","",$p_cont); $p_cont = str_replace("
End
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/51993.html
摘要:星座屋運(yùn)勢(shì)界面最終爬取數(shù)據(jù)結(jié)果展示在上的效果下面就是使用正則實(shí)現(xiàn)的代碼,是自己一年多前花了半天時(shí)間寫的。 星座屋(http://www.xzw.com/fortune/)運(yùn)勢(shì)界面:showImg(https://segmentfault.com/img/bV5Qou?w=693&h=518); 最終爬取數(shù)據(jù)結(jié)果展示在APP上的效果:showImg(https://segmentfaul...
摘要:為了方便廣大的開(kāi)發(fā)者,特此統(tǒng)計(jì)了網(wǎng)上諸多的免費(fèi),為您收集免費(fèi)的接口服務(wù),做一個(gè)的搬運(yùn)工,以后會(huì)每月定時(shí)更新新的接口。將長(zhǎng)段中文切詞分開(kāi)。 為了方便廣大的開(kāi)發(fā)者,特此統(tǒng)計(jì)了網(wǎng)上諸多的免費(fèi)API,為您收集免費(fèi)的接口服務(wù),做一個(gè)api的搬運(yùn)工,以后會(huì)每月定時(shí)更新新的接口。有些接口來(lái)自第三方,在第三方注冊(cè)就可以成為他們的會(huì)員,免費(fèi)使用他們的部分接口。 百度AccessToken:針對(duì)HTTP ...
摘要:正則表達(dá)式是從字符串最頭部開(kāi)始匹配,一直到結(jié)束,需要匹配整個(gè)串匹配的時(shí)候返回包含正則匹配的串為找到所有匹配的串代表整個(gè)表達(dá)式星座運(yùn)勢(shì)匹配創(chuàng)建對(duì)象現(xiàn)在創(chuàng)建對(duì)象星座運(yùn)勢(shì)星座運(yùn)勢(shì)參考資料 Java 正則表達(dá)式 java.util.regex.Pattern java.util.regex.Matcher Match match 是從字符串最頭部開(kāi)始匹配,一直到結(jié)束,需要匹配整個(gè)串 Strin...
摘要:寫在最后近年來(lái),隨著人們思想觀念的改變,相親也逐漸得到年輕人的接受與認(rèn)可,特別是對(duì)于那些圈子比較窄,接觸不到異性的人而言。 前不久,小編刷到這樣一條短視頻,1.7億...
摘要:是一個(gè)開(kāi)源的簡(jiǎn)單的爬蟲(chóng)框架主要是通過(guò)將獲取的網(wǎng)頁(yè)信息封裝成來(lái)進(jìn)行爬取信息。作者也是一個(gè)新手。這篇文章只是提供一個(gè)入門的思路。開(kāi)啟多少個(gè)線程抓取隔多長(zhǎng)時(shí)間抓取次部分。是用來(lái)抓取元素的連接是指獲取得到的內(nèi)容。并且這個(gè)類需要實(shí)現(xiàn)。 Gecco是一個(gè)開(kāi)源的簡(jiǎn)單的java爬蟲(chóng)框架主要是通過(guò)將獲取的網(wǎng)頁(yè)信息封裝成HtmlBean來(lái)進(jìn)行爬取信息。作者也是一個(gè)新手。這篇文章只是提供一個(gè)入門的思路。如果...
閱讀 1897·2023-04-25 14:28
閱讀 1927·2021-11-19 09:40
閱讀 2827·2021-11-17 09:33
閱讀 1410·2021-11-02 14:48
閱讀 1743·2019-08-29 16:36
閱讀 3359·2019-08-29 16:09
閱讀 2944·2019-08-29 14:17
閱讀 2407·2019-08-29 14:07