成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

智聯(lián)招聘數(shù)據(jù)爬取準(zhǔn)備(2)-招聘信息頁(yè)面及企業(yè)主頁(yè)源碼解析

he_xd / 3003人閱讀

摘要:網(wǎng)頁(yè)源碼解析智聯(lián)招聘信息頁(yè)面根據(jù)招聘列表里面跳轉(zhuǎn)過(guò)來(lái)的詳細(xì)招聘信息頁(yè)面。巨優(yōu)信息是法國(guó)阿爾卡特朗訊公司企業(yè)通信系統(tǒng)全國(guó)金牌代理商,同時(shí)也是華為思科等國(guó)際知名品牌的核心合作伙伴。主頁(yè)是智聯(lián)招聘里唯一能夠讓企業(yè)自己定制的頁(yè)面了。

網(wǎng)頁(yè)源碼解析 - 智聯(lián)招聘信息頁(yè)面

根據(jù)招聘列表里面跳轉(zhuǎn)過(guò)來(lái)的詳細(xì)招聘信息頁(yè)面。爬蟲(chóng)再根據(jù)這里進(jìn)行關(guān)鍵信息提取。
相比于搜索列表頁(yè)來(lái)說(shuō),這頁(yè)內(nèi)容很簡(jiǎn)單,而我們需要的也不多。
不過(guò)需要注意的是,這里在職業(yè)信息之外還需要額外收集企業(yè)信息。
雖然另外有專門(mén)的代碼跳轉(zhuǎn)到企業(yè)主頁(yè)去搜集信息,但是閱讀源碼后發(fā)現(xiàn),每家VIP企業(yè)都可以自己定制網(wǎng)頁(yè),因此獲取基本信息不方便。
所以企業(yè)基本信息要在這一頁(yè)就收集齊(基本信息和企業(yè)主頁(yè)里是完全一樣的)。
下面開(kāi)始簡(jiǎn)單分析下各處源碼。

職位的頭信息

銷售、銷售總監(jiān)阿爾卡特?cái)?shù)據(jù)、語(yǔ)音交換機(jī)(金牌代理商)

上海巨優(yōu)信息科技有限公司

五險(xiǎn)一金年底雙薪績(jī)效獎(jiǎng)金年終分紅帶薪年假節(jié)日福利通訊補(bǔ)貼交通補(bǔ)助

可以直接用class*="inner-left"對(duì)頭信息進(jìn)行定位,然后在其中用h1標(biāo)簽為職位名稱,h2標(biāo)簽為公司名稱,class="welfare-tab-box"為福利信息。

職位基礎(chǔ)信息
  • 職位月薪:8001-10000元/月
  • 工作地點(diǎn):北京
  • 發(fā)布日期:2015-12-12
  • 工作性質(zhì):全職
  • 工作經(jīng)驗(yàn):1-3年
  • 最低學(xué)歷:大專
  • 招聘人數(shù):1人
  • 職位類別:銷售經(jīng)理

基礎(chǔ)信息定位很簡(jiǎn)單,class^="terminal-ul"就夠了。但是其中的每個(gè)信息沒(méi)有標(biāo)記,就只能用中文名稱或者是順序定位了。
信息內(nèi)容全包含在strong標(biāo)簽里。

企業(yè)基本信息

上海巨優(yōu)信息科技有限公司

定位的話,直接找到class中含有terminal-company的ul標(biāo)簽,然后按照li標(biāo)簽的順序或者按照中文文字匹配到企業(yè)基本信息。

職位描述信息
任職要求:

1、1年以上IT行業(yè)的售經(jīng)驗(yàn),以通訊產(chǎn)品及服務(wù)器產(chǎn)品為主;
2、熟悉Siemens,NEC, Panasonic,Alcatel等PBX 機(jī)型,具有VOIP組網(wǎng)的相關(guān)銷售經(jīng)驗(yàn);具備專業(yè)客戶銷售技巧;擅長(zhǎng)與客戶交流并能迅速整合客戶所需資源;
3、熟悉思科、華為、Alcatel等數(shù)據(jù)交換機(jī),具有相關(guān)銷售經(jīng)驗(yàn);具備專業(yè)客戶銷售技巧;擅長(zhǎng)與客戶交流并能迅速整合客戶所需資源; 
4、具備良好人際交往、市場(chǎng)策劃、方案演講、商務(wù)談判,有強(qiáng)烈的贏單欲望,樂(lè)于陌生人交流,善于溝通,性格穩(wěn)重、勤奮,能夠承受較大銷售業(yè)績(jī)壓力。
5、有銷售同類語(yǔ)音交換機(jī)PBX、數(shù)據(jù)交換機(jī) 產(chǎn)品經(jīng)驗(yàn)者優(yōu)先。

崗位職責(zé):

1、負(fù)責(zé)本地區(qū)維護(hù)老客戶,拓展新市場(chǎng),建立與擴(kuò)大銷售網(wǎng)絡(luò),提升銷售業(yè)績(jī),完成總部或分公司交付的銷售任務(wù);
2、建立和維護(hù)本地區(qū)的客戶關(guān)系,樹(shù)立良好的公司口碑和品牌形象;
3、負(fù)責(zé)項(xiàng)目投標(biāo)的運(yùn)作,包括商務(wù)文件的起草和整個(gè)標(biāo)書(shū)的制作與審定;負(fù)責(zé)商務(wù)合同的起草、簽署和項(xiàng)目收款工作;
4、高標(biāo)準(zhǔn)地為客戶提供優(yōu)質(zhì)服務(wù)和妥善處理客戶投訴,以提高客戶的滿意度;
5、不斷學(xué)習(xí)新知識(shí)與新技術(shù),提升自身的專業(yè)能力與職業(yè)素質(zhì);
 
工作地點(diǎn): 北京
工作地址:

北京市豐臺(tái)區(qū)南三環(huán)西路16號(hào)搜寶商務(wù)中心2號(hào)樓2608室  查看職位地圖

這個(gè)也好說(shuō),直接找到class="tab-inner-cont",然后自動(dòng)排除所有標(biāo)簽,只獲取文本信息就夠了。
需要注意的是,源碼里有2個(gè)class為tab-inner-cont的div,第1個(gè)是職位描述,第2個(gè)是企業(yè)簡(jiǎn)介。

企業(yè)簡(jiǎn)介

上面說(shuō)過(guò)了,職位描述的class也為tab-inner-cont,所以獲取的時(shí)候按順序取值就好了。

網(wǎng)頁(yè)源碼解析 - 企業(yè)主頁(yè)

智聯(lián)招聘的企業(yè)主頁(yè)分為2種:普通主頁(yè)和VIP主頁(yè)。VIP主頁(yè)是智聯(lián)招聘里唯一能夠讓企業(yè)自己定制的頁(yè)面了。
這也就形成了千奇百怪的源碼,分析起來(lái)并不容易。不過(guò)好在企業(yè)的基本信息,在招聘頁(yè)面就已經(jīng)獲得了。
剩下唯一需要的信息就是企業(yè)的所有招聘信息了,也是非常重要的地方。
招聘信息在2種不同主頁(yè)中,在源碼中也分為了2種構(gòu)建方式:

普通主頁(yè):正常的tag循環(huán)陳列

VIP 主頁(yè):在javascript中以list列表變量形式儲(chǔ)存,并動(dòng)態(tài)顯示出來(lái)。

不過(guò)說(shuō)回來(lái),這也是不確定的解析,因?yàn)樽兓嗔?,我只是隨機(jī)打開(kāi)了一些頁(yè)面參考,不能代表全部。其實(shí),最好的方法是在搜索頁(yè)面直接按公司名稱搜索,就得到他所有的招聘信息了。

那么下面開(kāi)始進(jìn)行2種源碼的分析。

普通企業(yè)主頁(yè)

職位名稱 公司名稱 職位月薪 工作地點(diǎn) 發(fā)布日期

數(shù)據(jù)庫(kù)工程師 民信阿里信息咨詢(北京)有限公司 15001-20000元 北京 2015-12-12
地點(diǎn):北京 公司性質(zhì):民營(yíng) 公司規(guī)模:1000-9999人 經(jīng)驗(yàn):3-5年 學(xué)歷:本科 職位月薪:15001-20000元

崗位職責(zé):? 1、公司核心數(shù)據(jù)庫(kù)的管理,保證數(shù)據(jù)庫(kù)正常運(yùn)轉(zhuǎn)和數(shù)據(jù)的安全;包括安裝、配置、升級(jí),數(shù)據(jù)備份、恢復(fù),性能監(jiān)控分析調(diào)優(yōu)等;?2、參與開(kāi)發(fā)設(shè)計(jì),負(fù)責(zé)數(shù)據(jù)結(jié)構(gòu)設(shè)計(jì);?3、負(fù)責(zé)公司數(shù)據(jù)倉(cāng)庫(kù)的建設(shè)。 任職要求:? 1、具有三年以上MySQL工作經(jīng)驗(yàn);?2、精通MySQL數(shù)據(jù)庫(kù)的運(yùn)行機(jī)制和體系架構(gòu);?3、精...

可以看到,大容器是class中含有positionList的div。其中每條招聘信息都是class="positionListContent"的div,職位鏈接其實(shí)非常好找,找到class="jobName"的span標(biāo)簽獲取其下a鏈接的href地址就好了。

VIP企業(yè)主頁(yè)

實(shí)際上VIP企業(yè)主頁(yè)也不全都是以下的構(gòu)建方式,發(fā)現(xiàn)了一些少數(shù)的大公司,會(huì)完全不一樣,通過(guò)代碼來(lái)看,是真沒(méi)什么辦法的。。。

可以看到,該企業(yè)所有的招聘信息都存在Javascript腳本中的叫arrJobList的變量里了。變量的格式為:arrJobList=[[第1條招聘信息],[第2條招聘信息]],是列表嵌套列表。而每條招聘信息數(shù)據(jù)的內(nèi)容為:["職位名稱","招聘網(wǎng)址","所在地點(diǎn)","城市代碼","行業(yè)名稱","行業(yè)代碼","企業(yè)名稱","企業(yè)代碼","發(fā)布日期","0","未知編號(hào)"]
其實(shí)這個(gè)地方,難點(diǎn)就在于怎么在python中獲取Javascript腳本中的變量……

文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/37661.html

相關(guān)文章

  • 智聯(lián)招聘數(shù)據(jù)爬取準(zhǔn)備(1)-智聯(lián)招聘搜索列表源碼解析

    摘要:網(wǎng)頁(yè)源碼解析智聯(lián)招聘搜索列表一開(kāi)始必須要解析智聯(lián)招聘搜索列表頁(yè),從這里更方便實(shí)現(xiàn)各種深層級(jí)數(shù)據(jù)抓取。顯示不同源碼也不同,盡量選列表模式,源碼更好解析。 網(wǎng)頁(yè)源碼解析 - 智聯(lián)招聘搜索列表 一開(kāi)始必須要解析智聯(lián)招聘搜索列表頁(yè),從這里更方便實(shí)現(xiàn)各種深層級(jí)數(shù)據(jù)抓取。網(wǎng)頁(yè)地址是:http://sou.zhaopin.com/jobs/searchresult.ashx 搜索參數(shù) 智聯(lián)招聘的服務(wù)...

    VPointer 評(píng)論0 收藏0
  • node.js 89行爬蟲(chóng)爬取智聯(lián)招聘信息

    摘要:智聯(lián)其實(shí)一共寫(xiě)了兩次,有興趣的可以在源碼看看,第一版的是回調(diào)版,只能一次一頁(yè)的爬取。 寫(xiě)在前面的話,    .......還是不寫(xiě)了,直接上效果圖。附上源碼地址 github.lonhon showImg(https://segmentfault.com/img/bVUM3F?w=714&h=543);showImg(https://segmentfault.com/img/bVUM...

    _ivan 評(píng)論0 收藏0
  • Scrapy爬取智聯(lián)招聘

    摘要:之前接了一個(gè)活,做的功能是從智聯(lián)招聘爬取招聘信息賺了幾百塊零花錢(qián)實(shí)現(xiàn)了一個(gè),如圖雖然比較丑,但是簡(jiǎn)潔明了,落落大方已經(jīng)是我水平的天花板了具體功能說(shuō)明就不了,大家都能看懂的。。。。智聯(lián)招聘鏈接網(wǎng)頁(yè)是這個(gè)樣子的,反爬蟲(chóng)不強(qiáng)。 之前接了一個(gè)活,做的功能是從智聯(lián)招聘爬取招聘信息賺了幾百塊零花錢(qián)實(shí)現(xiàn)了一個(gè)GUI,如圖:showImg(https://segmentfault.com/img/bV...

    Tamic 評(píng)論0 收藏0
  • python爬蟲(chóng)招聘網(wǎng)站(智聯(lián)

    摘要:年月日爬取,爬蟲(chóng)代碼不知道是否失效文章目錄爬蟲(chóng)目標(biāo)具體過(guò)程源碼爬蟲(chóng)目標(biāo)要求搜索大數(shù)據(jù)專業(yè),爬相關(guān)公司的招聘信息。 2021年10月7日爬取,爬蟲(chóng)代碼不知道是否失效 ...

    keelii 評(píng)論0 收藏0

發(fā)表評(píng)論

0條評(píng)論

閱讀需要支付1元查看
<