摘要:互聯(lián)網(wǎng)信息爆發(fā)式增長時(shí)代,要想做好就必須簡單了解搜索引擎基本工作原理以及自然排名機(jī)制搜索引擎工作過程是非常復(fù)雜,冬鏡在本章介紹的內(nèi)容相對于真正的搜索引擎技術(shù)來說僅僅是皮毛不過對新手已經(jīng)足夠用了,我盡量以最容易理解的方式來講解一搜索引擎蜘蛛搜
互聯(lián)網(wǎng)信息爆發(fā)式增長時(shí)代,要想做好SEO就必須簡單了解搜索引擎基本工作原理以及自然排名機(jī)制
搜索引擎工作過程是非常復(fù)雜,冬鏡SEO在本章介紹的內(nèi)容相對于真正的搜索引擎技術(shù)來說僅僅是皮毛
不過對新手SEO已經(jīng)足夠用了,我盡量以最容易理解的方式來講解
一、搜索引擎蜘蛛
搜索引擎工作原理
搜索引擎蜘蛛又稱網(wǎng)頁爬蟲。目的:抓取高質(zhì)量的網(wǎng)頁內(nèi)容。下面講幾個(gè)常見的搜索引擎蜘蛛分類:
1.1 Baiduspider(百度蜘蛛)
百度公司還有其它幾個(gè)蜘蛛:Baiduspider-news(新聞)、Baiduspider-mobile(wap)、Baiduspider-image(圖片)、Baiduspider-video(視頻),站長經(jīng)常見到的是Baiduspider和Baiduspider-image
1.2 Googlebot(谷歌蜘蛛)
還發(fā)現(xiàn)一個(gè)Googlebot-Mobile,看名字應(yīng)該是抓取wap內(nèi)容的
1.3 360Spider(360蜘蛛)
它是一個(gè)很“勤奮抓爬”的蜘蛛
1.4 Sogou News Spider(搜狗蜘蛛)
還包括如下這些:Sogou web spider、Sogou inst spider、Sogou spider2、Sogou blog、Sogou News Spider、Sogou Orion spider,看最權(quán)威的百度的robots.txt http://www.baidu.com/robots.txt 就為Sogou搜狗蜘蛛費(fèi)了不少字節(jié),占了一大塊領(lǐng)地。
其它還有很多蜘蛛就不過多介紹,SEO優(yōu)化主要針對這四個(gè)就可以,有興趣可閱讀搜索引擎蜘蛛大全這篇文章
二、搜索引擎的工作原理
搜索引擎工作原理
重慶SEO認(rèn)為搜索引擎的工作原理大致上可以分成3個(gè)階段:
1.爬行和抓取
2.預(yù)處理(建立索引)
3.輸出結(jié)果
2.1 爬行和抓取
搜索引擎蜘蛛通過鏈接發(fā)現(xiàn)鏈接的方式去訪問網(wǎng)頁,從而獲得頁面HTML代碼存入數(shù)據(jù)庫
那么搜索引擎蜘蛛又是怎樣抓取網(wǎng)頁的呢?
答:發(fā)現(xiàn)某一個(gè)鏈接 → 下載這一個(gè)網(wǎng)頁 → 加入到臨時(shí)庫 → 提取網(wǎng)頁中的鏈接 → 在下載網(wǎng)頁 → 循環(huán)
2.2 預(yù)處理(建立索引)
蜘蛛(專業(yè)術(shù)語:索引程序)對抓取來的網(wǎng)頁內(nèi)容要進(jìn)行關(guān)鍵詞提取、生成倒排索引、頁面PageRank值及TrustRank值計(jì)算、頁面關(guān)鍵詞相關(guān)性等處理以備排名程序調(diào)用,這也是搜索引擎能在極短時(shí)間內(nèi)返回搜索結(jié)果的關(guān)鍵,其中我們最關(guān)心的是PR值和相關(guān)性
2.3 輸出結(jié)果
用戶輸入關(guān)鍵詞后,排名程序調(diào)用索引庫數(shù)據(jù),程序自動匹配關(guān)鍵詞,然后按一定規(guī)則生成搜索結(jié)果展示頁面,這是因?yàn)榍懊娴念A(yù)處理,搜索引擎才能夠在很短的時(shí)間內(nèi)返回輸出結(jié)果,這里特別要提醒一下自然搜索排名和競價(jià)推廣排名是有區(qū)別的
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/126402.html
摘要:本章會對語言引擎,運(yùn)行時(shí),調(diào)用棧做一個(gè)概述。調(diào)用棧只是一個(gè)單線程的編程語言,這意味著它只有一個(gè)調(diào)用棧。查看如下代碼當(dāng)引擎開始執(zhí)行這段代碼的時(shí)候,調(diào)用棧會被清空。之后,產(chǎn)生如下步驟調(diào)用棧中的每個(gè)入口被稱為堆棧結(jié)構(gòu)。 原文請查閱這里,本文采用知識共享署名 4.0 國際許可協(xié)議共享,BY Troland。 本系列持續(xù)更新中,Github 地址請查閱這里。 這是 JavaScript 工作原...
摘要:本章會對語言引擎,運(yùn)行時(shí),調(diào)用棧做一個(gè)概述。調(diào)用棧只是一個(gè)單線程的編程語言,這意味著它只有一個(gè)調(diào)用棧。查看如下代碼當(dāng)引擎開始執(zhí)行這段代碼的時(shí)候,調(diào)用棧會被清空。之后,產(chǎn)生如下步驟調(diào)用棧中的每個(gè)入口被稱為堆棧結(jié)構(gòu)。 原文請查閱這里,本文采用知識共享署名 4.0 國際許可協(xié)議共享,BY Troland。 本系列持續(xù)更新中,Github 地址請查閱這里。 這是 JavaScript 工作原...
摘要:調(diào)用棧是單線程編程語言,意味著它只有單一的調(diào)用棧。調(diào)用棧是一種數(shù)據(jù)結(jié)構(gòu),基本記錄了程序運(yùn)行的位置。舉個(gè)例子,先來看如下所示的代碼當(dāng)引擎開始執(zhí)行這段代碼時(shí),調(diào)用棧將是空的。這正是拋出異常時(shí)棧追蹤的構(gòu)造過程這基本上就是異常拋出時(shí)調(diào)用棧的狀態(tài)。 原文 How JavaScript works: an overview of the engine, the runtime, and the c...
摘要:譯者注翻譯一個(gè)對新手比較友好的工作原理解析系列文章注意以下全部是概念經(jīng)驗(yàn)豐富的老鳥可以離場啦正文從這里開始隨著的流行團(tuán)隊(duì)們正在利用來支持多個(gè)級別的技術(shù)棧包括前端后端混合開發(fā)嵌入式設(shè)備以及更多這篇文章旨在成為深入挖掘和實(shí)際上他是怎么工作的系列 譯者注 翻譯一個(gè)對新手比較友好的 JavaScript 工作原理解析系列文章 注意: 以下全部是概念,經(jīng)驗(yàn)豐富的老鳥可以離場啦 正文從這里開始 隨...
摘要:這里有一份面試題相關(guān)總結(jié),涉及高并發(fā)分布式高可用相關(guān)知識點(diǎn),在此分享給大家,希望大家能拿到一份理想的知識點(diǎn)會陸續(xù)更新在上,覺得還算湊和的話可以關(guān)注一下噢高并發(fā)架構(gòu)消息隊(duì)列為什么使用消息隊(duì)列消息隊(duì)列有什么優(yōu)點(diǎn)和缺點(diǎn)都有什么優(yōu)點(diǎn)和缺點(diǎn)如何保證消 這里有一份面試題相關(guān)總結(jié),涉及高并發(fā)、分布式、高可用相關(guān)知識點(diǎn),在此分享給大家,希望大家能拿到一份理想的 Offer! 知識點(diǎn)會陸續(xù)更新在 Git...
閱讀 3538·2023-04-25 20:09
閱讀 3739·2022-06-28 19:00
閱讀 3060·2022-06-28 19:00
閱讀 3081·2022-06-28 19:00
閱讀 3175·2022-06-28 19:00
閱讀 2880·2022-06-28 19:00
閱讀 3047·2022-06-28 19:00
閱讀 2638·2022-06-28 19:00