昆明軒創(chuàng)科技有限公司手機網(wǎng)站

掃一掃,進入手機站

×
Website-knowledge
網(wǎng)站建設知識

專業(yè)網(wǎng)站建設機構-為您量身打造最適合您的網(wǎng)站 您現(xiàn)在的位置:首頁 網(wǎng)站建設知識>昆明網(wǎng)站建設中爬行、抓取等分別指的是什么?

昆明網(wǎng)站建設中爬行、抓取等分別指的是什么?
作者:zheise.cn     時間:2017-08-01 13:02:14    點擊:

    昆明網(wǎng)站建設的客戶在網(wǎng)站做完以后都會自己來研究SEO,在SEO領域會有一些專業(yè)術語,比如說爬行、抓取、索引、收錄等等,那么這些詞語是什么意思呢?小編來給大家解答。

索引

索引指的是將一個URL的信息進行整理,存入數(shù)據(jù)庫,也就是索引庫,用戶搜索時,搜索引擎從索引庫中提取URL信息并排序展現(xiàn)出來。索引的英文是index。索引庫是用于搜索的,所以被索引的URL是可以被用戶搜索到的,沒有被索引的URL用戶在搜索結果中是看不到的。
要注意的是,所謂“一個URL的信息“,并不限于蜘蛛從URL上抓取來的內容,還有來自其它來源的信息,如外部鏈接、鏈接的錨文字等。有的時候,索引庫中關于這個URL的的信息,根本沒有從這個URL抓取來的內容,但搜索引擎知道這個URL的存在,并且有一些其它信息。
抓取和索引不是一回事。

爬行

爬行指的是搜索引擎蜘蛛從已知頁面上解析出鏈接指向的URL,然后沿著鏈接發(fā)現(xiàn)新頁面(也就是鏈接指向的URL)的過程。當然,蜘蛛并不是發(fā)現(xiàn)新URL馬上就爬過去抓取新頁面,而是把發(fā)現(xiàn)的URL存放到待抓地址庫中,蜘蛛按照一定順序從地址庫中提取要抓取的URL。

收錄

我個人覺得收錄和索引沒有區(qū)別。只不過收錄是從搜索用戶角度看的,搜索時能找到這個URL,就是這個URL被收錄了。從搜索引擎角度看,URL被收錄了,也就是這個URL的信息在索引庫中存在。英文并沒有收錄這個詞,和索引用的是同一個詞index。

抓取

抓取是搜索引擎蜘蛛從待抓地址庫中提取要抓的URL,訪問這個URL,把讀取的HTML代碼存入數(shù)據(jù)庫。蜘蛛的抓取就是像瀏覽器一樣打開這個頁面,和用戶瀏覽器訪問一樣,也會在服務器原始日志中留下記錄。


以上內容有昆明軒創(chuàng)科技(zheise.cn)搜集整理,如需轉載請注明出處!

原文分享地址:該篇文章的的地址:http://zheise.cn/News/1573.html
相關文章推薦