不少SEO-er都應(yīng)該了解搜索引擎工作原理繁多復(fù)雜,大致一般分為三大步奏:爬行和抓取,建立索引和排名。當(dāng)然SEO-er優(yōu)化網(wǎng)站,目的在于提高關(guān)鍵詞排名,增加產(chǎn)品曝光率。為此SEO-er們更加看重排名這一環(huán)節(jié),筆者在此對(duì)搜索引擎工作原理之排名做個(gè)小小的經(jīng)驗(yàn)之談。
搜索引擎面對(duì)的用戶大部分是通過鍵入關(guān)鍵詞返回一個(gè)列表頁面,這個(gè)結(jié)構(gòu)頁面是大量的搜索索引庫(kù)而建立起來的。當(dāng)然這里這個(gè)頁面是指自然搜索結(jié)果。那么搜索引擎是如何完成排名這以環(huán)節(jié)的呢?我們無妨看看整體思維圖。

一、對(duì)提交的搜索請(qǐng)求分析
搜索用戶在搜索引擎上鍵入關(guān)鍵詞,提交搜索請(qǐng)求,一步一步找到匹配的網(wǎng)頁顯示出來。當(dāng)我們鍵入關(guān)鍵詞提交(按下回車)給搜索引擎時(shí),搜索引擎便會(huì)對(duì)這次搜索請(qǐng)求進(jìn)行詳細(xì)分析。
1、中文分詞
中文分詞是各大搜索引擎中重要的環(huán)節(jié),中文分詞能夠更加明確掌握搜索請(qǐng)求的重點(diǎn)所在,時(shí)期更好地頁面展示給搜索用戶。
百度中文分詞常見的以下三種:
a、基于字符串匹配
在基于字符串匹配中正向最大匹配法、逆向最大匹配法、最少切分這三種又比較常見。
正向最大匹配法:利用關(guān)鍵詞查詢的時(shí)候,在百度排名第一位的是以標(biāo)題和搜索的長(zhǎng)尾詞相符合,說明在網(wǎng)站條件相當(dāng)?shù)那闆r下,先顯示標(biāo)題匹配的網(wǎng)頁。
逆向最大匹配法:剛剛是正向最大匹配法相反的規(guī)則,即從右往左反向進(jìn)行拆分和組合。
最少切分:最小切分就是將一個(gè)個(gè)詞組切分為最細(xì)化,甚者會(huì)一個(gè)字出現(xiàn)。
b、理解分詞方法
理解分詞方法:搜索引擎模擬人的思維,對(duì)其語句的理解進(jìn)行分詞技術(shù)。通過對(duì)存儲(chǔ)的詞語和語句的整合,進(jìn)行分詞理解。其基本思想就是在分詞的同時(shí)進(jìn)行句法、語義分析,利用句法信息和語義信息來處理歧義現(xiàn)象。它通常包括三個(gè)部分:分詞子系統(tǒng)、句法語義子系統(tǒng)、總控部分。在總控部分的協(xié)調(diào)下,分詞子系統(tǒng)可以獲得有關(guān)詞、句子等的句法和語義信息來對(duì)分詞歧義進(jìn)行判斷,即它模擬了人對(duì)句子的理解過程。
c、統(tǒng)計(jì)分詞方法
相鄰的字同時(shí)出現(xiàn)的次數(shù)越多,中文分詞就會(huì)可能把出現(xiàn)相鄰的字當(dāng)成你一個(gè)詞。我們常常不是使用粗體,黑體這些嗎?原因還在于這對(duì)于搜索引擎理解同樣有利。
2、去掉停止詞
搜索用戶在鍵入關(guān)鍵詞時(shí),或多或少會(huì)出現(xiàn)不少停止詞,像“的”“嗎”,這樣才能最大限度的顯示最相關(guān),最能夠滿足用戶體驗(yàn)的結(jié)果頁面。
3、處理符號(hào)
搜索引擎還是很看重標(biāo)點(diǎn)符號(hào)的,因此我們SEO-er在編輯文章的時(shí)候,應(yīng)當(dāng)注意標(biāo)點(diǎn)符號(hào)的合理使用,尤其是在文章標(biāo)題上。
二、匹配搜索請(qǐng)求
當(dāng)搜索引擎接收到搜索請(qǐng)求詳細(xì)分析之后,便會(huì)匹配URL(當(dāng)然重點(diǎn)是標(biāo)題和摘要片段),匹配的URL成千上萬個(gè),怎樣才能有序顯示出來了,這就需要搜索引擎按URL的匹配程度排序。
三、對(duì)匹配網(wǎng)頁排名
為匹配的網(wǎng)頁排序,其實(shí)就是搜索引擎對(duì)匹配的網(wǎng)頁進(jìn)行篩選,挑選的過程,然后按照一定的順序整理出結(jié)構(gòu)的行為。當(dāng)然搜索引擎都會(huì)給每個(gè)網(wǎng)頁一個(gè)值,即權(quán)重(SEO-er們自我定義),通過判斷該網(wǎng)頁對(duì)搜索引擎和用戶體驗(yàn)的價(jià)值進(jìn)行排序排名。提高排名的因素多種多樣,目前基本上是參考HITS算法,TrustRank信任指數(shù)算法、PR值等等。
筆者比較淺顯的談?wù)剛(gè)人的看法,不知道SEO-er有什么想法,不妨補(bǔ)充交流。對(duì)于網(wǎng)絡(luò)優(yōu)化人員來說,必須充分了解和掌握搜索引擎工作原理,但是不少SEO-er了解的太少,望大家同進(jìn)步,同向前看。
文章由重慶SEO(http://www.seoread.org/post/rank-principle.html)編寫,轉(zhuǎn)載時(shí)請(qǐng)以鏈接形式注明來源。
推薦閱讀
電商網(wǎng)站基本模塊網(wǎng)頁標(biāo)題描寫方法
一、什么是網(wǎng)頁標(biāo)題 在瀏覽一個(gè)網(wǎng)頁時(shí),通過瀏覽器頂端的藍(lán)色顯示條出現(xiàn)的信息就是網(wǎng)頁標(biāo)題。 如下圖所示。網(wǎng)頁標(biāo)題就是整個(gè)網(wǎng)頁的題目,是對(duì)其內(nèi)容的高度概括和總結(jié)。網(wǎng)頁標(biāo)題作為網(wǎng)友第一眼看到的網(wǎng)頁信息傳遞之所>>>詳細(xì)閱讀
本文標(biāo)題:搜索引擎工作原理之排名大揭秘
地址:http://www.geekbao.cn/a/34/20120326/44329.html