大家好,我是魏東東!對(duì)于很多站長來說,分析iss日志都知道很重要,但是卻很少去重視它。通常網(wǎng)站的基本數(shù)據(jù)都可以通過ga又或者百度統(tǒng)計(jì)、站長工具可以查到,但是有些東西想通過這些常用的 工具并不能全名鏈接網(wǎng)站的一些細(xì)節(jié)方面。比如說蜘蛛的爬去方式。通過iss日志我們可以很好的觀察到網(wǎng)站被搜索引擎蜘蛛爬去的方式。那么我們?yōu)楹我M(jìn)行網(wǎng)站日志分析呢。大 家可能發(fā)現(xiàn)自己網(wǎng)站的內(nèi)頁,通常情況下,搜索引擎不都是能收錄你網(wǎng)站的內(nèi)容頁。這在一方面其實(shí)跟我們的蜘蛛爬去的方式可能存在一定的關(guān)系。
iss日志我們可以做些什么呢?
1、可以間接的分析網(wǎng)站的外鏈效果
2、我們的空間的好壞
3、蜘蛛對(duì)我們的頁面哪些頁面比較喜歡哪些頁面不喜歡?
4、蜘蛛什么時(shí)候頻繁訪問我們的網(wǎng)站,我們究竟什么時(shí)候需要更新網(wǎng)站內(nèi)容
通常我們看我們的iss日志的時(shí)候,通常情況下是看有多少的200狀態(tài)嗎,那么iss日志就那么點(diǎn)功能吧,其實(shí)不然,下面通過一些方面給大家介紹一下為什么seoer要養(yǎng)成看日志的習(xí)慣。
一、iss日志重要型表現(xiàn)在那些方面?
1.通過iss日志我們可以間接的發(fā)現(xiàn)蜘蛛在爬去你網(wǎng)站的時(shí)候的頻繁度,外鏈的數(shù)量其實(shí)可以間接的反應(yīng)你網(wǎng)站的的外鏈做的成功度。蜘蛛通過外部鏈接來爬去你網(wǎng)站的的時(shí) 候的內(nèi)容,可以通過iss日志發(fā)現(xiàn)蜘蛛的抓取方式與軌跡。
2.iss日志的更新頻率與網(wǎng)站的內(nèi)容更新頻率有一定的關(guān)系,網(wǎng)站的更新同時(shí)與網(wǎng)站的微調(diào)也有一定的關(guān)系!這些我們同時(shí)可以通過網(wǎng)站的iss日志可以看見
3.我們可以通過iss日志去發(fā)現(xiàn)我們空間那些地方出現(xiàn)問題了。這些東西都可以提前做好預(yù)警。通過iss日志分析我們可以間接的分析出一個(gè)網(wǎng)站空間的穩(wěn)定性,我們可以很好
的發(fā)現(xiàn)到底哪個(gè)空間商不錯(cuò)!
4.通過蜘蛛我們可以發(fā)現(xiàn)到底哪些頁面蜘蛛頻繁抓取,這些頁面頻繁抓取對(duì)于我們的帶寬嚴(yán)重浪費(fèi)。所以我們就要好好的分析這些頻繁的頁面到底是哪些頁面老是被頻繁抓取,而 這些頁面對(duì)你并沒有多大的作用,那么我們可以通過網(wǎng)站的robots,屏蔽這些頁面被頻繁抓取。
二、如何下載日志及日志設(shè)置注意事項(xiàng)?
1.首頁我們的空間log日志分析文件中會(huì)出現(xiàn)這個(gè)iss記錄文件通過ftp從下載到本地。然后我們通過一些常用的日志分析工具可以發(fā)現(xiàn)一些規(guī)律,推薦大家使用光年日志分析 工具
2.對(duì)于大型網(wǎng)站一個(gè)iss日志會(huì)很大,用工具打開的時(shí)候會(huì)造成死機(jī),對(duì)于小型的網(wǎng)站我們會(huì)發(fā)現(xiàn)還可以,可是大網(wǎng)站的話,確實(shí)是一件難事,不過我們可以采用即時(shí)下載 iss日志。會(huì)很好的解決這些問題,不過目前很多情況下發(fā)部分日志分析工具都可以解決這些問題,具體問題具體分析吧
三、iss日志的具體分析。
1.日志的后綴名是log的我們用記事本打開,選擇格式里的自動(dòng)換行這樣看起來方便,對(duì)于BaiduSpider和Googlebot
百度蜘蛛
2012-03-13 00:47:10 W3SVC177 116.255.169.37 GET / – 80 – 220.181.51.144 Baiduspider-favo+(+ baidu /search/spider ) 200 0 0 15256 197 265
谷歌機(jī)器人
2012-03-13 08:18:48 W3SVC177 116.255.169.37 GET /robots.txt – 80 – 222.186.24.26 Googlebot/2.1+(+ google /bot ) 200 0 0 985 200 31
我們分段來解釋
2012-03-13 00:47:10 蜘蛛什么時(shí)候訪問了你網(wǎng)站
W3SVC177 這個(gè)是機(jī)器碼這個(gè)是惟一的 我們不去管它
116.255.169.37 這個(gè)IP地址是服務(wù)器的IP地址
GET 代表事件
GET后面就是蜘蛛爬取的網(wǎng)站頁面,斜杠就代表首頁
80 是端口的意思
220.181.51.144 這個(gè)IP則是蜘蛛的IP,這里告訴大家一個(gè)鑒別真假百度蜘蛛的方法,我們電腦點(diǎn)擊開始運(yùn)行輸入cmd打開命令提示符,輸入nslookup空格加蜘蛛IP點(diǎn)擊回車 ,一般真百度蜘蛛都有自己的服務(wù)器IP而假蜘蛛則沒有。
如果有時(shí)候你發(fā)現(xiàn)你的空間很多情況下又冒充百度蜘蛛的假蜘蛛來頻繁訪問你的網(wǎng)站,那么這個(gè)時(shí)候我們就要好好的去屏蔽這個(gè)ip,過度去采集我們網(wǎng)站的內(nèi)容。
200 0 0 200反應(yīng)蜘蛛抓取正常
197 265最后兩個(gè)數(shù)字則代表著訪問和下載的數(shù)據(jù)字節(jié)數(shù)。
2.我們分析的時(shí)候先看看狀態(tài)碼 200代表下載成功,304代表頁面未修改,500代表服務(wù)器超時(shí),這些東西可以去搜索下,網(wǎng)上都有詳細(xì)的說明。
3.我們可以通過蜘蛛喜歡那些頁面,來預(yù)計(jì)估測蜘蛛到底喜歡什么內(nèi)容,以后我們可以判斷我們到底該怎么寫我們網(wǎng)站內(nèi)容。
4.有時(shí)候我們可以發(fā)現(xiàn)蜘蛛在爬去我們網(wǎng)站的時(shí)候到底出現(xiàn)了那些問題,對(duì)癥下藥!
5.我們通過蜘蛛抓取的頻率可以很好的分析出那些時(shí)間段,時(shí)間頻段蜘蛛常來,然后我們趕在這個(gè)時(shí)間對(duì)岸前把我們的網(wǎng)站更新,這樣可以讓搜索引擎知道咱們網(wǎng)站是最新 的
6.蜘蛛對(duì)于我們的頁面的抓取是分等級(jí)的,是根據(jù)權(quán)重依次遞減的,一般順序?yàn)槭醉摗⒛夸涰摗?nèi)頁。
7.不同IP的蜘蛛他們的抓取頻率也是不相同的
作為一個(gè)合格的seoer人員要養(yǎng)成看日志的習(xí)慣,在日志中可以很清楚的看到我們網(wǎng)站的一切!
轉(zhuǎn)載請(qǐng)手下留情請(qǐng)保留http://www.weidongdong.com/seoer-kan-rizhi.html