- 資訊首頁(yè) > 互聯(lián)網(wǎng) > 域名資訊 >
- seo日志分析怎么分析?
通過(guò)網(wǎng)站日志可以清楚的得知用戶(hù)在什么IP、什么時(shí)間、用什么操作系統、什么瀏覽器、什么分辨率顯示器的情況下訪(fǎng)問(wèn)了你網(wǎng)站的哪個(gè)頁(yè)面,是否訪(fǎng)問(wèn)成功。對于專(zhuān)業(yè)從事搜索引擎優(yōu)化工作者而言,網(wǎng)站日志可以記錄各搜索引擎蜘蛛機器人爬行網(wǎng)站的詳細情況,例如:哪個(gè)IP的百度蜘蛛機器人在哪天訪(fǎng)問(wèn)了網(wǎng)站多少次,訪(fǎng)問(wèn)了哪些頁(yè)面,以及訪(fǎng)問(wèn)頁(yè)面時(shí)返回的HTTP狀態(tài)碼。
常見(jiàn)的蜘蛛名稱(chēng):
Baiduspider:百度蜘蛛
Baiduspider-Image:百度圖片蜘蛛
Googlebot:谷歌機器人
Googlebot-Image:谷歌圖片機器人
360Spider:360蜘蛛
sogou spider:搜狗蜘蛛
網(wǎng)站日志數據分析
1、網(wǎng)站日志中數據量過(guò)大,所以我們一般需要借助網(wǎng)站日志分析工具來(lái)查看。常用的日志分析工具有:光年日志分析工具、web log exploer、愛(ài)站工具包等。
117.26.203.167 - - [02/May/2011:01:57:44 -0700] "GET/index.php HTTP/1.1" 500 19967 "-" "Mozilla/4.0 (compatible; MSIE 8.0;Windows NT 5.1; Trident/4.0; AskTbCS-ST/5.11.3.15590; .NET CLR 2.0.50727; Alexa Toolbar)"
分析:
117.26.203.167訪(fǎng)問(wèn)ip
02/May/2011:01:57:44 -0700訪(fǎng)問(wèn)日期 -時(shí)區
GET/index.php HTTP/1.1根據HTTP/1.1協(xié)議抓取(域名下)/index.php這個(gè)頁(yè)面(GET表示服務(wù)器動(dòng)作)
500服務(wù)器響應狀態(tài)碼
服務(wù)器響應狀態(tài)碼通常狀態(tài)碼有以下幾種:200,301,302,304,404,500等。200代表用戶(hù)成功的獲取到了所請求的文件,如果是搜索引擎,則證明蜘蛛在這次爬行中順利的發(fā)現了一些新的內容。而301則代表用戶(hù)所訪(fǎng)問(wèn)的某個(gè)頁(yè)面url已經(jīng)做了301重定向(永久性)處理,302則是暫時(shí)性重定向。404則代表所訪(fǎng)問(wèn)的頁(yè)面已經(jīng)不存在了,或者說(shuō)訪(fǎng)問(wèn)的url根本就是個(gè)錯誤的。500則是服務(wù)器的錯誤。
19967表示抓取了19967個(gè)字節
Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; AskTbCS-ST/5.11.3.15590; .NET CLR 2.0.50727; Alexa Toolbar表示訪(fǎng)問(wèn)者使用火狐瀏覽器及Alexa Toolbar等訪(fǎng)問(wèn)端信息
2、如果你的日志里格式不是如此,則代表日志格式設置不同。
3、很多日志里可以看到 200 0 0和200 0 64則都代表正常抓取。
4、抓取頻率是通過(guò)查看每日的日志里百度蜘蛛抓取次數來(lái)獲知。抓取頻率并沒(méi)有一個(gè)規范的時(shí)間表或頻率數字,我們一般通過(guò)多日的日志對比來(lái)判斷,當然,我們希望百度蜘蛛每日抓取的次數越多越好。
5、有時(shí)候我們的路徑不統一出現帶斜杠和不帶斜杠的問(wèn)題,蜘蛛會(huì )自動(dòng)識別為301跳轉到帶斜杠的頁(yè)面,這里我們就發(fā)現了搜索引擎是可以判斷我們的目錄的,所以我們要對我們的目錄進(jìn)行統一。
6、我們分析日志分析時(shí)間長(cháng)了,我們能夠看出蜘蛛的抓取規律,同一目錄下面的單個(gè)文件的抓取頻率間隔和不同目錄的抓取頻率間隔都可以看出來(lái),這些抓取頻率間隔時(shí)間是蜘蛛根據網(wǎng)站權重和網(wǎng)站更新頻率來(lái)自動(dòng)確定的。
7、蜘蛛對于我們的頁(yè)面的抓取是分等級的,是根據權重依次遞減的,一般順序為首頁(yè)、目錄頁(yè)、內頁(yè)。
通過(guò)網(wǎng)站日志我們能知道什么?
1、我們買(mǎi)的空間是否能夠穩定?
2、蜘蛛對我們的那些頁(yè)面比較喜歡而對哪些不喜歡?
3、蜘蛛什么時(shí)候抓取我們的網(wǎng)站頻繁,我們需要什么時(shí)候更新內容。
來(lái)源鏈接:https://www.juming.com/zx/14667.html
本站聲明:網(wǎng)站內容來(lái)源于網(wǎng)絡(luò ),如有侵權,請聯(lián)系我們,我們將及時(shí)處理。
免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng )、來(lái)自本網(wǎng)站內容采集于網(wǎng)絡(luò )互聯(lián)網(wǎng)轉載等其它媒體和分享為主,內容觀(guān)點(diǎn)不代表本網(wǎng)站立場(chǎng),如侵犯了原作者的版權,請告知一經(jīng)查實(shí),將立刻刪除涉嫌侵權內容,聯(lián)系我們QQ:712375056,同時(shí)歡迎投稿傳遞力量。
Copyright ? 2009-2022 56dr.com. All Rights Reserved. 特網(wǎng)科技 特網(wǎng)云 版權所有 特網(wǎng)科技 粵ICP備16109289號
域名注冊服務(wù)機構:阿里云計算有限公司(萬(wàn)網(wǎng)) 域名服務(wù)機構:煙臺帝思普網(wǎng)絡(luò )科技有限公司(DNSPod) CDN服務(wù):阿里云計算有限公司 百度云 中國互聯(lián)網(wǎng)舉報中心 增值電信業(yè)務(wù)經(jīng)營(yíng)許可證B2
建議您使用Chrome、Firefox、Edge、IE10及以上版本和360等主流瀏覽器瀏覽本網(wǎng)站