SEO怎么分析網(wǎng)站日志這些細(xì)節(jié)問(wèn)題

閱讀 ?·? 發(fā)布日期 2020-12-31 09:36 ?·? admin
 作為一名SEO優(yōu)化人員,對(duì)網(wǎng)站日志分析是必須要掌握的一項(xiàng)基本的技能,通過(guò)日志分析可以分析爬蟲抓取頁(yè)面有效性,通過(guò)日志分析蜘蛛返回的狀態(tài)碼能及時(shí)發(fā)現(xiàn)網(wǎng)站里面是否存在錯(cuò)誤或者蜘蛛無(wú)法爬取的頁(yè)面,網(wǎng)站建設(shè)排查網(wǎng)站頁(yè)面中存在的404錯(cuò)誤頁(yè)面等。網(wǎng)站日志既可使用工具,也可直接在看。直接在看源文件,信息會(huì)更加完整。那么網(wǎng)站日志要分析哪些數(shù)據(jù)呢?
<a href='http://lanshengjiancai.cn' target='_blank'><u>網(wǎng)站優(yōu)化</u></a>
 
  1、訪問(wèn)次數(shù)、停留時(shí)間、抓取量
 
  從這些項(xiàng)數(shù)據(jù)中可以得知: 平均每歡抓取頁(yè)面數(shù)、單頁(yè)抓取停留時(shí)間和平均每次停留時(shí)間。平均每次抓取頁(yè)面數(shù)=總抓取量/訪問(wèn)次數(shù),單頁(yè)面抓取停留時(shí)間=每次停留/每次抓取,平均每次停留時(shí)間=總停留時(shí)間訪問(wèn)次數(shù)。
 
  2、目錄抓取統(tǒng)計(jì)
 
  通過(guò)日志分析我們可以看到網(wǎng)站哪些目錄受蜘蛛喜歡、抓取目錄深度、重要頁(yè)面目錄抓取狀況、無(wú)效頁(yè)面目錄抓取狀況等。通過(guò)對(duì)比目錄下頁(yè)面抓取及收錄情況,我們可以發(fā)現(xiàn)更多問(wèn)題。對(duì)于重要目錄,我們需要通過(guò)內(nèi)外調(diào)整增加權(quán)重及爬取; 對(duì)于無(wú)效頁(yè)面,在Robots.TXT 中進(jìn)行屏蔽。
 
  3、蜘蛛爬取路徑
 
  在網(wǎng)站日志中我們可以跟蹤到特定IP 的訪問(wèn)路徑,網(wǎng)站建設(shè)如果我們跟蹤特定蜘蛛的訪問(wèn)路徑就能發(fā)現(xiàn)對(duì)于本網(wǎng)站結(jié)構(gòu)下蜘蛛的爬取路徑偏好。由此,我們可以適當(dāng)?shù)匾龑?dǎo)蜘蛛的爬取路徑,讓蜘蛛更多地爬取重要、有價(jià)值、新更新頁(yè)面。其中,爬取路徑中我們又可以分析頁(yè)面物理結(jié)構(gòu)路徑偏好以及URL 邏輯結(jié)構(gòu)爬取偏好。通過(guò)這些,可以讓我們從搜索引擎的視角去審視自己的網(wǎng)站。
 
  4、頁(yè)面抓取
 
  在網(wǎng)站日志分析中,我們可以看到具體被蜘蛛爬取的頁(yè)面。在這些頁(yè)面中,我們可以分析出蜘蛛爬取了哪些需要被禁止爬取的頁(yè)面、爬取了哪些無(wú)收錄價(jià)值頁(yè)面、爬取了哪些重復(fù)頁(yè)面URL等。為充分利用蜘蛛資源,我們需要將這些地址在Robots.txt中禁止爬取。
 
      5、訪問(wèn)狀態(tài)碼
 
  蜘蛛經(jīng)常出現(xiàn)的狀態(tài)碼包括301、404等。出現(xiàn)這些狀態(tài)碼要及時(shí)處理,以避免對(duì)網(wǎng)站造成壞的影響。
 
  6、抓取時(shí)間段
 
  通過(guò)分析對(duì)比多個(gè)單日蜘蛛小時(shí)爬取量,可以了解到特定蝴蛛對(duì)于本網(wǎng)站在特定時(shí)間的活躍時(shí)段。通過(guò)對(duì)比周數(shù)據(jù),可以看到特定蜘蛛在一周中的活躍周期。
 
  7、蜘蛛訪問(wèn)IP
 
  通過(guò)蜘蛛的IP段和前三項(xiàng)數(shù)據(jù)來(lái)判斷網(wǎng)站的降權(quán)情況,IP分析的更多用途是判斷是否存在采集蜘蛛、假蜘蛛、惡意點(diǎn)擊蜘蛛等,從而對(duì)那些訪問(wèn)來(lái)源進(jìn)行屏蔽、禁止訪問(wèn)處理,以節(jié)省帶寬資源及減輕服務(wù)器壓力,留給訪客及蜘蛛更好的訪問(wèn)體驗(yàn)。
 
     做優(yōu)化時(shí),一些細(xì)節(jié)問(wèn)題可能也會(huì)關(guān)系到我們整個(gè)SEO優(yōu)化的好壞結(jié)果,所以細(xì)節(jié)問(wèn)題我們也不能忽視它。
 
       1、網(wǎng)站圖片是否清晰明了?
 
       拿眾多企業(yè)網(wǎng)站來(lái)舉例,好多的企業(yè)網(wǎng)站中的圖片都存在或多或少的問(wèn)題,具體如下:大小不一,規(guī)格不一,圖片清晰度極差,圖片表現(xiàn)力說(shuō)服力不強(qiáng)等等的缺點(diǎn)。
 
       2、網(wǎng)站圖片是否為原創(chuàng)
  
       說(shuō)到這可能很多朋友會(huì)抱怨了。現(xiàn)在網(wǎng)站內(nèi)容要求原創(chuàng)已經(jīng)夠費(fèi)力了,怎么網(wǎng)站圖片也要求原創(chuàng)?其實(shí)從搜索引擎結(jié)果展現(xiàn)圖文并茂的形式可以看出,搜索引擎對(duì)網(wǎng)站圖片的識(shí)別已經(jīng)越來(lái)越智能化了。
 
       3、圖片與文章的相關(guān)性
 
       如果想要搜索結(jié)果以圖文并茂的形式展現(xiàn),必須為該頁(yè)面配備符合主題的相關(guān)圖片才能給予展現(xiàn)。除了這方面外,從網(wǎng)站內(nèi)容而言,網(wǎng)站建設(shè)如果網(wǎng)站圖片和網(wǎng)站內(nèi)容毫無(wú)關(guān)聯(lián)性,試問(wèn)你又能否給予網(wǎng)站訪客一個(gè)好的用戶體驗(yàn)?zāi)?所以網(wǎng)站圖片優(yōu)化也要注重相關(guān)性。
 
       4、圖片的格式和大小
 
       眾所周知,網(wǎng)站圖片的格式有jpg、gif、png常見(jiàn)的三種格式。那么到底何種網(wǎng)站的圖片是百度最喜歡的呢?很簡(jiǎn)單,我們可以看看百度官方發(fā)布的一些帶圖的文章,就不難發(fā)現(xiàn)png的格式就是更佳的格式。