xsqhq 发表于 2012-6-9 09:57:04

教你用IIS去看百度蛛蛛IP

本文只贡参考让人人对IIS日志各引擎的蜘蛛IP有个更深的调查.以次来判定网站当前的形态状况.下面我们专说百度蜘蛛爬过的每个纷歧样的IP代表什么!
  
  依据分歧的IP我们可以剖析网站是个如何的形态.下面就依照我IIS日志上的百度蜘蛛IP为例:
  
  123.125.68.*这个蜘蛛常常来,其余来的少,透露表现网站能够要进入沙盒了,或被者降权。
  
  220.181.68.*天天这个IP段只增不减很有能够进沙盒或K站。
  
  220.181.7.*、123.125.66.*代表百度蜘蛛IP拜访,预备抓取你器械。
  
  121.14.89.*这个ip段作为渡过新站调查期。
  
  203.208.60.*这个ip段呈现在新站及站点有不正常景象后。
  
  210.72.225.*这个ip段不连续巡查各站。
  
  125.90.88.*广东茂名市电信也属于百度蜘蛛IP首要形成成分,是新上线站较多,还有运用过站长东西,或SEO综合检测形成的。
  
  220.181.108.95这个是百度抓取首页的专用IP,如是220.181.108段的话,根本来说你的网站会天天隔夜快照,绝对错不了的,我包管。
  
  220.181.108.92同上98%抓取首页,能够还会抓取其他(不是指内页)220.181段属于权重IP段此段爬过的文章或首页根本24小时放出来。
  
  123.125.71.106抓取内页收录的,权重较低,爬过此段的内页文章不会很快放出来,因不是原创或采集文章。
  
  220.181.108.91属于综合的,首要抓取首页和<SPAN style="FONT-FAMILY: " Times New Roman?;font-size:10.5pt;mso-spacerun:?yes?;?>wc;xsqsoimh内页或其他,属于权重IP段,爬过的文章或首页根本24小时放出来。
  
  220.181.108.75重点抓取更新文章的内页到达90%,8%抓取首页,2%其他。权重IP段,爬过的文章或首页根本24小时放出来。
  
  220.181.108.86专用抓取首页IP权重段,普通返回代码是30400代表未更新。
页: [1]
查看完整版本: 教你用IIS去看百度蛛蛛IP