收藏本站|设为首页

您现在的位置: 首页 > 新闻中心 > 建站经验 > 详细内容

深度剖析网站日志的浸染及使用体例

2012-08-31 17:35 来源: 卓杰科技 www.zhuojie.cc [ ]

这里,海魄先带加年夜熟悉一下日志的源代码,以IIS处事器日志为例,首页日志开首声明名目:

良多优化人员忽略了网站日志的浸染,而更多的优化人员只经由过程日志剖析工具去查看,所查看的内容也不外是各搜索引擎蜘蛛的访谒数目、勾留时刻、抓取页面数、抓取目录、返回代码等,真正愿意年夜代码中去看日志的,少之又少。

先不说看日志源码的浸染有多年夜,作为一个seo人员,应该把握的常识有良多,除了会做外链、内链、站内结构外,还应把握HTML代码、CMS系统、部门PHP、ASP、数据库等常识,会看网站日志也是必备手艺之一。

把握这些常识的益处有良多,例如:

#Fields: date time s-sitename s-ip cs-method cs-uri-stem cs-uri-query s-port cs-username c-ip cs(User-Agent) sc-status sc-substatus sc-win32-status sc-bytes    

第一、可以扩年夜常识面,在优化中,可以站在更宽广的角度思虑问题、解决问题;

良多采集软件会伪装成搜索引擎抓取你网站,这里经由过程日志代码可以更好的识别出来,具体识别体例以WIN操作情形为例,假设要核查蜘蛛的IP为220.181.108.78:

第二、在没有足够团队设置装备摆设的情形下,不影响进度,也就拥有了“全天候作战能力”;

第三、维护网站平安、防盗链、防采集、放挂虑匀。

此外日志源码还有一个很是适用的功能:查看网站是否被采集。

首先打开当地DOC,输入-nslookup 220.181.108.78,看返回值中是否声了然来历(如:Name: baiduspider-220-181-108-78.crawl.baidu.com,这便证实是百度蜘蛛),百度是必然会声明来历的,所有匿名的百度蜘蛛都是伪装IP,需要警语!

算是抛砖引玉了,更多日志功能,但愿老鸟们出来分享!