基于网站以内容和舒适度为主的理念,加上对Google搜索的智能度足够信任,我已经有半年多没打开谷歌站长工具查看网站在谷歌搜索中的问题了,这两天看了百度新推的站长工具,怀念起谷歌的,今天打开一看,被成堆的问题数据吓一跳。
全面查看了一下所有检测项目,十几封宕机通知很刺眼,不过那不是咱能解决的问题。严重的在于两处:一、404页面过多,居然达到2万多个;二、URL不统一,因为新开发的标签页面,没处理好URL中空格,造成同一个网页有两种URL。
下载了错误数据,粗粗观察,很明显可以看出问题是上次改版带来的,404页面的问题除了少部分手工纠正的URL是正常的,其他全是列表页分页静态化造成的,动态参数页码几万的都有,不懂谷歌哪里抓的链接。GoogleBot几乎常驻网站是好事,但加上我改版调试喜欢在线上做,就变成了大坏事。每次觉得一下子就没了的测试页面也会被谷歌抓取了。作业流程不规范惹的祸。。。。
标签页的URL不统一更是一个技术上的低级错误,最先用PHP的urlencode()处理的标签URL,后面因为这个函数会把空格转成”+“号,才换rawurlencode() ,空格转成标准的%20。还是因为谷歌的反应速度快,前后就两三天,全部收录了。在谷歌站长工具的”HTML改进“体现为,出现大量描述重复的网址,一看网址都是只相差一个空格的不同编码。技术退步了,以后连码农都做不回去了。。。。
总结完我的失败,换个角度看这事,是体现谷歌站长工具的强大。几乎每一项功能都是针对网站在搜索引擎中表现的要点做检测,不仅让站长及时发现问题,谷歌还给出完整的wiki文档,解释问题现象并提供良好建议。总之,谷歌站长工具和google analytics一样,呈低调而强悍。
实事求是地对比一下,百度站长工具推出也有一年半载了,给人的印象是雷声大,雨点小,每一次推出的功能,不是犹抱琵琶半遮面,放10条50条数据,就是忽悠型的,展示个数据就叫xxx处理。百度站长平台还有个特点,声称开放地与站长交流,每次算法改动都会公告,但每次公告都是含糊其辞,模棱两可,基本不提重要的点,让人知道他到底在干啥。对此种种,咱也说不上意见,说了也白说,只觉得没实在的东西又想树立权威和开放的形象,是不会成功,只能多给自己抹一点黑。当然,还是希望百度站长平台能够加大技术投入,发展强大服务站长,毕竟,百度是最大的中文搜索,对站长的意义从最近半年算法改动给站长带来影响也能看出一些。