一、网站架构
1、二级域名的使用
因为业务的地域性扩张或者内容的分割,对于大型网站来说,二级域名的使用是不可避免的。2006年我们做第一个分站时也分别讨论了两种方案,一种是先按业务划分,再按地域划分,如:http://wuxi.sell.housexxx.com ;另一种是先按地域划分,再按业务划分,如:http://sell.wx.housexxx.com ,这两种分法都都先例前一种是新浪房产在用,后一种是搜房在用。后来考虑到分站以后的业务扩展的差异性,使用了第二种方案。对于在各分站开展的各项业务也就顺理成章的变成三级域名。
网:http://www.wfuwu.com/
众所周知,二级域名或者三级域名对于搜索引擎来说就是一个独立的网站。对于大型网站开通众多二级域名有什么好处呢。呵呵,好处是摆在明处的,链接啊,你有100个二级域名就相当于100个网站,相互的交叉链接,了不得啊。另外一个好处不能明说,就是可以开一些二级域名出来做测试域名,就算被K了也不会影响到主站。没有自己DNS服务器的小站长也不要遗憾,只要有自己服务器,加一个DNS服务是很简单的。使用虚拟主机的朋友,只能说抱歉了,国内包括很多大的域名注册商(比如万网)的二级域名解析都很慢,不用说其他的这些了。
2、多服务器架构下对搜索引擎的影响
对于大型网站来说,使用负载均衡技术相当普遍,常见的是基于LVS的Linux负载均衡技术,部分网站也可能是使用F5这样的专用设备。对于使用反向代理的网站,从外部访问就是一个IP,就不存在什么问题了。如果是采用双机热备方式的网站,一旦主服务器宕机,负载就自动切换到从服务器上,这样服务器的IP会变化,更尴尬的是有一段时间,我们的数据同步没做好,百度快照总是不对劲,我还以为是百度数据倒回,结果是我们自己数据倒回,真是汗啊。所以服务器的稳定对搜索引擎优化来说是一件很重要的事情。
3、目录的部署
大家都知道,目录的权重高于页面,那么用Rewrite把网站做全站伪静态就成了一个必然的选择。配置Rewrite很简单,只要在httpd.conf里面加上Mod_rewrite模块,然后写上你的规则就可以了,如果是Apache服务器通常是去掉前面的注释,具体操作网上有非常多的教程,就不赘述了。如果是虚拟主机用户,可以在网站根目录下加上.htaccess文件,文件里面写上你的规则,国外主机基本上都是支持Rewrite的,国内支持Rewrite的虚拟主机也越来越多了。
做完上面这些后,网站就变成全是目录这样的形式了,是不是挺清爽的。别急,下面是关键。当你做完这一切,你会发现,搜索引擎并不收录你修改过的页面,应该说Google还是逐步的更新链接的,而百度是很少更新的。用site命令看一下收录的页面,还是令人沮丧的.html文件,更糟糕的是还有一些动态文件。原因很简单,我们只是更改了页面的链接,而页面的内容和原来完全一样,并且原来的内容依然可以访问到,搜索引擎不会收录两张完全相同的页面,相似度100%的页面。因此网站的结构上线前就应该规划好,就省去了以后的很多麻烦,我个人的习惯是在网站上线前用Robots.txt把所有的搜索引擎都屏掉。如果发生了这种情况该怎么办?做一次全新的改版吗,大可不必那么费事,在文件头部加上301跳转就可以了。
具体代码:
if(strpos($_SERVER['REQUEST_URI'],”list.php”)!==false){ $id = intval($_GET["id"]);
Header(”HTTP/1.1 301 Moved Permanently”);
Header(”Location: http://newhouse.housexxx.com/list-”.$id.”/“); unset($id); }
上一篇 浅谈网页UI之Logo篇