失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > 《SEO实战密码》——SEO网站结构优化

《SEO实战密码》——SEO网站结构优化

时间:2018-12-22 16:40:55

相关推荐

《SEO实战密码》——SEO网站结构优化

一、优化网站的目的:

从seo角度看,优化网站结构要达到以下几个目的:

1、增强用户体验。

2、网站页面的收录。

3、规划好页面的权重分配。

4、内部链接锚文字的使用。

二、搜索引擎友好的网站设计:

1、避免蜘蛛陷阱。

一些网站设计技术对搜索引擎来说很不友好,不利于蜘蛛爬行和抓取,这些技术被称为蜘蛛陷阱。常见的应该全力避免的蜘蛛陷阱包括如下:

(1)、flash。

为了增强视觉效果使用flash是很正常的,这对搜索引擎的抓取影响不大,但是有些网站整个首页就是一个大的flash文件,使搜索引擎无法读取flash文件中的文字内容和链接,这就构成了蜘蛛陷阱。虽然搜索引擎在不停的尝试着读取flash文件,尤其是里面的文字内容和链接,但整个网站就是一个大的flash文件,从seo角度来说是绝对不行的,我们应该尽量使用html版本的链接。

(2)、session ID。

有些网站使用Session ID跟踪用户访问,每个用户访问网站时都会生成独特唯一的Session ID,加在URL中。搜索引擎每次访问也会被当成一个新的用户,URL中会加上一个不同的Session ID,这样搜索引擎每次来访问同一个页面都会得到不同的URL,后面带着一个不一样的session ID。搜索引擎遇到这种长长的session ID,会尝试判断字符串是Session ID还是正常参数,成功判断出Session ID就可以去掉Session ID,收录正常URL。但也经常判断不出来,要么不愿意收录,要么收录多个带有不同Session ID的URL,内容却完全一样,形成大量复制内容,这两种情况都对网站优化不利。

为了避免这种情况的发生,跟踪用户访问应该使用cookie而不要生成Session ID。或者程序判断访问者是搜索引擎还是普通用户。

(3)、各种跳转。

除了301跳转之外,搜索引擎对其他形式的跳转都比较敏感,如302跳转、javascript跳转、flash跳转、Meta Refresh跳转。如果必须转向,301转向是搜索引擎推荐的、用于网址更改的转向,可以把页面权重从旧网址转移到新网址。

(4)、框架结构。

使用框架结构设计页面,对网站的页面更新维护有一定的方便性。不过现在的网站已经很少使用框架了,不利于搜索引擎抓取是框架越来越不流行的原因之一。对搜索引擎来说,访问一个使用框架的网址所抓取的HTMl只包含调用其他HTMl文件的代码,并不包含任何文字信息,搜索引擎根本无法判断这个网址的内容是什么。虽然蜘蛛可以跟踪框架中所调用的其他HTMl文件,但是这些文件经常是不完整的页面,比如没有页面导航只是正文。搜索引擎也无法判断框架中的页面内容应该属于主框架还是属于框架调用的文件。所以,在设计网站不要使用框架结构。

(5)、动态URl。

动态URL指的是数据库驱动的网站所生成的、带有问号、等号及参数的网址。一般来说动态URl不利于搜索引擎蜘蛛爬行,应该尽量避免。

(6)、javascript链接。

搜索引擎在技术上可以获得javascript脚本中包含的链接,甚至可以执行脚本并跟踪链接,但对一些权重比较低的网站,搜索引擎觉得没有必要,不会费那个劲。所以网站上的链接必须使用最简单的HTML链接,尤其是导航系统。

如果是针对那些不希望被收录的页面,不希望传递权重的链接,则可以使用javascript脚本阻挡搜索引擎爬行。

(7)、要求登录。

有些网站内容放在用户登录后才能看到的会员区域,这部分内容搜索引擎无法看到。蜘蛛不能填写用户名、密码,也不会注册。

(8)、强制使用cookies。

强制使用cookies,用户浏览器如果没有启用cookies,页面显示不正常。搜索引擎蜘蛛就相当于禁用了一个cookies的浏览器,强制使用cookies只能造成搜索引擎无法正常访问。

2、清晰的导航。

站在用户的角度,网站导航系统主要解决两个问题:用户现在所在位置、下一步要去哪里

站在SEO角度,网站导航系统应该注意以下几点:

(1)、文字导航。尽量使用最普通的HTMl文字导航,不要使用图片作为导航链接,更不要使用javascript生成导航系统,也不要使用flash做导航。

(2)、点击距离及扁平化。良好导航的目标是使所有页面与首页的点击距离越近越好。权重普通的网站,内页离首页不要超过四五次点击。网站导航系统的安排对减少链接层次至关重要。

(3)、锚文字包含关键词。导航系统中的链接通常是分类页面获得内部链接的最主要来源,数量巨大,其锚文字对目标页面相关性有相当大的影响,因此分类名称应该尽量使用目标关键词。

(4)、面包屑导航。面包屑导航对用户和搜索引擎来说,是判断页面在网站整个结构中的位置的最好方法。正确使用面包屑导航的网站通常都是架构比较清晰的网站。

(5)、避免页脚堆积。页脚堆积是近来搜索引擎比较反感的做法,,常常被认为是作弊,造成某种惩罚。

3、子域名和目录。

搜索引擎通常会把子域名当做一个基本独立的站点来看待。也就是说和是两个互相独立的网站,而目录/news/就纯粹是的一部分。如果抛开其他因素,只看着两个URL:、/news/,子域名的权重稍微高一些,因为搜索引擎会把这个URl当做网站的首页,主域名很多时候会传递一小部分信任度给子域名。但从SEO角度看,子域名和子域名是两个完全不同的网站,要推广的也是两个网站,所有的优化工作都要多做一遍,尤其是外部链接建设,网站PR值、权重都会被这两个独立的网站分散。主域名经过外链获得高权重,不意味着子域名就获得了高权重。

4、禁止收录机制。

有的时候,站长并不希望某些页面被抓取和收录,如付费内容、还在测试阶段的页面、复制内容页面等。要确保页面不被收录,需要使用robots文件或者Meta Rotos标签。

(1)、robots文件。搜索引擎访问网站时,会先看网站根目录下有没有一个命名为robots.txt的纯文本文件,robots.txt用于指令搜索引擎禁止抓取网站的某些内容或指定允许抓取的某些内容。只有在需要禁止抓取某些内容时,写robots.txt文件才有意义。robots文件不存在或者是空文件都意味着允许搜索引擎抓取所有内容。有的服务器设置有问题,robots文件不存在时会返回200状态码及一些错误信息,而不是404错误码,所以就算允许抓取所有内容也要建一个空的robots文件,放在根目录下。

最简单的robots文件:

User-agent:*

Disallow:/

上面这个robots文件禁止所有搜索引擎抓取任何内容。

User-agent指定适用于哪个蜘蛛。通配符*代表所有搜索引擎,百度用Baiduspider;只适用于google蜘蛛则用:Goolebot。

Disallow告诉蜘蛛不要抓取某些文件或目录。例如下面的代码将阻止所有蜘蛛抓取/cgi-bin/和/tmp/两个目录的内容及文件/aa/index.html:

User-agent:*

Disallow:/cgi-bin/

Disallow:/tmp/

Disallow:/aa/index.html

Disallow禁止的内容必须分开写,每个一行。

Allow告诉蜘蛛应该抓取某些文件。由于不指定就是抓取,所以单独写就没有什么意思。allow和Disallow配合使用,可以告诉蜘蛛某个目录下大部分不允许抓取,只允许抓取一部分。但是Allow应该写在Disallow的后面。

$通配符:匹配URl结尾的。例如,下面的代码将允许蜘蛛抓取以.htm为后缀的URl:

User-agent:*

Allow:.htm$

*通配符告诉蜘蛛匹配任意一段字符。例如,下面的代码将禁止蜘蛛抓取所有htm文件:

User-agent:*

Disallow:/*.htm

(2)、meta Robots标签。

meta robots标签是页面head部分meta标签的一种,用于指令搜索引擎禁止索引本页内容。

最简单的meta robots标签格式为:

<meta name="robots" content="noindex,nofollow">

上面标签的意义是禁止所有搜索引擎索引本页面,禁止跟踪页面上的链接。

Goole、Bing、雅虎都支持的meta robots标签有:noindex(告诉蜘蛛不要索引本页面)、nofollow(告诉蜘蛛不要跟踪本页面上的所有连接)、nosnippet(不要在搜索结果中显示说明文字)、noarchive(不要显示快照)、noodp(不要使用开放目录中的标题和说明)。

百度的官方说法只支持nofollow和noarchive。

meta robots标签内容不区分大小写,可以写在一起,以逗号间隔,中间可以有空格,也可以没有。只有禁止索引时写meta robots标签才有意义。

使用了noindex meta robots标签的页面会被抓取,但不会被索引,页面URL不会出现在搜索结果中,这一点与robots文件不同。

(3)、nofollow的使用。

<a href="http:/" rel="nofollow"></a>

链接的nofollow属性只适用于本链接,上面讲的meta robots 中的nofollow指的是页面中的所有链接。

nofollow最初的目的是减少垃圾链接对搜索引擎排名的影响,标签意义是告诉搜索引擎这个链接不是经过站长自己编辑的,所以这个链接不是一个信任投票。搜索引擎看到这个标签就不会跟踪爬行链接,也不传递链接权重和锚文字。

nofollow通常用在博客评论、论坛帖子、社会化网站、留言板等地方,现在还有广告链接也有使用。

5、URL静态化

现在的网站大多是数据库驱动,页面有程序实时生成,而不是真的在服务器上有一个静态HTML文件存在。当用户访问一个网址时,程序根据URL中的参数调用数据库数据,实时生成页面内容。因此动态页面相对应的URL原始状态也是动态的,包含问号、等号及参数。搜索引擎在发展初期一般不太愿意爬行和收录动态URL,主要原因是可能陷入无限循环或收录重复内容,造成资源浪费。为了避免这种情况,建网站时最好将URL静态化。

6、URL设计。

URL在搜索结果中是显示内容之一。设计网站结构是需要对目录及文件命名系统做实现规划。总的原则是首先从用户体验出发,URL应该清晰友好、方便记忆,然后才考虑URl对排名的影响。主要有以下几个方面:

URL越短越好、避免参数太多、目录层次尽量少、文件及目录名具有描述性、URL中包含关键词、字母全部小写、连字符使用(一般用短横线分隔)、目录形式还是文件形式。

7、内部链接及权重分配

一般说来,网站首页获得的内外部链接最多,权重最高。网站结构优化要解决的最重要的问题包括收录及权重分配。大部分网站有多层分类,权重依次下降。在做网站时应该把重点页面放在内页,这样所获得的权重会比较高一些。

如果觉得《《SEO实战密码》——SEO网站结构优化》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。