清理垃圾代码是指删除页面中的多余代码。一个页面经过垃圾代码清理后,可以删除接近80%的多余代码。然而,什么样的代码才是垃圾代码呢?
1.垃圾代码简
垃圾代码就是指删除后不会影响页面正常显示的非必要的代码。这些代买占据着庞大的空间,不但消耗用户下载页面的时间,还占用搜索引擎巨大的存储空间,增加搜索引擎分析数据的时间。然而,这么庞大的垃圾代码是如何产生的呢?
2.垃圾代码的产生
一般情况下,我们会使用网页制作软件制作网页,如FrontPage、Word及Dreamweaver。这些网页制作软件在制作网页的时候,会生成相应的HTML代码,其中大部分是必要的,而有一小部分则是可有可无的,这就是所谓的垃圾代码。因此,避免产生垃圾代码最好的办法就是以手工编写代码的方式制作网页。
即使是同样内容的网页,使用不同的网页制作软件进行制作,所产生的代码也会存在很大的区别。在没有掌握手工编写代码前,可以使用Dreamweaver制作网页,完成后再清理其中的垃圾代码。
3.垃圾代码的清理
〇空格
空格字符是网页中最常见的垃圾代码。但此处讨论的空格字符并非HTML语言中的“ ;”标签,而是指在代码编辑环境下敲击键盘上的空格键所产生的符号。网页中每个空格都相当于一个字符,因此,空格字符也会占用巨大的空间。初步同济,空格字符约占用页面总体积的1.5%。也就是说,一个100KB的页面中,其中1.5KB是空格字符。
空格字符通常会出现在每行代码的开始和结束处,还有就是空行中。
(1)每行代码开始前的空格字符:是网页制作软件生成代码时,默认产生的缩进字符。
(2)每行代码结束处的空格字符:是编辑HTML代码时,不小心加上的。只要我们在每行代码的结束位置向右移动光标,如果光标不换行,则说明该页面还存在空格字符。
(3)空白行:在编写代码时,常利用空行或者注释对不同功能模块进行分隔,这样就产生了空白行。
对于页面中不同位置上的空格字符,清理的方式也有嗦不同,下面介绍几种常用的空格字符清理方法。
每行代码开始前的空格字符
对于每行代码开始钱的空格字符,可以使用Dreamweaver或者EditPlus等软件进行清理。具体操作步骤如下:
(1)转至HTML代码编辑模式(如果是Dreamweaver);
(2)按Ctrl+A选择全部代码;
(3)使用组合键Shift+Tab,直至删除所有空格为止。
下面的代码1是清理空格前的效果,而代码2则是清理空格字符后的效果。
代码1:
<table width="100%" border="0" cellsoacing="0" cellpadding="0">
<tr>
<td> </td>
</tr>
<tr>
<td> </td>
</tr>
<tr>
<td> </td>
</tr>
</table>
代码2:
<table width="100%" border="0" cellsoacing="0" cellpadding="0">
<tr>
<td> </td>
</tr>
<tr>
<td> </td>
</tr>
<tr>
<td> </td>
</tr>
</table>
空行
对于空行中空格字符的清理,只能手工逐行去掉。
(1)首先,使用鼠标选择空行;
(2)再按Delete键,即可删除空行。
每行代码结尾处的空格字符对于每行代码介绍处的空格字符,我们可以使用Editplus或者其他文笔编辑软件的替换功能进行清理:
(1)用鼠标选择“>”+“一个空格字符”,即“>”;
(2)再按Ctrl+F,就会弹出一个窗口;
(3)“替换”处填上“>”,再点击“全部替换”即可。
页面经过清理空格字符后,大概可以删除70%左右的垃圾代码。也就是说,空格字符的代码量大概占总垃圾代码的70%,还有30%左右的垃圾代码分布在默认属性、注释语句及空语句中。
〇默认属性
在利用网页制作软件制作网页时,通常会产生一些默认属性的代码。例如,我们在HTML代码中不添加左对齐属性,页面中的内容也是以左对齐的方式显示的,所以代码中的左对齐属性是可以删除的。
在页面中,还有很多其他属性都是默认属性,以下是比较常见的。
(1)align=“left”:横向居左对齐属性值,默认情况下文章或者图片都是横向居左对齐的。
(2)valign=“middle”:竖向居中对齐属性值,默认情况下文章或者图片都是竖向居中对齐的。
(3)size=“3”:文字大小属性值,默认情况下是3号字体。
(4)target=”_self“:新页面打开属性值,默认情况下网页中文本的字体颜色是黑色。
利用Dreamweaver的替换功能,可以完成对默认属性代码的替换。在“查找”中填上要替换的默认属性代码,“替换”处留空白,还可以在“查找范围”上选择替换范围,然后点击“替换全部”就可以删除“产照范围”内所有指定的默认属性代码。
〇注释语句
注释语句是用于对代码功能或作用进行说明的语句,注释语句里的内容对于普通用户来说就是不可见的。即普通用户在页面中是看不到HTML代码中注释标签里的内容。
在制作网页的时候,我们或多或上会添加注释语句一增强代码的可读性。但是,过多的注释语句会占用大量的存储空间。不仅如此,如果在注释标签里添加大量的关键字,还会被搜索引擎认为是堆砌关键字,从而对网站进行惩罚。
所以,在添加注释语句时,我们要坚守一个院长:绝不添加哪些即使删除后也不会影响网页源代码可读性的注释语句。
〇空语句
垃圾代码清理的最后一步就是删除代码中的空语句。简单地说,空语句就是指标签间不存在任何内容的语句。
空语句的清理主要针对即使删除后也不会影响页面正常显示的标签。但有一部标签是不能删除的(如<tr>、<td>),否则页面将会出现错乱。
手工编写HTML代码是搜索引擎优化从业者必须具备的基本技能。如果你已经具备手工编写HTML代码的能力,就应该有限采用手工编写代码的方式制作网页。
经过垃圾代码清理后,页面中70%以上的多余代码已经被清楚,但是,精简代码的工作并没有完成。接下来就是暂缓HTML中的长标签,以及对CSS,JavaScript进行优化,
来源:SEO自学网 闽南seo,欢迎你,闽南seo开启你的seo之路