天津SEO：如何使搜索引擎能够更准确的理解网页？

admin 2012/3/1 13:10:01

　　搜索引擎无论如何只是程序，不可能非常完美判断互联网上那么多不同网页的不同情况。

　　搜索引擎对网页分析中的主要过程之一，是将网页分成一个个明确的功能区块。如正文区块、相关链接区块、联系电话区块、无关广告区块等等。而它判断的方式诸如：看字数多少、看HTML代码的形式、将文字内容以自然语言处理来理解等等。

　　一般在HTML代码里，好以<div>标签来标明网页上的每一个重要区块，且每个重要的<div>里面又有一个<h2>或<h3>标签明确指明该区块的主题。这样的做法可以让页面上每一块内容所表达的更清晰。

　　尤其对于搜索引擎而言，它可以通过这样的<div>来明确它如何去给网页分块，并通过小标题去了解这分块属于什么样的性质，从而判断应该如何计算处理。

　　这里语义化指的是用户所不可见的HTML代码也要具有含义，尽管这对于用户没有意义，但能让搜索引擎等程序更容易理解。

　　微数据、微格式等是已经日渐被重视起来的概念，它无疑可以很明确的标识网页上面元素的含义。但微数据等方式总有一定的局限性，例如它不能指定大区块的含义，比如告诉搜索引擎，网页上哪里是头部、哪里是底部等。

　　HTML5规范很好的解决了这个问题，它推荐使用的<header><footer>等标签可以非常好的展示网页区块。

　　搜索引擎会通过自然语言处理等方式来理解这样的文字。大致的思路如先随机抽取1000个网页样本，先人工找出网页上面的搜索区块，再通过机器分析这些区块一般出现什么样的字眼多。

　　那么相应的在分析日后其它网页的时候，出现这样字眼的区块也就更可能是搜索区块。

　　前面提到<div>命名的时候也差不多，<div id="header"><div id="head">等，因为都是比较常见的，搜索引擎肯定可以因此判断它为头部区块。

　　而<div id="toubu">或更糟糕的（但不罕见的）<div id="h_1">等，搜索引擎就迷茫了。终可能搜索引擎分析出来的结果不是自己想要的。

标签：天津SEO 搜索引擎

本文网址：