天津SEO:如何使搜索引擎能够更准确的理解网页?

admin
  搜索引擎无论如何只是程序,不可能非常完美判断互联网上那么多不同网页的不同情况。

  搜索引擎对网页分析中的主要过程之一,是将网页分成一个个明确的功能区块。如正文区块、相关链接区块、联系电话区块、无关广告区块等等。而它判断的方式诸如:看字数多少、看HTML代码的形式、将文字内容以自然语言处理来理解等等。

  一般在HTML代码里,好以<div>标签来标明网页上的每一个重要区块,且每个重要的<div>里面又有一个<h2>或<h3>标签明确指明该区块的主题。这样的做法可以让页面上每一块内容所表达的更清晰。

  尤其对于搜索引擎而言,它可以通过这样的<div>来明确它如何去给网页分块,并通过小标题去了解这分块属于什么样的性质,从而判断应该如何计算处理。

  这里语义化指的是用户所不可见的HTML代码也要具有含义,尽管这对于用户没有意义,但能让搜索引擎等程序更容易理解。

  微数据、微格式等是已经日渐被重视起来的概念,它无疑可以很明确的标识网页上面元素的含义。但微数据等方式总有一定的局限性,例如它不能指定大区块的含义,比如告诉搜索引擎,网页上哪里是头部、哪里是底部等。

  HTML5规范很好的解决了这个问题,它推荐使用的<header><footer>等标签可以非常好的展示网页区块。

  搜索引擎会通过自然语言处理等方式来理解这样的文字。大致的思路如先随机抽取1000个网页样本,先人工找出网页上面的搜索区块,再通过机器分析这些区块一般出现什么样的字眼多。

  那么相应的在分析日后其它网页的时候,出现这样字眼的区块也就更可能是搜索区块。

  前面提到<div>命名的时候也差不多,<div id="header"><div id="head">等,因为都是比较常见的,搜索引擎肯定可以因此判断它为头部区块。

  而<div id="toubu">或更糟糕的(但不罕见的)<div id="h_1">等,搜索引擎就迷茫了。终可能搜索引擎分析出来的结果不是自己想要的。