现在阶段的搜索引擎技术,华企电商(www.nchq.cc)觉得,毫无疑问就是基于网页质量分析的搜索技术。搜索引擎公司这一阶段的竞争就是谁提供的结果更好、网页质量分析的更加准确的竞争。华企电商继续网站权重分析技术系列文章。这是第二篇:结合网页质量分析的搜索模式。网站建设,企业官网,建设网站系列文章之一:网页质量 URL:http://www.nchq.cc/Website-analysis-of-weight-Seo.html 系列文章之三:SEO网页质量直接测度指标 URL:http://www.nchq.cc/Indicators-measure-the-quality-of-the-page.html
提出“有用性”这个用户评价信息搜索结果的标准,以区别于相关性等常见指标,主要原因在于Web信息搜索环境的特点。
从本质上讲,只有与用户真实信息需求相关的网页才是用户想要的网页。这也就是华企电商一直强调的网站内容的相关性。但是,要想做到这一点,需要建立三个为基本的前提:
一、用户具有明确的信息需求;
二、用户可以完整真实地表达自己的信息需求;
三、存在具有良好结构的被检索客体。
在传统的专业文献检索环境下,对于专业信息检索人员而言,这些前提是成立的。然而,在Web信息搜索环境下,这些前提已经丧失了存在的基础。具体原因如下:
1.因为一般的Web信息检索用户并非专业信息检索人员,他们有时并不具有明确的检索意图,相反是在检索过程中不断调整发现自己的信息检索需求,获得所需的内容;
2.在更多的情况下,Web用户也缺乏完整表达信息需求的能力,不论是关键词检索还是目录检索,用户往往只是输入和点击很少的信息来从事网页的检索,所以都需要从命中结果中再次挑选和进行超链浏览,以确定所需内容;
3.Web网页质量呈现明显的非结构化特点,缺乏有效的整体质量控制体系。
既然现代Web信息搜索系统缺乏实现真正相关性检索的可能,那么这些系统依赖什么来得到用户所需的命中网页呢?于是提出了“有用性"这个标准。“有用性”是个主观性较强的标准,所谓“有用”可以定义为用户满意信息检索的结果,可以从中找到满意的资料。事实上,现代Web信息搜索系统必须要对用户的所需内容做出一种揣测,换句话说,搜索系统必须引导用户让他们得到并认为找到了所需的资料。目前,以Google为代表的搜索引擎一般会推荐PageRank值较高的网页,也就是假设具有高流行度的网页往往就是用户所需的网页,然而这些方法还是存在一定的问题。事实上,流行的网页未必是质量高的网页,这个假设是否成立是值得商榷的;即便是成立,单纯只重视网页的流行度也显得十分片面,甚至会产生一些其他负效应。显然,综合推荐高质量的网页将是一种非常合理的选择。
为了实现这个目标,Web信息搜索引擎系统就需要从以下两个方面来进行。
首先,需要加强用户引导行为和努力探测用户真实的信息需求,这也给提高Web信息搜索系统检索效果提出了一种设计思路,那就是从用户行为人手,尽可能地收集到能够反映用户真实信息需求的相关信息。除了通过用户键人关键词所反映的一些语义信息外,还要对用户相关度反馈信息进行广泛的收集。例如,利用用户浏览命中网页顺序所产生的访问路径和访问时间长短等信息。这些信息虽然可能并不完整和准确,但是它能直接反映用户真实信息需求。从另一方面来看,这些用户相关度反馈信息也是衡量网页质量的一个间接指标。
其次,Web信息搜索系统必须假设什么样的网页才是用户想要的。基于网页链接关系分析的搜索算法,通常假设流行的网页就是用户想要的网页。然而,流行的网页未必是质量高的网页,也可以说未必是重要的网页,所以必须考虑网页质量的指标分析结果,并将其结合到Web信息搜索过程中。此时对于网页质量的分析,Web信息搜索系统必须结合一些能够获取的多个客观性指标,来对网页质量做出判断,流行度也可以看成是一种网页质量的测度指标,但并非等价关系,除此以外,还有网站重要性和网站流量等其他指标。事实上,单纯使用这里所说的任何一种方法来得到高质量的网页都是不太可行的,每种方法都具有不可避免的缺点,因此,综合更多的假设条件和相应的信息,将比单纯使用一种方法会取得更为准确的模拟效果。
通过对网页质量的分析,作为一名合适的SEO,我们只能是不断的提高网站的质量、网页的质量,从而提升网站权重。如果对搜索引擎排名算法稍微了解的SEO,就会知道一些SEOSPAM在搜索引擎看来,都是小儿科。或许,不断提升网页的质量才是一个SEO应该永远追求的目标。