|
首先需要说明的是,本人并不排斥搜索引擎的人工干预或人工审核,毕竟,任何搜索引擎都存在人工干预的情况,如Google前段时间对德国BMW网站的处理,便是标准的人工干预。对搜索引擎而言,合理的人工干预机制对搜索引擎智能算法的有效补充,通过更有针对性地打击Spam与作弊行为,能够保护并鼓励用户在规则允许的范围内操作,从而更有效地保证搜索质量,向搜索用户提供真正需要的内容。从这个角度上看,人工干预是搜索引擎保证其服务质量的必要且相当重要的手段。
但是,这种人工干预应当是建立在搜索引擎算法能够智能过滤绝大多数Spam手段与技术基础上的,只能是搜索引擎算法的补充,在理想状态下,人工干预更多地面向算法来不及调整以应对的新型Spam技术,或者是否作弊的界限不明确无法通过程序自动判断的情况,这时才需要人工对搜索引擎算法(暂时)无能为力的可能会影响用户搜索体验的行为做出反应。没有相应的可行自动算法处理为保障,人工干预的这些优势便不可避免地成为空中楼阁,成为永远的神话。
最近让人搞不懂的就是,某些在自己的算法上无力抵抗甚至最基本Spam手段或作弊方法的搜索引擎,开始大力鼓吹本属无奈之选的人工干预,将人工干预拔高到解决搜索引擎服务质量问题的灵丹妙药,不仅屡屡隐讳地将搜索引擎的人工审核、人工干预与DMOZ之类分类目录的人工审核等同起来,并进而吹嘘自己的搜索质量多么有保障,而且,甚至有更英明神武者表示,这样的人工干预代表着搜索引擎的发展方向,本来是其劣势的拙劣算法摇身一变成了让其登上搜索引擎之巅的必要基石。
不幸的是,这类论调得到了很多人的认可,这很让人奇怪。如果说神话般的“中文分词技术”能够深得人心并获得广泛支持,还有民族自豪感等因素起作用,尚可理解的话,这类人工干预的吹嘘则连一厢情愿的自圆其说也没有做到。
就象虽然与汽车相比,可以认为自行车更环保,但若只是因自己买不起汽车才四处鼓吹自行车的环保优势,并进而将自己标榜为有责任心的环保主义者来抢占道德上的制高点,就有些可笑了。退一步来说,如果只是自己阿Q似的意淫,虽嫌猥琐倒也无可厚非,毕竟总得允许自我感觉良好的人自慰,但是,如果就此而攻击其他开汽车的人便是环境的破坏者,或者认为自行车代表着先进的潮流强行要求别人也都来骑自行车就有些荒唐了。
搜索引擎人工干预 : 神话
搜索引擎人工干预的神话建基于人能够比机器更智能地判断网页质量,及判断网站/网页中可能存在的Spam或作弊手段,这在极端的理想状态下当然是成立的,不过,存在的问题便是,搜索引擎有能力实现这种理想状态的人工干预效果?
我们常常可以看到一些似乎言之凿凿的说法,对它们,也许最重要的并不是看它们是如何说的,而是如何去做。毕竟,很多时候,越是没有明确的定义和出发点的说法,越容易“放之四海而皆准”,越具有欺骗性。就像某种标榜“天人合一”的医学,其提出的“标本兼治”如何?简直太正确了,但如果细细分析一下,便会发现其中的“玄妙”,到底什么是“本”?虚无飘渺的阴阳五行六气脉络?靠什么来治?望闻切诊?可惜象华陀那样天生一副X光眼的神仙几千年才出一个,这样的情况就要考虑它所说的标本兼治是不是为连标也治不好所找的借口了。
有点扯远了,回到主题上来,对某个搜索引擎而言,要达到人工干预的理想效果,需要考虑以下问题:
- 该搜索引擎的算法能够在多大程度上自动处理各类Spam及作弊手段对搜索结果的影响?当然,这也不能仅仅看搜索引擎自己是如何吹嘘的,而是分析其搜索结果,尤其是那些没有人工处理痕迹的搜索结果质量。
- 该搜索引擎如何平衡Spider收录的自动化与人工审核?比如说该搜索引擎的人工干预在网页收录阶段即参与进来了
|