信息与成功
Would you like to react to this message? Create an account in a few clicks or log in to continue.

人肉搜索引擎

向下

人肉搜索引擎 Empty 人肉搜索引擎

帖子  liaowang04 周五 二月 08, 2008 4:55 pm

人肉搜索引擎就是指更多的利用人工参与来提纯搜索引擎提供的信息的一种机制。猫扑的人肉搜索引擎就是其中一个比较成功的例子。后面我们会根据猫扑的人肉搜索引擎给出一个更加具体的描述。

针对搜索引擎的Link Farm和Spam也许永远不会停止,因为他们能够从他们的作恶中得到利益。我们知道得到利益不是作恶的唯一原因,然而大规模的工业化的作恶唯一的原因当然是那样可以得到利益。

所以,这是一场永远无法结束的战争,只要搜索引擎还是应用最广泛的一种互联网应用,只要搜索引擎还是用户用户找到合适服务的最主要手段,这就是一场永远无法结束的战争。很多人把问题归结于PageRank技术,历史是何其相似啊,当年人们也是这样地抱怨META关键字和描述技术。也许Google或者其他的公司能够研究出来更加伟大的技术(注一)来取代PageRank,但是谁知道这新的技术什么时候又会变成明日黄花。

搜索引擎是利用机器自动化的收集网络信息并有序化的一种技术。搜索引擎高效快速,然而因为现在人工智能并不完善,搜索引擎还很难甄别刻意的修饰过的信息,所以SEO Spam才会那么猖獗。所以,有些人想从搜索引擎的反面来解决问题,那就是更多的利用人工把搜索引擎得到的信息进一步萃取,进一步有序化,我们称之为人肉搜索引擎。

很多人知道的中国有一个叫做猫扑的论坛,人气非常旺。Tiny在2001年到2004年期间是这个论坛的忠实用户。在我的印象中,人肉搜索引擎的概念应该出自于猫扑。

跟很多论坛一样,猫扑上面也经常有人问这个问题那个问题。同时猫扑有种虚拟货币叫做Mp,问问题的人往往会用Mp来奖励可以帮助他们的人。虽然Mp不能吃不能喝,但是还是很多人醉心于挣取更多的Mp(注二)。那些惯于通过回答问题挣取Mp的人在猫扑一般叫做赏金猎人。

于是很有趣味的一幕出现了,某人需要解决一个问题,就在猫扑发贴并许与一定数量的Mp作为酬谢。很快,就会有赏金猎人看到这个贴子,他们就会去用搜索引擎来寻找问题的答案,然后争先恐后地把找到的答案回在帖子里面邀功。最后,提问题的人得到了答案,赏金猎人得到了Mp,皆大欢喜。这也就形成了所谓的人肉搜索引擎的机制。有趣的是,我们可以发现人肉搜索引擎的搜索流程和搜索引擎在不同服务器之间的分布式搜索流程看起来是那么的相似,区别仅仅在于发动和执行流程的是人,还是机器。

人肉搜索引擎的质量怎样保证呢?这是一个非常有趣的问题,从刚才的流程上大家可以发现,如果有足够多的赏金猎人,他们之间就会产生竞争,寻找资料速度的竞争,资料准确性的竞争。竞争的结果是,一个速度又快资料又准确全面的赏金猎人会有越来越多的Mp,这会给他带来更多的成就感(注三),同时他也会更加的醉心于赏金猎人的工作。甚至,据我所知很多赏金猎人会形成自己的职业道德和行为准则,这样可以给他们更大的自我实现,同时提高了用户的满意程度。这就形成可一个正反馈,一个良性循环,前提是有足够的激励(Mp)投入和足够产生竞争的参与者(赏金猎人)。

同时很多人也为自己是一个人肉搜索引擎的用户感到自豪,因为这确实太好用了,不需要担心分词不准确,不用担心电脑错误的理解了你的话,不用担心搜索引擎收录范围不同造成的风险(注四),甚至不需要学习搜索引擎怎么用(注五),而且答案也不会仅仅局限于搜索引擎能找到的信息,虽然绝大部分问题是通过搜索引擎就可以找到的。

然而,人肉搜索引擎几年来仅仅是一个概念,没有成为一种产品,在猫扑,人肉搜索引擎只能帮助猫扑提升人气,并不能成为一个产品给猫扑带来效益,同时也给更多的人服务。这是为什么呢?我想可能有4点原因:
1、猫扑人肉搜索引擎和论坛的差异不够明显。或者说在猫扑里,人肉搜索引擎只是论坛的一种应用而已,任何需要人肉搜索引擎服务的人必须是论坛的用户,这降低了用户普及度(注六)。
2、Mp过于游戏化。Mp是虚拟货币,是游戏化的货币,这也给猫扑的人肉搜索引擎加上了游戏性的标签。做赏金猎人的人仅仅是喜欢这个游戏化氛围的人,或者说是能被Mp这样的虚拟货币激励的人,这影响了赏金猎人队伍的扩大,从而影响了人肉搜索引擎的扩大。
3、人肉搜索引擎的反映比较慢。Google可以在0.00001秒内给你一个答案,然而人肉搜索引擎需要等待有人看到你的帖子,并找出结果才会有所反应。
4、猫扑人肉搜索引擎不能保留历史纪录,每次有一个问题出现,就会引发一次分布式搜索。即使问题是重复的,也会同样引发这个流程,而且相同的问题在不同的时间问,答案可能迥异(注七),不能对相同答案给予一致性的结果。

或者说,我觉得以上4点如果能够解决,人肉搜索引擎将能帮助我们更快更好的找到有用的信息。

-------------------
注一:按照某些人的猜测,新的搜索引擎页面估值革命性技术也许是利用Google加速器记录的用户访问行为来评估网站的流量,这个方案可以解决PageRank的动态性不足问题。然而这个方案和Alexa何其的类似,一旦出台新一轮的作弊风潮一定出现,可以想象每个商业网站都会要求员工安装Google加速器了,就像他们现在要求员工安装Alexa一样。当然Google的技术实力远非Alexa可比,一切也还仅仅是某些人的猜测。题外话,如果Google真的有一天声称会用Google加速器的访问记录来评估网站,那么Google加速器在中国安装量一定会非常的惊人,看起来这倒可以作为一个不错的推广方法。
注二:这实际上就是Mp机制带来的游戏性造成的,在分析猫扑的时候,Mp是一个关键,它造成了猫扑的游戏性,而猫扑的游戏性应该是它一直以来人气旺盛的主要原因。有人甚至说猫扑就是最好玩的网游,这还是有一定道理的。
注三:我猜测这是Mp机制的动力,也是其他的游戏机制的动力。
注四:传统搜索引擎用户一般情况下只用一种习惯的搜索引擎,但你需要的某资料恰好只被你不用的那种搜索引擎收录的时候,你的习惯就会让你和你需要的资料擦肩而过。然而人肉搜索引擎略有不同,在赏金猎人足够多的情况下,他们各自不同的习惯正好弥补了这种问题带来的风险。
注五:有些信息必须利用高级的搜索引擎技巧才能找到,然而这些技巧很难被最大数量的用户所掌握。这里我们突然发现,人肉搜索引擎的另一个优点,因为它促进了分工,赏金猎人如果想成功一定会比较了解这些高级的搜索引擎技巧的。
注六:作为中国最有人气的论坛,猫扑的用户量也就是十万级的,而搜索引擎的用户量往往是千万级的。
注七:因为时间不同所以前来解决问题的赏金猎人也不同,所以答案也往往不同。

-------------------
搜索引擎就是通过关键词搜索网页的工具,但你知道最强的搜索引擎是什么吗?或许你会说百度,还有Google,又或者你会问是雅虎、MSN、中搜、爱问、搜狗当中的哪一个?其实答案并不在其中,而应该是———“人肉搜索引擎”!不信。从卖身救母事件,网络虐猫事件,到火爆的“铜须门”网络丑闻和近期的“功夫少女”色情照片事件,还有最近针对流氓外教的“网络追杀令”,人肉搜索引擎时刻显示着网民互动战争的浩瀚、壮阔,如此强大的人海战术威力不禁让人折服!

人肉搜索vs电脑搜索

人肉搜索引擎其实就是在一个社区里面提出一个问题,由人工参与解答而非搜索引擎通过机器自动算法获得结果的搜索机制。通俗来说就是通过广聚五湖四海的网友力量,每个遇到困难的人提出问题,而有这方面知识或者线索的人就对其解答、分析,可以说是一种问答式搜索。百度知道、新浪爱问、雅虎知识堂从本质上说都是人肉搜索引擎,也是应用这种针对性的人工参与方式。

对于一些八卦搜索、没有唯一答案的多选结果搜索,人肉搜索往往能得到更有价值和吸引力的结果。在百度知道里待解决问题数目高达339196,而爱问知识人则称“知识人,亿万网民帮您解决困难!”为什么会有如此惊人的数字呢?其实这就是人肉搜索引擎的威力所在,也证实了不能通过机器搜索引擎解决所有的困难。

相反,由于网络这个虚拟空间聚集了各地的不同阶层,不同知识背景的人,得到帮助的几率也会大大增加。当然,人肉搜索引擎也有比不上机器搜索引擎的地方,那就是速度。Google可以0.00001秒内给你一个答案,然而人肉搜索引擎需要等待有人看到你的帖子,并找出结果才会有所反应。所以说,人肉搜索引擎的潜在力量比机器搜索引擎强大,但反馈速度就比不上机器搜索引擎,两者的PK只能说是平手。


人的力量究竟有多大?

在人肉搜索引擎上充分体现了“团结就是力量”,能在短短数天找到虐猫事件中残忍的网络美女嫌疑人,追查功夫少女事件的幕后黑手......这一场场由网民发动起来的战争都不禁让人拍手称快,更让人惊叹google、baidu的自然语言智能处理的功能,还比不上有常识的普通上网者的头脑分析团结起来的巨大力量。
然而,人肉搜索也被称为最恐怖的社会搜索。“网络通缉令”也有发错的时候:在最近的一起“网络通缉令”事件中,其不幸者就由于被网友误当做被通缉者,他的手机和家庭住址等私人信息都被公布在网络上,甚至连8岁女儿是领养的隐私也被人公布。更是因此接到大量骚扰电话,生活受到了极大干扰,需要通过法律途径解决。
水能载舟,亦能覆舟。人的力量虽然是无穷的,但在遵循网络道德的前提下善用人肉搜索引擎才是最英明的抉择。

人肉搜索事件录

1.虐猫事件宇宙通缉令
2月28日,网民“碎玻璃渣子”在网上公布了一组虐猫视频截图。不久,网友“12ookie_hz”把有关“踩猫”事件的网址放在“猫扑”网,指出“踩猫”视频出现在网站www.crushworld.net上面(crushworld意思是踩踏世界)。网友“黑暗执政官”在“天涯社区”上贴出了踩猫女人的照片,做成一张“宇宙通缉令”,让天下网友举报。不少网友发愿捐出猫币、人民币悬赏捉拿凶手,连猫扑网官方也将赏金从1000元涨到5000元。网友“maggiemeng”随后跟帖说,crushworld.net和winfox.com的IP是同一个IP。他还贴出具体信息,网站注册者是杭州××公司的法人代表郭×,男……
3月2日上午10点20分,网友“我不是沙漠天使”在猫扑上发帖:“这个女人是在黑龙江的一个小城……”,他的帖子让事件出现关键性转变。
3月4日中午12点,网友“浪漫夜风”在猫扑上确认了“我不是沙漠天使”的证词,还补充了一些资料,虐猫事件的三个嫌疑人基本确定,距离“碎玻璃渣子”在网上贴虐猫组图不过6天时间,其效率之高可能不亚于警方的办案速度。

2.功夫少女事件
8月10日,网友“灰飞烟灭的轮回”在猫扑网上发了一组以中国武校未成年少女比基尼秀为内容的色情照片,希望其他网友找出幕后黑手。仅过去一个多小时,网友贴出了河南省博物馆的照片,这座位于郑州的建筑其楼顶和室外练功照片中的图案一般无二。网友“乙墨”确认地点是在河南省博物院附近,从一个练功女孩的上衣的“舞”字推断,可能出自武术和舞蹈混合教学的学校。网友“陈小7”和“寻欢作乐8”从一个邮箱搜索出关键人的资料,燕高飞(YanGaofei)成了重大嫌疑对象,猫扑网友发出了针对他的2号“宇宙通缉令”,河南某少林武校被圈为嫌疑学校,8月14日下午4点过后,相关帖子出现禁止浏览现象,有网友感叹“从一天前的置顶推荐,到几小时前的被禁止浏览,再到现在恢复正常,追查之路竟走得如此坎坷!”到目前为止,调查还在继续。

链接:主要人肉搜索网站介绍
1、猫扑网的人肉搜索引擎
某人需要解决一个问题,就在猫扑发帖并许与一定数量的Mp(猫币)作为酬谢。很快,就会有赏金猎人看到这个帖子,他们就会去用搜索引擎来寻找问题的答案,然后争先恐后地把找到的答案回在帖子里面邀功。最后,提问题的人得到了答案,赏金猎人得到了Mp(猫币),皆大欢喜。游戏性质强。
2、百度知道
2005年11月8日,百度推出的“百度知道”,是一个互动知识分享平台。把不懂的、不明白的问题提出来,让网友回答,再选择一个最满意的答案,作为最佳答案,来结束这个问题。它的科普味道更多一点。
3、新浪爱问
开通于2004年7月13日的一个问答平台,与百度知道类似,它的优势在于与邮箱的捆绑,可以直接将答案发送到你的邮箱。
4、优库网
号称“全球最大中文搜人引擎”,它运用“网络蜘蛛”在海量网页中,抓取关键信息整合成个人信息,包括家庭情况、教育背景、工作经历、同学圈和社会圈等,还添加了网络昵称,BBS留言、网上信用记录等网络信息;同时有强大的“反搜索”功能,被搜人随时可以监控谁搜索过你,其用户名、所在地址、历次IP记录一览无余。

名词点精:赏金猎人
在猫扑网上通过回答问题挣取Mp的人就是赏金猎人。因为常常有网友在猫扑上提问,而猫扑有种虚拟货币叫做Mp,问问题的人往往会用Mp来奖励可以帮助他们的人。很多赏金猎人都有自己的职业道德和行为准则,形成一种竞争回答的邀功热潮,如果提供了最让别人满意的回答,他就可以得到悬赏的Mp。Mp是游戏化的货币,所以一般做赏金猎人的人都是喜欢这种游戏化氛围的人,或者说是能被Mp这样的虚拟货币激励的人。

网友辣语
网友Smile:“希望再次看到人肉搜索引擎,希望能像虐猫事件一样全员行动———因为人的尊严比猫的更重要!一定支持找出罪魁!”
网友水井:“我见过这个帖,肺都气炸了!这次无意再次看到,让我忽然想到应该发动网友来调查此事。可能也是受虐猫案、铜须门等事情的启发吧。我觉得网友有这个能力。”
网友小7:“你会发现每个人都是福尔摩斯,从一个邮件地址、女孩子的衣服标志、室内外景都能找到线索。这个过程很有趣的。”
网站主管月明风:“大量的网友参与调查。网络的力量超乎我们想象。当有这种丑恶的违法情况出现的时候,网友开始变得空前的团结,并且非常具备正义和责任感。人力加搜索引擎让调查的力量异常强大。”

liaowang04

帖子数 : 88
注册日期 : 08-02-05

返回页首 向下

人肉搜索引擎 Empty 机器搜索引擎 vs 人肉搜索引擎

帖子  liaowang04 周五 二月 08, 2008 4:56 pm

机器搜索引擎 vs 人肉搜索引擎2008-01-05 18:28机器搜索引擎 vs 人肉搜索引擎前言:最牛的搜索引擎是什么?!Google?百度?雅虎?MSN?中搜?爱问?搜狗?……,错,都错了,您老的这些答案已经跟不上时代了,据近期的情报和实战演练显示,已经有越来越多的网民高举双手兼双脚赞同如下牛B观点:最强的搜索引擎应该为——人肉搜索引擎!宇宙A级通缉令一经发出,绝无失手。要不信,从卖身救母事件,到网络美女虐猫事件,在到火爆的有极大潜力荣登本年度最牛B网络事件的“铜须门”丑闻 ,以及近期的“武林少女”色情照片事件,直到最近又现身的针对流氓外教的“网络追杀令”,人肉搜索引擎的出现总是在显示着人民战争的人海战术的浩瀚、壮阔和强大……这不,中搜CEO陈沛为摆脱市场上的不利地位,开始放出豪言,百度所代表的二代搜索已过时!

人肉搜索的标志性事件:

功夫少女:【谜案全过程】

铜须事件:【关于此事件的最全面的长达数十篇章的报道】

虐猫事件:【虐猫事件水落石出的全过程】

搜索技术的下一步发展

搜索发展趋势:据目前掌握的线索和趋势,笔者以为下一步网络搜索引擎的发展将继续秉承虚拟和现实相结合的路线,练习搜索将从娃娃抓起,儿童将更容易通过互联网了解到性启蒙知识,同时更加的遵循学以致用的原则,将冲动运用到实战中进行检验;而人肉搜索引擎的发展,则会更加的注重人脑推测和现场还原技术,力求把逝去的光阴和事件用更为逼真的手段还原,以形成强烈的感官刺激为效果……

某网友这样讲:如果你要找彬彬有礼知识丰富的大学生,可以到高档写字楼的人才招聘处;如果你要找粗俗无礼毫无教养的大学生,请到你的网上招聘平台(特别是你开出的条件让他感到无望时);找谦逊稳健智慧可爱的青年律师,可以到律师招聘处;找目空一切狂傲无礼的青年律师,可以到所有的网上BBS律师论坛。
其实在很多情况下,这样的两付面孔,实际上可能就是同一个人,同一群人。
这就是网络环境下的人的两重性。

沉默者:

假使:做恶者,欺骗者,冷漠者,谎言者,羞辱者……不再保持起码的良知和敬畏,假使虚拟中的散发的腐臭气息不能得到现实中的威慑和遏制,假使一次次天然的自发拯救行为依然被道貌岸然者斥为乱搞,假使冰冷、无助、BT的氛围在群体中如毒气息般的任意滋生蔓延……人是否还能被称为是一根有思想的芦苇?麻木、冷漠的沉默,与过激的网络暴力,二者取一,你选哪一个? 一个网友这样说,“其实大家内心深处都还有良知和道德,我们只是在沉默,在容忍,而这次只是爆发了而已。”为什么自称有道德良知的人平时会选择沉默和容忍,为什么沉默到最终还是忍不住会爆发?

叹息者:

虚拟与现实结合:人肉搜索引擎的威力已无须再多言,只是,为什么每一场人肉搜索引擎的***和出现总是在发出着雷鸣般的怒吼,每一场引发人肉搜索的案例背后又总给太多的忧伤、愤懑或寒心,每一场硝烟散尽后都有那么多的“砖家”在指责网络暴民,每一场现实中的冷漠和不平却都被视而不见,每一场悲哀和不幸面前总是发出无力回天的叹息?!


最近关于社会搜索的关注越来越多了。最恐怖的社会搜索,还是人肉搜索。

人肉搜索引擎,我直接把它归入社会性搜索中的问答式搜索(Q&A),其实就是在一个社区里面提出一个问题,由人工参与解答而非搜索引擎通过机器自动算法获得结果的搜索机制。从这个角度理解,新浪爱问、百度知道、雅虎知识堂本质上都是人肉搜索引擎。显然,人肉搜索引擎由于通过人工参与来提炼搜索引擎结果,更有针对性,理论上来讲应该比自然检索结果更能满足搜索者的需求,尤其对于八卦搜索、没有唯一答案的多选结果搜索,人肉搜索的结果更有吸引力。

不过象人肉搜索引擎这种玩法,我个人是非常地不感冒,以百度知道为例,比如我的本本突然自己关机了,急需帮助,点击“我要提问题”,结果反馈“对不起,请先登录”——原来提问是要先注册滴!提了问题还要再等,还要再登录,还不一定有人回答……晕哦,一点效率没有。如果就此判断人肉没有市场就错了,人肉搜索引擎这种东西本来就不是为我这种连社区都没玩过的人设计的,人家是为那些热爱参与、积极交流、没事找事的web2.0人肉们准备的。所以我们看到知道、知识堂这些玩意推出来还是很有点热度。

人肉搜索引擎热度起来了,那机器搜索引擎怎么应对?机器只有更加深入地分析用户行为才能理解用户所需,反馈最符合检索需求的结果。就是说,Google们要对用户在搜索引擎结果的点击行为和点进后的浏览行为继续跟踪,而不是简单地反馈结果或者跟踪到点击就结束。因为一个不符合需求的链接(比如作弊的链接),用户即使点进,可能退出也快。理论上,如果一个链接页面的内容符合检索需求,用户在这个页面应该逗留时间比较长,甚至会在站内溜达一圈,产生更多pageviews以后再出来,甚至会收藏起这个页面也说不定。而这些用户行为,如果搜索引擎统计在案,作为PagerPank和网站内部要素各算法的调整补充,排名结果岂不更加优良?任凭它多么精妙的人肉机制都不在话下。

现在看来,机器搜索引擎应对人肉搜索引擎做得最好的还是百度(不是因为百度人工干预结果比较多,天生就是一人肉搜索:),百度思维不是我上面说的Google式技术思维,什么“深度跟踪分析用户行为云云”。百度思维直接就是人肉思维:自己做一个人肉,再把人肉结果有机整合到机器结果中,就把这个应对的问题完美地解决了。当然,其它搜索引擎也是这么做滴,只是百度知名度太高,突出些罢了。

我还是更喜欢、更关心机器搜索引擎,机器意味着智能和效率,虽然相比人肉搜索少了点人工智慧和苦力,不过搜索引擎都是尊重人工智慧的,否则Google、MSN们也不会把dmoz那样的人工编辑目录作为索引数据源

liaowang04

帖子数 : 88
注册日期 : 08-02-05

返回页首 向下

返回页首


 
您在这个论坛的权限:
不能在这个论坛回复主题