2008年9月17日星期三

微软关系搜索——人立方,垂直个性搜索

什么是人立方?
微软人立方关系搜索是由微软亚洲研究院网络搜索与挖掘组研发的对象级别(object-level)互联网搜索引擎
人立方关系搜索从超过十亿的中文网页中自动的抽取出人名、地名、机构名以及中文短语,并且通过算法自动的计算出它们之间存在关系的可能性;同时,人立方关系搜索还索引了支持它们之间关系的网页文字。此外,人立方关系搜索还自动的找出人名之间最可能的关系描述词、与人名最可能相关的称呼、作品等词条等。人立方关系搜索从这些中文网页中自动的辨别出人名所对应的人物简介文字,并且按照这些文字是人物简介的可能性进行排序。
当用户给定任意搜索关键词,它能够找出与关键词最可能相关的人名、地名和机构名,并且根据它们与关键词之间的相关度排序。除此之外,人立方关系搜索还提供基于人名的新闻浏览功能,可视化关系搜索功能等。

人立方是网络名人的夺金魔方
根据人立方的“设计建造”原理,它最可能成为网络名人的搜索夺金魔方。如果一个词(比如人名)被囊括入网页的次数越多,那么他将被搜索的机会就会越多。
依此推算:
名歌影星 夺冠指数:5颗星
具备绝对的夺冠实力,无数的粉丝善于利用搜索引擎搜寻他们的记录,善于利用网络媒体八卦明星们的消息,因此通过网络搜索的结果量将是非常巨大的。
网界名人 夺冠指数:4颗星
互联网媒体成就了一批又一批的互联网精英,他们是这个载体的中坚力量,出镜率不亚于传统媒体上的明星出镜率。
历史巨人 夺冠指数:3颗星
经过千年历史的沉淀,仍然能被我们记住的历史巨人所剩无几,这些人也早已被搬上了互联网这个开放的知识海洋。

人立方的缺陷
机器的思维永远也赶不上人类的思维,搜索引擎始终也无法解决所有的问题。人立方也因此暴露出了很多严重的缺陷。
相对于名人搜索来说,许多人更希望搜索自己的社会关系,这也是关系搜索所有待解决的最主要问题。如果您所提供的搜索关键词与热门关键字相同,那么搜索结果将指向热门搜索的结果,并非你要的。


同名同姓


假设一个同志就是名叫“张三”,即便他确实在某一领域声名大噪,但要搜索到跟他自己关系最亲密的估计还是“李四”,但事实上,张三并不认识李四。



亮点技术


人性的搜索结果


同样是通过一个输入框一个按钮开始搜索的“人立方”搜索引擎提供了更符合要求的搜索结果。在“所有结果”页面,我们还可以看到“关系”、“网页”、“资讯”、“简介”等更符合个人简历特征的信息。事实上将根据不同人所具有的不同信息,在网页上会显示出更多的个性化信息,如“头衔”、“机构职务”等



关系


关系一览位于页面左侧,关系的搜索结果将返回两种类型的搜索结果,一种是文字列表方式,另一种则是最具特色的关系图方式。


文字列表方式依照关联度顺序,从上至下列出关系表。相比之下您或许会更喜欢关系图方式。



在网页右上方有“关系图”,在搜索页面的文字列表方式下方也有当前搜索关系的关系图。下图对“秦始皇”进行了搜索。想知道谁跟“她/他”关系最密切,关注人立方。



网页


网页搜索也是该搜索引擎的数据根本,因为您可能搜不到您期待的结果,网页搜索提供了传统方式的搜索结果供您自己塞选。该部分内容被放置在页面的最下方。


资讯


资讯搜索像是整合了类似于谷歌的趋势搜索的一种搜索体验。这些结果将直接呈现在搜索界面,上方的数据更显示了按时间顺序最新的一些网页搜索结果。也可以通过设定时间精确您的搜索结果。



简介、头衔、机构职务


这些根据关键字如人物、伟人、董事长、科学家等头衔或职务标记过的名字将列出这些相关网页的搜索结果,省去了您在千万网页中自己辨别的麻烦。垂直一下,更加个性,更加精准。


人立方网址


更多搜索体验,请您自己访问:http://renlifang.msra.cn/