上个星期我们刚刚介绍过,微软计划以 1 亿美元收购 Powerset 搜索引擎,而根据 Live Search 团队的官方博客最新消息,Powerset 已经加入 Live Search 团队。
Powerset 是一个创立于美国旧金山的专门从事于搜索和自然语言的公司。加入微软后,Powerset 仍然继续留在原来的总部旧金山,并将加入 Live Search 的核心 ”Search Relevance”团队。Powerset 给微软注入的自然语言方面的技术,很好的补足了微软研究中心自身的自然语言处理技术。更重要的是,Powerset 给 Live Search 带来了一个相当有才干的工程师和计算机语言学家团队。这个相当有实力的团队是来自其他一些搜索引擎公司和包括 PARC (从前的施乐公司 帕洛阿尔托研究中心) 在内的研究机构。
微软收购 Powerset 的主要原因,就是因为 Powerset 的人才骨干。Powerset 的首席技术执行官以及创始人之一 Barney Pell是一个相当有远见的人。当他把 Live Search 的高级工程师介绍给几个 Powerset 相当资深的工程师(包括 Tim Converse, Chad Walters, Scott Prevost, Lorenzo Thione, 和 Ron Kaplan在内的搜索技术工程师和计算机语言学家)的时候,Powerset 的团队给 Live Search 的人们留下了相当深刻的印象,他们的聪明才干、他们对于搜索事业的资深经验和绝对热情、以及他们共同拥有的奋斗目标。
这一共同追求的奋斗目标,即通过增加对隐藏在搜索以及页面中我们能看到的表面文字背后的深层含义的理解,把搜索事业带入下一个新的高度。
如今,我们大致能理解到的基本情况是对于此类信息的搜索是绝对没有办法在首次搜索或首个搜索结果就能得到相应的答案。通常搜索者需要经过多次的搜索以及对比点击多个搜索结果,才能最终得到答案。而下面是产生此类问题的主要两个原因:
对于相同的信息,搜索引擎使用者和显示在网页上的内容两者之间无论在措辞或者上下文语境上都有很大的区别。搜索引擎有时无法很好的分辨一些近义词,或者一词多义。
搜索结果中列举的每个网页没有更准确更明确的阐述。有时搜索结果中列举显示的每个搜索结果页面的简短描述并不能很准确的反映这一页面的真实内容。所以搜索引擎使用者有时不得不点击进入相应搜索结果列举出的页面之后才发现,该页面中的内容其实跟所搜索的搜索关键字并不那么相关。
产生这个问题的根本原因,是因为现在的搜索引擎只是把搜索关键字与网页页面上的词语进行匹配搜索。而对每一次搜索的搜索动机以及嵌入网页页面的理念和含义的更进一步的深入理解,确实能够帮助我们更好的解决这一问题。具体说来,要进一步解决这一问题,我们可以通过对返回的搜索结果质量的革新、对搜索者输入关键字有可能的含义的机动性方面的革新以及整个搜索用户体验方面的革新。同时需要利用从页面提取的信息来改善搜索结果描述内容,提供新的工具来帮助搜索者更快更好的搜索到想要的信息。
Powerset 会与 Live Search 现有的团队以及微软其他的致力于自然语言的团队协同工作,与 Live Search 一起克服目前面临的所有问题、迎接未来所有的挑战和机遇。
Powerset 站点相关链接:Microsoft to acquire Powerset
3 条评论
ln
这倒是微软翻身的不错机会
2008 年 07 月 02 日 9:07 上午
Amanda
嘿嘿,或者是 Live Search 翻身的不错机会~ :D
2008 年 07 月 02 日 9:13 上午
meteor
这就是语义网的问题. 包括百度现在在推的"框搜索",其实就是和Powerset的这个研究方向是一致的.
2009 年 11 月 01 日 2:03 下午
评论当前被关闭。