分析:人名搜索Spock会成下个谷歌吗
有哪一家网络新秀Web 2.0公司不希望自己成为下一个Google公司呢?后起新秀Google公司能够超过雅虎公司,那为什么就没有另外一家公司能够去“分享Google公司的午餐”?尽管Spock公司中还没有人大胆地这样声称,但这一针对人名搜索的服务于今天上午上线了。
在发布时,Spock公司的数据库中将包含1亿多人,而且它计划通过搜索时急速走遍其它可以公开访问的站点迅速地增加更多的人。尽管诸如Wink、ZoomInfo.com、Linkedin等与人相关的搜索站点没有能够改变搜索市场的格局,但Spock公司采取了不同的策略,提供了元数据搜索,向可信赖的用户提供类似于Wikipedia的标注权限。
据CNET News.com在最近采访Spock公司的CEO、合伙创始人Jaideep Singh时发现更多。当被被问到Spock公司目前已经索引了多少人时,Jaideep Singh表示:有1亿多一点。当被问到公司每天大约增加多少用户时,他表示增加的有二类内容:一种是人,另一种是处理的文档数量,因为一个人可能有多个文档,因此我们在对整个Web进行快速遍历时挑选文档,根据人组织文档。
当Jaideep Singh被问到他是否能够准确地解释这一技术的工作原理时回答:如果要对一些具体关键字进行搜索,Google公司的表现是相当不错的。然而问题是:如果目前在Google上搜索人,用户获得的将是许多与所查的人相关的文档。如果要搜索的人有“David Stern”这样大众化的名字,那么搜索结果中的前几页的内容可能与名为“David Stern”的NBA委员相关,因此,我们无法搜索到在酒吧或商业会议上遇见的“David Stern”。据他表示,这一技术与通用搜索相比要困难得多,这是一种不同的技术,它们之间唯一的相同点是遍历。当进行遍历时,我们采取的是一种不同的方法。我们不仅仅是抽取元数据,而且还试图找出文档与谁相关。我们希望找到文档中相关性最高的内容。我们首先必须理解语言,理解文档的内容,开发自然语言处理和其它技术等。
据Jaideep Singh表示,人们应该意识到我们与Google公司的相同点在于对Web的索引。我们将从公开文档中获取内容。而且人们也要意识到,在互联网上有许多与我们自己的诸如博客、MySpace档案等相关的资料。我们的β版服务已经运行两个月了,我们拥有了大量的用户,用户的反馈也非常好,人们将会发现它很有用,而且也是很有趣的。
|