--历史日志归档--
04/01/2024 - 05/01/2024 12/01/2023 - 01/01/2024 11/01/2023 - 12/01/2023 08/01/2020 - 09/01/2020 07/01/2020 - 08/01/2020 12/01/2019 - 01/01/2020 11/01/2019 - 12/01/2019 10/01/2019 - 11/01/2019 07/01/2019 - 08/01/2019 06/01/2019 - 07/01/2019 02/01/2019 - 03/01/2019 01/01/2019 - 02/01/2019 12/01/2018 - 01/01/2019 11/01/2018 - 12/01/2018 05/01/2018 - 06/01/2018 10/01/2017 - 11/01/2017 09/01/2017 - 10/01/2017 04/01/2017 - 05/01/2017 03/01/2017 - 04/01/2017 12/01/2016 - 01/01/2017 12/01/2014 - 01/01/2015 11/01/2013 - 12/01/2013 05/01/2013 - 06/01/2013 08/01/2010 - 09/01/2010 07/01/2010 - 08/01/2010 12/01/2009 - 01/01/2010 11/01/2009 - 12/01/2009 10/01/2009 - 11/01/2009 09/01/2009 - 10/01/2009 08/01/2009 - 09/01/2009 07/01/2009 - 08/01/2009 06/01/2009 - 07/01/2009 05/01/2009 - 06/01/2009 04/01/2009 - 05/01/2009 03/01/2009 - 04/01/2009 02/01/2009 - 03/01/2009 01/01/2009 - 02/01/2009 12/01/2008 - 01/01/2009 11/01/2008 - 12/01/2008 10/01/2008 - 11/01/2008 09/01/2008 - 10/01/2008 08/01/2008 - 09/01/2008 07/01/2008 - 08/01/2008 06/01/2008 - 07/01/2008 05/01/2008 - 06/01/2008 03/01/2008 - 04/01/2008 02/01/2008 - 03/01/2008 01/01/2008 - 02/01/2008 12/01/2007 - 01/01/2008 11/01/2007 - 12/01/2007 10/01/2007 - 11/01/2007 09/01/2007 - 10/01/2007 08/01/2007 - 09/01/2007 06/01/2007 - 07/01/2007 05/01/2007 - 06/01/2007 04/01/2007 - 05/01/2007 03/01/2007 - 04/01/2007 02/01/2007 - 03/01/2007 01/01/2007 - 02/01/2007 12/01/2006 - 01/01/2007 11/01/2006 - 12/01/2006 10/01/2006 - 11/01/2006 09/01/2006 - 10/01/2006 08/01/2006 - 09/01/2006 07/01/2006 - 08/01/2006 06/01/2006 - 07/01/2006 05/01/2006 - 06/01/2006 04/01/2006 - 05/01/2006 03/01/2006 - 04/01/2006 02/01/2006 - 03/01/2006 01/01/2006 - 02/01/2006 12/01/2005 - 01/01/2006 11/01/2005 - 12/01/2005 10/01/2005 - 11/01/2005 09/01/2005 - 10/01/2005 08/01/2005 - 09/01/2005 07/01/2005 - 08/01/2005 06/01/2005 - 07/01/2005 05/01/2005 - 06/01/2005 04/01/2005 - 05/01/2005 03/01/2005 - 04/01/2005 02/01/2005 - 03/01/2005 01/01/2005 - 02/01/2005 12/01/2004 - 01/01/2005 11/01/2004 - 12/01/2004 10/01/2004 - 11/01/2004 09/01/2004 - 10/01/2004 07/01/2004 - 08/01/2004 04/01/2004 - 05/01/2004 03/01/2004 - 04/01/2004 02/01/2004 - 03/01/2004 01/01/2004 - 02/01/2004 08/01/2003 - 09/01/2003 04/01/2003 - 05/01/2003 03/01/2003 - 04/01/2003 02/01/2003 - 03/01/2003
Reward hasiblog
Google新闻存档搜索的意义-哈斯日志
Google新闻存档搜索的意义
星期四, 九月 07, 2006
Google在新闻频道 推出了历史新闻搜索服务 ,用户可以在这里搜索到甚至18世纪的新闻。 在这些信息中,包括两部分其一是网上采集,应该比例较少,其二是与其他媒体或者数据公司合作,获得数据授权使用,目前与Google的合作公司包括,纽约时报公司(New York Times),华盛顿邮报公司(Washington Post),LexisNexis,《华尔街日报》,Factiva等,使用该服务的用户同时可以搜索到这些家公司提供的文章。 在新闻存档搜索的结果中,正常显示标题/摘要/时间等,“付费”“免费”信息混杂在一起,如果用户选择 阅读收费的信息可能就要支付一定的费用。在高级检索当中,可以只在“付费”或“免费”的信息中进行搜索。检索结果可以按照Search articles和Show timeline两中方式排序,分别体现了相关性和时间因素对用户的意义,你完全可以按照自己需要对搜索结果去重排,更详尽的请阅读东宝的解读 。 那时间排序中的新闻的时间到底是什么呢,难道200年前真有报道?当然不是,目前来看,Google采用的是机器识别文章的时间,也就是说,一般的是新闻的发布时间,从合作机构很容易获得这些数据项,但是很多非结构化数据则是自动识别提取时间为主,这就不难明白央视国际会出现40年代的新闻 ,而且百度会有很多80年代的新闻 。 这个产品对于谷歌来讲他的意义在于Google用事实向世界宣布 “我们的目标是,索引全世界!”,仅此而已。这种产品本身没有什么重要意义,只是个有价值的商务合作而已。这种合作模式重新定义了搜索引擎与内容供应商的之间关系,这种关系不再是一个robots.txt 所能表达或约束的了,双方应该合作互利共赢的,这种模式其实在百度的产品很常见,比如早期的百度国学 ,百度邮编 ,新近的百度法律 等一样。
This Written at 九月 07, 2006 by loverty.
发表评论