Google做了大量的onebox搜索,并且在VLDB2008会议上JayantMadhavan做了题为Google'sDeep-WebCrawl的报告(via here),透漏了下一步Google对暗网数据的处理思路,Googlebot将针对数据库提交form获取结果,然后分析结果页面的content,获取相应的link和内容,然后采用关键词反馈迭代方式,获得深层数据资源。这也是能充分展现Google使命“organize the world's information and make it universally accessible and useful”。