新搜索服务的必要性
传统搜索引擎似乎逐渐变得不尽人意。虽然每次查询都能获得一系列搜索结果,但其中往往包含大量重复的、不太准确的结果,常常被广告和SEO垃圾所掩盖,似乎变得越来越差,每次查询都能获得十个搜索结果蓝色链接,各种重复的、不太准确、充斥着广告和SEO垃圾的结果,都让我再次筛选和使用更耗时。
相比之下,一些AI工具,甚至包括谷歌自己的搜索生成体验,能够直接提取这些信息并直接提供给用户,这给用户带来了更好的搜索体验。然而,传统搜索引擎在用户提出具体问题时,常常给出奇怪的结果,这让人感到困惑和无奈。
我尝试的所有AI工具,包括谷歌自己的搜索生成体验,都可以直接提取这些信息并直接提供整理分析,并给出有效的归纳总结。
搜索引擎是多重功能的集合体
对于搜索引擎,你必须明白,虽然许多人使用百度谷歌查找重要且不易得的资讯、知识、科学信息,也有数以亿计的用户更多地使用它查找他们需要的软件、文档、资源、门户网站、电商网站等特定网站,或者ip地址是哪里的、地址导航、产品评价和其他人关于特定话题的意见等。一个有意思的现象是,在百度搜索服务中,有大量的人们输入的查询词是“百度”,在Google搜索中输入关键词查询“Google”
所有这些可能成为“搜索引擎”产品杀手的AI搜索们,所面临的真正问题不是它们能找到信息的效果如何。而是它们是否能够像搜索引擎一样全面地执行所有任务。在早期PM曾经讨论一个真实且当时觉得“无解”的问题,什么是搜索?基于每天研究分析以数千万用户查询的意图和目标的特别的搜索发烧友团队,几乎采用了穷举法和遍历法之后,最后选择了一个叫作“排除”法的方法来描述对搜索的认知,“搜索就是找到”。在搜索引擎产品的工作人员经常说“搜索需求”基本上寻址、资源、信息有三种类型的查询。
第一种也是最流行的是导航查询,即用户只需输入网站名称即可转到该网站,这是搜索引擎的主要任务之一:带你到达目标网站。
第二种,资源需求查询,找一个文件、找一个软件等,搜索引擎的任务显然找到有效目标,并最快速地抵达目标,获取对应资源。
第三种,知识信息查询,在这个方面试用的AI搜索,有着非常明显的体验提升和优势。通常情况下,这类需求,包含不同的维度,按照阅粒的方法论,则认为事实、数值、经验、观点、历史记录等知识类需求,包括新闻、资讯、娱乐信息这种时间关的信息,这三类的不同表现在需求满足角度,也是知识探索发现的类别,
探索挖掘查询,通常是某一topic的信息簇,包含不同维度、不同角度的看法和经验等多种相关而不相同的信息,有些知识来自他人分享,有些来自历史上数据、档案等,这些是没有单一答案的问题,而是学习过程的开端,还具备丰富的用户数据和深入的市场理解。这些正是AI搜索引擎可以发光的时刻。除了这个角度,LLM还可以实现跨语言文化的知识信息的共享和重述。
AI搜索解决如下问题上“遥遥领先”
AI搜索引擎利用先进的机器学习算法,能够理解用户的自然语言查询,提供更加丰富和相关的搜索结果。它们在处理探索性查询方面表现出色,能够为用户提供深入的背景信息和相关知识,这对于学习和研究尤为有用。
答案型查询,在信息查询中,一大堆结果,其实只有很确定客观信息准确符合目标需求,比如“如何在Mac系截图”,无论多少条结果、多少网站上有,其答案只有全屏截图是Cmd-Shift-3,选择截图是Cmd-Shift-4。
参考型查询,bing Copilot,perplexity都在采用通过对特定、若干条有效参考信息交给LLM,进而来生成跟提问或者查询相匹配的回复,并给出和解释链接,这种综合分析,大大降低对搜索中10条蓝色链接、甚至更多结果进行阅读和整理的工作。
跨语言文化的知识共享,AI搜索具有跨语言文化的知识共享能力,可通过多语言理解和翻译,跨文化信息检索,文化适应和个性化推荐,跨语言信息挖掘和知识图谱建设,以及语言普及和教育支持等方式,促进不同语言和文化背景下的信息交流和共享,推动全球化的信息传播和文化交流。
AI搜索在满足这些需求上还有差距
主要在这几个方面“知识库的更新”“事实性问题和大模型幻觉”“生成式结果的可靠性”。寻址导航类、资源类,目前可以通过垂直数据或搜索通过RAG引入到AI搜索服务中,类似Perplexity这样,通过提供专业准确的总结描述和清晰完备的信息来源、资源描述来实现信息的信任代理和资源推介。
当你想知道某些具体信息,这些信息在满足用户查询、问询需求的时候,表现出不同的展示、交互形态,比如,“世预赛国足新加坡比分”的信息查询,“黄健翔怎么看国足新加坡比赛”,“北京空气质量”“北京天气”搜索引擎都能通过引入数据源,高质量准确地解决问题。传统搜索引擎产品经过近20年的迭代更新,已经深刻嵌入各种垂直场景和具体的需求对应的数据、知识库,他们能准确反馈,甚至会弹出一个小部件,显示其他统计数据和信息,比叙述性文本阅读体验好的多。
基于目前预训练大语言模型为知识库的AI搜索,对于实时内容,如股价、体育比分等,是无法满足的,尽快他们也会响应回答,生成看起来合理的信息,但是事实上是不可信的,他的信息仅限于模型知识更新的截止日期,并不是实时更新的。
除此之外,AI搜索还存在一个对知识的召回并不能完整客观地还原预训练语料的知识描述,所以有相当概率,无法准确还原信息本来在网页、文件或者书籍杂志上的呈现。
再次,他们针对资源型的需求,更是无法具体资源和用户问题映射关系(至少目前是这样)。
当然,不可否认的是,AI搜索引擎在这对搜索结果帮助性总结,拓展性地引入新的知识锚点和提示,其体验和感受,大大超过传统搜索引擎产品的反馈。
AI搜索引擎在帮助用户快速找到特定网站方面仍需改进。概括起来看,所有的知识性查询,询问大盘鸡的做法、咖啡配方、耳机防水等问题我们都能获得可靠、有效的信息,且体验也相当可信可靠。
AI搜索引擎的优势与挑战
AI搜索引擎的优势在于其能够理解用户的自然语言查询,提供更加丰富和相关的搜索结果。它们在处理探索性查询方面表现出色,能够为用户提供深入的背景信息和相关知识,这对于学习和研究尤为有用。然而,它们仍面临一些挑战,包括知识库的更新、事实性问题与大型模型的幻觉、以及生成式结果的可靠性等方面的问题。
而诸如和Microsoft Copilot、Perplexity等信息获取和知识查询工具则变得越来越出色,我们似乎正在朝着一种新的在线信息获取方式迈进,甚至公司如Perplexity和You.com将自己打造成下一代搜索产品,甚至谷歌、必应等也在大力投资,认为AI是搜索的未来。
实时信息处理的挑战,在提供实时信息方面,例如体育比分、天气等,确保搜索结果及时更新和准确展示是提升搜索引擎竞争力的关键。应该加强对实时信息的处理能力,包括更频繁地更新索引和实时调整模型参数,AI搜索引擎的准确性和更新速度仍有待提高。
AI搜索引擎面临的潜在风险与问题
推理算力成本高昂:AI搜索引擎依赖于大型预训练模型进行推理,这带来了高昂的服务成本。解决这一问题需要技术上的创新,以降低推理过程的资源消耗,例如优化模型结构或使用更高效的计算架构。
速度与准确性的平衡:为提升用户体验,AI搜索引擎需要持续优化搜索速度和结果准确性。这可通过改进算法和优化数据处理流程来实现,确保在短时间内提供准确的搜索结果。
用户体验和信任度:AI搜索引擎需要设计更直观、用户友好的界面,同时提供可靠的搜索结果。优化交互设计,考虑用户习惯和需求,加强对搜索意图的理解,以提高用户对搜索结果的信任度和满意度。
多功能化工具的发展:AI搜索引擎应朝着更复杂、多功能的方向发展,不仅提供搜索功能,还可以满足用户探索性查询的需求,提供更丰富的信息和背景知识,从而增加用户粘性和使用频率。
商业模式的优化:AI搜索引擎的商业模式需要考虑如何平衡服务质量与成本,探索更有效的收费模式,同时保证用户体验和服务水平不受影响。可能的方法包括不断优化付费订阅套餐,吸引更多用户参与,以及开发其他增值服务来增加收入来源。
AI搜索引擎在解决潜在风险和问题的过程中,需要综合考虑技术、用户体验和商业模式等多方面因素,通过持续创新和优化,才能实现其商业成功并获得持久的竞争优势。