在上文中,有一个信息的生命周期理论,他有一个假设,就是假定知识收集的总体目标是将其用于实际项目、目的中。但是不是一种固定的预定用途、同一知识块可能在不同时间以不同方式使用。
#兴趣论
通过阅读文字、影像这样的信息体验更多生命体验。我们每个人的存在都是时序上的节点,而这个节点形成跟输入输出形成的关系、影响有关,每个人都是其他人的平行世界。
大量被创作的作品、从某种角度在诉说另一个节点的体验,那些感同身受的、那些朝闻夕死的、那些异域风情的、那些荒诞不经的、那些奇趣玄妙的,都在给我们反馈丰富和多彩,给我们感受非我的精彩。
亦如你喜欢阅读的社交媒体评论上的情绪宣泄之流一样,能够督促自己深思深思、反刍和进化。
#功用论
在这个假设的框架下,信息知识的发现有不可预知性、使用目的和用法有不确定性,那我们抽象一下,就是对信息知识管理的需求本质上的需求就是,需要的时候方便找到并应用。看起来特别简单的一句话,内涵可就太丰富了
信息的获取、有效整理、随需调用。随需要的时候,意味着,随时需要随时以最方便的形式找到所有的信息。
(1)随时随地这个都不用讲了,除了支持桌面,支持移动端是必然的,还有未来丰富的移动便携设备的场景.
(2)最方便的形式,这个既包含对交互模态和交互互动方式的开放型诉求,又包含对交互中,对意图和需求的准确理解,并且把交互的输入转换成计算语言能够识别处理的信号,进入系统进行交互.
(3)找到,这个是对计算引擎的和目标诉求,既依赖第四点所说的素材和源,也依赖于对信息多模态理解和加工,并以引擎的需求形态和结构存储。这个形态既可以是基于推荐和feed的发现引擎,也可以是基于关键词的形态搜索的机制.
(4)计算逻辑所处理的信息源所包含的丰富的和多样性要符合这样的场景约定.
(5)源头的信息怎么进入你的候选数据库,这个也是很多工作,比如今日头条和百度模式,低边际成本的抓取解析,这个抓取解析过程又存在源质量评价机制、对垃圾低质量信息不可靠信息的处理,又包含版权知识产权的问题等
搜藏从个人角度,提供了一个基于个人需求的知识和权威信息存储的私域信息的智能化加工和管理机制。你看到对你来说重要的数据、资料和信息情报,保存下来,形成自己的私域信息知识库。
基于私域的知识信息库的线索,你的搜藏智能个人信息助理bot会帮你在开放域抓取和发现更多优质资讯和知识信息,同时系统会跟你主题和内容特征为你创建或者推荐小组,在小组内有一群人他们也对相关主题和相关内容有强需求和兴趣,互相共享信息和想法观点。
理解整个知识信息助理的处理的过程,可以把搜藏产品解构成两部分,其一是帮你存,其二是帮你整理,其三,方便你调用信息使用信息,其四,为你自动归纳、定义特征自动发现、探索新的内容和趣味
# 私域信息和公域信息
私域信息我所指的就是有限范围了解和可获得的客观存在的信息,可能是你内网、本地电脑、电子设备里保存的笔记、数据、文件、照片,也可以是你开放互联网的数字系统中账户或者群组里分享的非公共的信息知识内容。
公域信息我通常是指开放的、公开的,任何人如果发现就可以访问、消费的知识信息资讯。
这两者随着以c/s 软件的流行、计算存储云端化的发展趋势,界限越来越模糊,不那么严格分割。那对于信息知识管理的参与主题,我们的使用成本、使用体验会越来越割裂、不方便、繁复。
搜藏(访问原文连接查看),是我们几个小伙伴基于阅粒知识计算引擎,打造的私域内容基于账户授权访问、公域内容基于AI 语义引擎+全文搜索的infomation assistant bot service。为你提供个性化的、智能的信息管理。为你打造一个通过技术代理自动执行,帮你随需方便找到可以支持后续需求和问题解决信息知识助理。前几天看到一个别人整理的列表,搜藏的摘要和智能标签是用户喜欢的。
##人们为什么有需要搜藏这样的信息整理需求?
遇到很重要的信息、数据、素材,有重复查阅需求,都应该保存在自己的信息库。与我们传统上,读书看纸质出版物一样,很多重要的点进行梳理做笔记,是重要的理解、形成知识内化的手段。
而公共互联网有个典型的特征就是,量大、内容被发现、被遇到很随机,公共搜索诸如百度 Google 这样的,除非有清晰的动机和目标,很容易找到,但是事实情况是公网内容,每年有超过四成的内容link会失效,或者网站没有了、关停,或者转移了。而这些内容很不容易被找到。
移动互联网还有严重的分割部落化的内容被 APP 生态切碎,藏于一域。APP的部落化生态的分割打破了,你在头条、微博、微信和百度,你能看到的毫不夸张地说,已经是不同的互联网,在这里这会儿能看到,如果不搜藏,可能下次就不一定找得到了。把一种已经相遇的确定性置于一个混沌不确定的状态,在需要的时候又得浪费时间重新找。
信息被保存的时候往往要符合人理解的逻辑,即符合人的掌控感。这一点则是传统信息管理工具的优势,他们是通过经典的学科层级分类体系来管理。
但是层级分的层次越多,往往就记不住了。尤其是交叉学科,边界模糊,按照层级分类超过三层的分类层级体系,就会不太容易被混淆。所以搜藏对你保存的内容提供了相关关键词搜索和找到的能力。
搜藏提供了智能分类和社区协同分类两个维度。搜藏小秘书的是AI 辅助的自动化的信息分类的方法,把信息用学科主题分类+语义分类两层分类结构,构建信息内容的网络关系图。
第二个维度,用户自定义社区协同分组,这个是个开放式的聚合分组,用户可以根据自己的理解和需要自定义一个分组,并把相关的内容放到这个分组的簇内。可以跟其他朋友共享。
# 信息层级分类和分众分类、全文搜索适用不同场景
信息分类是严格层级结构分类效率高,还是水平标签的组织效率高,抑或是还其他种什么更有效的内容组织方式呢?
回到我们去理解世界万物和构建符号体系的视角看,人去构造理解整个世界的逻辑就是归类,不断把未知的东西按照特征归类,发现特征超纲了,就提供新的类别包容这个对象。再发现新东西,按照内涵的相似性再归类,归类无法包容他的内涵或者外延的边界,裂变成新的类型。这个是这套层级分类结构的内在逻辑,说到知识信息领域更是如此,这么多年的大学术学科体系的演变就是一个很好的例证。
##在本地磁盘上,人还是更习惯分类目录
在电脑、本地文件管理上,有的人喜欢基于确定性高、稳定的层级关系、学科目录分类导航--主要是跟受教育过程中接收到的信息一致。它能为人提供一个符合认知的稳定预期的路径和结构。人们通过分类目录导航提供了一个具体的导航路径结构,其中包含文件夹和标签,使他们可以逐步进行反馈和控制,每步都符合预期地逼近。在电脑时代尤其如此,人们通过磁盘分区、通过建立分类文件目录,来实现对文件文字信息进行有序管理,实现对结果预期确定性的把握。
但是分类结构最大的问题是,信息量到一定量级的时候,分类的标准无法前后完全一致,就会导致,其实看起来每个文件在分类都分的很好,但是想用的时候,却不知道不太容易找回。
特别典型的是 mac 上提供的基于标签的文件管理系统,非常方便好用,但是文件比较少的时候还行,一旦文件量太大,纯手工靠自我约束的分类、标签的稳定性一致性就很差了,就很不好用。
## 本地文件用标签和关键词搜索的方式组织
人们非常喜欢手动导航文件系统,而不是搜索,而是扫描他们要查找的文件。之前我介绍过类似alfred、everything、百度Google的 desktop search等等,都是带有一定分类搜索来做内容和信息分类。
搜索依赖于使用者记住并输入文件的准确内容,并构造出准确的特征--这个特征必须和文件人、文档、素材、内容本身的特征完全一致,否则对于本地内容信息被重新发现很难效率很高,被错过可能就是常态。尽管本地可以用文件名、文件夹、磁盘、内容关键词、文件类型等信号,也会有 pdf 版 ppt 的偏差。
### 根据人的大脑的记忆的特点,依赖路径和稳定结构逻辑关系的导航,和通过线索识别、上下文反馈给出分类和标签相结合,构成一个立体的导航空间是包容性最好的选择,
系统通过社交行为协同共享会形成另一维度的输入和标记,比较典型的就是 kindle、得到、微信读书,其实读书和看他人评论相比,有时候前者的效用会更好。
分类导航层级目录系统的弱点在于,知识信息与其他可能激发有趣联系的想法节点被隔离开了。在这个层级结构里加入基于知识图谱的网络节点和关系的延展,既可以帮助我们保留层次结构的优势,同时将其与交叉连接和关联相融合,对其进行补充。
这目的不是为了复杂而是为了好用,提供更多的可能性。即使 Google 百度这样的搜索工具更强大,目录导航分类层次结构也不会消失,全文搜索工具+图谱 Tagging,或者反过来的结合,才是信息处理效率的个人体验平衡。
发表评论