哈斯日志

有点长，先说观点，其实这篇也是2020 春节前在锐创的时候就写好了，没发出来。

总结起来就是，优秀的知识发现、灵活高效的分类标签体系、合理的权重策略、开放的结构和增长进化体系，分层共享的访问授信机制。

# 知识的发现

数字信息的爆炸式增长淹没了我们用于对其进行分类的所有工具。标准的上下位分类目录导航的结构，是自上而下的少量小规模的数据处理范式。亦如上篇提到的.

我们需要的是自下而上的自动化工具来理解大量数据、节省时间、提高使用效率。Google的PageRank算法使通过网页分析关键字和超链接，而不是通过人工判断为网页分配重要性和含义成为可能。这是一种自底向上的算法方法，可从数据特征的网络关系中计算获得含义。这项技术的要义在于，可以辅助人工判断重要与否并将这个特征量化表达出来、为后续的有效计算提供参数供给。

在信息到知识的过程中，实际上是一种从泛在的信息的提取加工、并进行价值判断、形成知识工具的过程，那么这些泛在的信息在哪里、怎么产生的，以什么形式存在的、怎么发现怎么标引，除了 pagrank还有没有其他更好的方式。若干年前曾经尝试的 people rank 在解决那个维度的问题？

#信息映射

根据你的理解认知，建立所掌握的信息知识的关系结构，并能在特定场景/域下的对象和对象的用你掌握的类似、或者相关的逻辑结构来描述

还有一点建立关联，基于域关联、场景方向，并能识别出场景和域下有多大差异，会导致迁移导致失效或者不完全等价，我一般定位一个知识和场景连接的适应性权重。

一切困惑均可在历史中寻迹。当我带着困惑的时候，看到了1969年Robert Horn首次发表了一篇论文，概述了“信息映射”。

信息映射是一种以研究为基础的方法，用来撰写明确、以用户为中心的信息（基于读者需求和信息使用目的），该方法主要被用于设计和撰写商务沟通及技术传播内容，已被全球范围的企业作为内容标准使用。这是创建技术参考的一种新方法。它是一种用于识别，分类和相互关联信息的原理系统，可以使你在复杂的，信息丰富的环境中更轻松地学习、获取信息、消费信息资讯中的知识。Robert E. Horn 的信息分类理论里明确了六种信息类型，几乎涵盖了商务沟通和技术传播的所有内容。根据它们对于读者的用途，这些类型对各元素进行了分类：

先贤们很早就定义清楚，知识管理信息管理一定是以信息消费的读者的使用要解决的问题形态存在，而抽象出这种存在为中心的逻辑则是定义知识信息存在的结构，以访问为中心的逻辑则更关注的访问的相关性、一致性、易访问。

#知识管理的过程

从获取的信息，知识化过程纵向抽象来看，包含这么一个过程：

1 发现、初步学习

2 重新学习

3 参考

4 扩展、延伸

5 更新变化

6 作为工具使用，并不断重复 2～6 的过程。

通常情况下，费曼学习法、康奈尔科学笔记法、思维导图都是对知识的体系化梳理好工具，这些个工具在这里会有助于你整理、梳理、形成体系。

#标签化你的知识信息

标签（这里指的是 Tagging，类似于早期 furl、delicious 的taxonomy方式）可帮助我们即时感知，选择和思考的数据分组，以促进行动，而不仅仅是抽象的思想。

且在不同笔记上标记标签，使我们能够感知跨学科的主题和模式，当前前提是你对你 Tagging的标签有要清晰的内涵定义，不能每次使用的边界都不稳定，这样可以使我们在特定的时刻仅关注最相关的信息，从而改善我们的思维。

我们的思想塑造环境，然后环境塑造我们的思想。安迪·克拉克（Andy Clark）在《取代思想》一书中将“标签”描述为一种“增强现实技巧”。通过分配标签的简单行为，我们邀请大脑的模式识别能力来识别它们的相似性并从而预测其他哪些项目也适合该标签。我们实质上也是在调整笔记的信息环境，以突出显示或隐藏与当前任务最相关的功能。

我们将标签视为可以即时创建的虚拟空间，唤起我们对空间导航的直观感觉，以理解复杂的抽象主题。我们能够创建更具体的概念结构，并使用我们的过程更有效的知识导航。

#信息的逻辑特征

在阅粒搜藏的信息处理模式上，所有的信息可以从事理逻辑上可以分为，

事实/概念

经验

观点

数值数据

历史

权威信息（公理、定律、被验证的方法和专业人员发表的观点）

从信息的泛在，到精选和再加工的内容处理过程，一般情况下，我们会：

1 复述/转述--这个在抖音上还挺多人说，就是你自己掌握的标志是，讲给一个完全不懂的人，让他也轻松了解。说实话门槛不低。

2 对这信息能发表自己的想法

3 应对实际客观情况应用信息和知识进入的推理、判断、行为、决策参考

这些都是相对的客观存在、公理性的认知无限接近与“事实”，我说的，是相对中立立场的看待知识信息。大家都知道没有绝对事实，前面都会有价值观、世界观、情感立场会影响你对这个的看法。

#个人知识管理

有效使用标签在个人知识管理中将极大增加你使用的知识管理工具的体验，阅粒搜藏就是用你的个性化 bot 帮你自动打标签分类整理。

##1 可以根据自己的使用习惯定义你的标签体系，除了主题、内容特征的语义标签，也可以定义状态、事件相关性、行动计划等

有了标签，我们就有机会将我们的知识网络化。

--标签应该易于记住

--标签应该易于决定、易用有共识，尽量少歧义，比如你在任何时间定义同一内涵的东西，应该用的是统一的符号

--标签应该是具体的

--标签应支持正确的行为：在这种情况下，使用标签来管理工作流的各个阶段可以有效地使用知识

--标签应该是有包容性的：通过维护标签来运行的组织系统可以方便我们通过网络化的连接最大化效用

##2 必要的时添加新的结构，使用积累的知识信息来指导您需要什么结构

知识信息最有价值的特征之一就是它具有很高的延展性，随着对学科知识的积累和需求的变化，而且随着专业领域研究和知识的增加，我们可以通过逐步增加结构来利用可延展性。

组织知识信息的方式预先决定一种结构，但是在个人知识管理方面，最重要的优先事项是满足您的日常需求，比如快速找到、快速回溯所有相关信息、甚至能帮你梳理和发现更深层次异同和映射到时间线上的变化。

#知识管理的协作与共享

《管理我们的数字资料的科学》中所有研究内容，确定知识信息、数字化资料可用“内部，外部和社交环境以及状态”来描述其“上下文”的信息的四个属性。

##1 你对笔记的想法，感觉，联想，关注和考虑事项，可以通过标签、mark、发布想法、评论等方式得以呈现，并跟这些信息在这个节点建立起关联。

##2 外部的相关的信息，这个通常情况下在开放互联网年代里 href、pingback 是最好的表述，但是目前随着网络部落化的严峻现实，我们也仅仅通过朋友圈截图管窥一二（开玩笑的哈哈），事实上可能需要更多技术手段参与

##3 社交环境是指与评论相关的其他人，例如项目合作者，推荐来源的人或与之共享的人，在搜藏中，我们出我们除了可以自己发表想法，还可以创建共享小组，引入相关的朋友一起对内容和信息本身发表深度思考、评价和讨论，仅限于这群相关的人才能互相浏览

##4 当前状态是指该注释所采取的任何操作，或该评论、followup所使用的任何可交付成果,它可以帮助我们通过标签、事件的关系，在思维建立上下文线索理解的可能。

##5 开发定制的特定于行业的分类标签

哪一种才是“正确的”分类标签法，从古争执到今，亚里士多德认为，知识可以根据其实质，数量，质量，关系，位置，时间，位置，状态，行为和情绪进行分类。Francis Bacon将所有人类知识分为记忆（即历史），理性（即哲学）和想象力（即美术）。Shiyali Ramamrita Ranganathan认为，任何文件都可以根据其个性，物质，能量，空间和时间来定义。

组织信息的历史在很大程度上与“分类法”有关，分类法是一种将信息分类为一个全包模型的分层系统。从这种角度来看，不为使用目的的分类，并不能说不对，只能说没用。

最近看过一个数字图书馆的编目规范的学术研究，感觉从互联网信息、企业信息到传统严格知识分类体系上，差别很明显，各自都在朝着各自更实用的视角进化。

但是对于特定的领域和专业，标签的可扩展性确实很重要，能够兼容通用性，又可以在特定领域引入专用领域，这就是说知识图谱技术可以发挥作用的空间，在通用体系上，可以引入行业、领域专业知识图谱，将极大增强标签易用性、一致性

##6 公共域、私有域、共享域的可见和可用度问题

众所周知，对我们没有用的信息，看起来很每个字都认识，连起来却不知道啥意思的那种，确实对我们来说就是噪音和无意义的信息。

知识信息在阅粒搜藏的体系内，被划分为私有域、共享域、公开域的内容，默认用户是可以轻松访问公开域的内容，但是共享域的内容却需要所有者或者利益相关者授权，私有域内容，只有创建人能看到，其他人都是不能访问的。

为什么设计这么复杂的信息域体系，除了“没用就是噪音”的因素之外，还有搜藏其实支持 OCR、中英英中翻译、office 文件、PDF、markdown、txt 等大量私域内容，需要保护数据隐私。