哈斯日志
纪录我们在网路上奔波的历程!
  • »新帖子
  • AI搜索引擎的兴起:挑战与机遇
  • 系统3:扩展和增强人类决策能力的关键
  • 决策增强与智能知识管理:人脑的第三个系统
  • 知识管理的算法
  • 信息知识管理技能
  • 碎片化阅读、海量信息时代的轻量级知识管理
  • 俞军和他的产品经理课
  • 为什么我们都对搜索不满意却又无可奈何
  • 搜索产品市场机会探讨:头条不做搜索做什么
  • 搜索产品市场机会探讨

  • Reward hasiblog
    知识管理的算法
    星期六, 八月 01, 2020

    有点长,先说观点,其实这篇也是2020 春节前在锐创的时候就写好了,没发出来。


    总结起来 就是,优秀的知识发现、灵活高效的分类标签体系、合理的权重策略、开放的结构和增长进化体系,分层共享 的访问授信机制。



    # 知识的发现

    数字信息的爆炸式增长淹没了我们用于对其进行分类的所有工具。标准的上下位分类目录导航的结构,是自上而下的少量小规模的数据处理范式。亦如上篇提到的.


    我们需要的是自下而上的自动化工具来理解大量数据、节省时间、提高使用效率。Google的PageRank算法使通过网页分析关键字和超链接,而不是通过人工判断为网页分配重要性和含义成为可能。这是一种自底向上的算法方法,可从数据特征的网络关系中计算获得含义。这项技术的要义在于,可以辅助人工判断重要与否并将这个特征量化表达出来、为后续的有效计算提供参数供给。


    在信息到知识的过程中,实际上是一种从泛在的信息的提取加工、并进行价值判断、形成知识工具的过程 ,那么这些泛在的信息在哪里、怎么产生的,以什么形式存在的、怎么发现怎么标引,除了 pagrank还有没有其他更好的方式。若干年前曾经尝试的 people rank 在解决那个维度的问题?


    #信息映射

    根据你的理解认知,建立所掌握的信息知识的关系结构,并能在特定场景/域下的对象和对象的用你掌握的类似、或者相关的逻辑结构来描述


    还有一点建立关联,基于域关联、场景方向,并能识别出场景和域下有多大差异,会导致迁移导致失效或者不完全等价,我一般定位一个知识和场景连接的适应性权重。


    一切困惑均可在历史中寻迹。当我带着困惑的时候,看到了1969年Robert Horn首次发表了一篇论文,概述了“信息映射”。


    信息映射是一种以研究为基础的方法,用来撰写明确、以用户为中心的信息(基于读者需求和信息使用目的),该方法主要被用于设计和撰写商务沟通及技术传播内容,已被全球范围的企业作为内容标准使用。这是创建技术参考的一种新方法。它是一种用于识别,分类和相互关联信息的原理系统,可以使你在复杂的,信息丰富的环境中更轻松地学习、获取信息、消费信息资讯中的知识。Robert E. Horn 的信息分类理论里明确了六种信息类型,几乎涵盖了商务沟通和技术传播的所有内容。根据它们对于读者的用途,这些类型对各元素进行了分类:





    先贤们很早就定义清楚,知识管理信息管理一定是以信息消费的读者的使用要解决的问题形态存在,而抽象出这种存在为中心的逻辑则是定义知识信息存在的结构,以访问为中心的逻辑则更关注的访问的相关性、一致性、易访问


    #知识管理的过程

    从获取的信息,知识化过程纵向抽象来看,包含这么一个过程:

    1 发现、初步学习

    2 重新学习

    3 参考

    4 扩展、延伸

    5 更新变化

    6 作为工具使用,并不断重复 2~6 的过程。


    通常情况下,费曼学习法、康奈尔科学笔记法、思维导图都是对知识的体系化梳理好工具,这些个工具在这里会有助于你整理、梳理、形成体系。


    #标签化你的知识信息

    标签(这里指的是 Tagging,类似于早期  furl、delicious 的taxonomy方式)可帮助我们即时感知,选择和思考的数据分组,以促进行动,而不仅仅是抽象的思想。


    且在不同笔记上标记标签,使我们能够感知跨学科的主题和模式,当前前提是你对你 Tagging的标签有要清晰的内涵定义,不能每次使用的边界都不稳定,这样可以使我们在特定的时刻仅关注最相关的信息,从而改善我们的思维。


    我们的思想塑造环境,然后环境塑造我们的思想。安迪·克拉克(Andy Clark)在《取代思想》一书中将“标签”描述为一种“增强现实技巧”。通过分配标签的简单行为,我们邀请大脑的模式识别能力来识别它们的相似性并从而预测其他哪些项目也适合该标签。我们实质上也是在调整笔记的信息环境,以突出显示或隐藏与当前任务最相关的功能。


    我们将标签视为可以即时创建的虚拟空间,唤起我们对空间导航的直观感觉,以理解复杂的抽象主题。我们能够创建更具体的概念结构,并使用我们的过程更有效的知识导航。 


    #信息的逻辑特征

    在阅粒搜藏的信息处理模式上,所有的信息可以从事理逻辑上可以分为,

    事实/概念

    经验

    观点

    数值数据

    历史

    权威信息(公理、定律、被验证的方法和专业人员发表的观点)


    从信息的泛在,到精选和再加工的内容处理过程,一般情况下,我们会:

    1 复述/转述--这个在抖音上还挺多人说,就是你自己掌握的标志是,讲给一个完全不懂的人,让他也轻松了解。说实话门槛不低。

    2 对这信息能发表自己的想法

    应对实际客观情况应用信息和知识进入的推理、判断、行为、决策参考


    这些都是相对的客观存在、公理性的认知无限接近与“事实”,我说的,是相对中立立场的看待知识信息。大家都知道没有绝对事实,前面都会有价值观、世界观、情感立场会影响你对这个的看法。


    #个人知识管理

    有效使用标签在个人知识管理中将极大增加你使用的知识管理工具的体验,阅粒搜藏就是用你的个性化 bot 帮你自动打标签分类整理。


    ##1  可以根据自己的使用习惯定义你的标签体系,除了主题、内容特征的语义标签,也可以定义状态、事件相关性、行动计划等

    有了标签,我们就有机会将我们的知识网络化。

    --标签应该易于记住

    --标签应该易于决定、易用有共识,尽量少歧义,比如你在任何时间定义同一内涵的东西,应该用的是统一的符号

    --标签应该是具体的

    --标签应支持正确的行为:在这种情况下,使用标签来管理工作流的各个阶段可以有效地使用知识

    --标签应该是有包容性的:通过维护标签来运行的组织系统可以方便我们通过网络化的连接最大化效用


    ##2 必要的时添加新的结构,使用积累的知识信息来指导您需要什么结构

    知识信息最有价值的特征之一就是它具有很高的延展性,随着对学科知识的积累和需求的变化,而且随着专业领域研究和知识的增加,我们可以通过逐步增加结构来利用可延展性。


    组织知识信息的方式预先决定一种结构,但是在个人知识管理方面,最重要的优先事项是满足您的日常需求,比如快速找到、快速回溯所有相关信息、甚至能帮你梳理和发现更深层次异同和映射到时间线上的变化。


    #知识管理的协作与共享

    《管理我们的数字资料的科学》中所有研究内容,确定知识信息、数字化资料可用“内部,外部和社交环境以及状态”来描述其“上下文”的信息的四个属性。


    ##1 你对笔记的想法,感觉,联想,关注和考虑事项,可以通过标签、mark、发布想法、评论等方式得以呈现,并跟这些信息在这个节点建立起关联。


    ##2 外部的相关的信息,这个通常情况下在开放互联网年代里 href、pingback 是最好的表述,但是目前随着网络部落化的严峻现实,我们也仅仅通过朋友圈截图管窥一二(开玩笑的哈哈),事实上可能需要更多技术手段参与


    ##3 社交环境是指与评论相关的其他人,例如项目合作者,推荐来源的人或与之共享的人,在搜藏中,我们出我们除了可以自己发表想法,还可以创建共享小组,引入相关的朋友一起对内容和信息本身发表深度思考、评价和讨论,仅限于这群相关的人才能互相浏览


    ##4 当前状态是指该注释所采取的任何操作,或该评论、followup所使用的任何可交付成果,它可以帮助我们通过标签、事件的关系,在思维建立上下文线索理解的可能。


    ##5 开发定制的特定于行业的分类标签

    哪一种才是“正确的”分类标签法,从古争执到今,亚里士多德认为,知识可以根据其实质,数量,质量,关系,位置,时间,位置,状态,行为和情绪进行分类。Francis Bacon将所有人类知识分为记忆(即历史),理性(即哲学)和想象力(即美术)。Shiyali Ramamrita Ranganathan认为,任何文件都可以根据其个性,物质,能量,空间和时间来定义。


    组织信息的历史在很大程度上与“分类法”有关,分类法是一种将信息分类为一个全包模型的分层系统。从这种角度来看,不为使用目的的分类,并不能说不对,只能说没用。


    最近看过一个数字图书馆的编目规范的学术研究,感觉从互联网信息、企业信息到传统严格知识分类体系上,差别很明显,各自都在朝着各自更实用的视角进化。


    但是对于特定的领域和专业,标签的可扩展性确实很重要,能够兼容通用性,又可以在特定领域引入专用领域,这就是说知识图谱技术可以发挥作用的空间,在通用体系上,可以引入行业、领域专业知识图谱,将极大增强标签易用性、一致性


    ##6 公共域、私有域、共享域的可见和可用度问题

    众所周知,对我们没有用的信息,看起来很每个字都认识,连起来却不知道啥意思的那种,确实对我们来说就是噪音和无意义的信息。


    知识信息在阅粒搜藏的体系内,被划分为私有域、共享域、公开域的内容,默认用户是可以轻松访问公开域的内容,但是共享域的内容却需要所有者或者利益相关者授权,私有域内容,只有创建人能看到,其他人都是不能访问的。


    为什么设计这么复杂的信息域体系,除了“没用就是噪音”的因素之外,还有搜藏其实支持 OCR、中英英中翻译、office 文件、PDF、markdown、txt 等大量私域内容,需要保护数据隐私。


    标签: , , , , , , ,

    阅读《知识管理的算法》更多内容...
    This Written at 八月 01, 2020 by loverty.   ,
    怎么管理自己的笔记和文档
    星期二, 十月 08, 2019
    怎么管理自己的笔记和文档

    原创: loverty 哈斯日志 7月17日 #知识管理 #信息管理 #竞争情报, 


    每天把数字化过程中我们在比特海洋的输入当作是一种数据资产的积累的话,其实我们每天通过各种数字终端各种传感器和输入形成了比较丰厚的积累。

    有些显性数据资产,比如我们自己的思考笔记备忘以及其他各种通道进来的跟我们相关的文件图片等。 这些数据资产如果能得到有效积累、语义化处理,随时可以调用帮我们度量和解决当前场景的问题,这必然是一个非常有价值的事情。

    我讨论这个问题,主要想解决一个问题:我手机、电脑、微信上、备忘录里有很多记录和保存的图文信息、文档文件,是否有一个更好地语义化的方式帮我们整理加工、又能很好保持私密性,提供丰富的搜索分类和应用机制,方便我随时查阅调用? 

    我分两块来说,其一是笔记类,其二是文件类。笔记这是我目前的主要信息管理、知识管理的方式之一, 在10年前,还不是以手机和电脑处理信息为主的,占据我信息处理的主要位置的是通过笔记本记录(我说的是真的笔记本....)。

    从目前的还存在的书本大概还有7、8本记事本。
    主要记录几类内容
    --工作内容,todo list
    --针对特定的问题我的思考和解决思路的思维导图
    --重要会议纪要
    --各种读书笔记、摘要


    后来,随着使用电脑时间不断加长、办公以电脑为主,所以很多信息都开始用电脑整理加工和保存。这个阶段,主要是用文件夹、word等文字处理工具,写在本地,保存在特定文件夹里。

     再之后,智能手机进入日常,通过手机订阅阅读、通过手机记录事项和思考, 这个阶段早期,基本只能靠email。

    写个邮件发给自己或者另一个邮箱,然后电脑端通过邮件查收,来实现跨平台同步和信息的保存。这个阶段主要是Gmail、163邮箱上这种邮件大概有大几百封。 


    这个时候其实除了email文字文件同步、还有一些是通过附件形式来搞的,比如本地用office办公软件或者txt写。通过邮箱、网盘来同步跨端查阅使用。类似这样的需求的人不少,后来邮箱服务商大部分都提供了在邮箱内的记事本、附件预览、网盘等功能,大大方便了这种使用方式的体,只是空间很小,还都是以个位数的M记,这大概是云同步的雏形。 

    再后来有各种跨端文本同步工具,可以同步记事本同步笔记,这里边大部分内容是文本、图文记录,所以这类信息主要放在备忘录、各种笔记软件里。

    用过目前主流的所有笔记类软件,evernote、有道云笔记、微信收藏夹、备忘录,为知笔记、onenote、石墨、Google doc等,很早之前还写过evernote的一个思考文章

    这个抽象了所有跟图文加工的需求和应用场景,并实现了多端打通、数据同步、云端保存的体验,很方便。 

    目前的文档笔记类软件都没有办法针对内容本身进行理解和索引,有些技能有但也特别弱,我主要通过文件命名、主题+时间建立目录、模糊搜索方式来管理文件和笔记, 年月日主题关键词来命名方式,可以是文件夹或者文件名本身,主要信息其实时间信号会更容易定位。比如,一般我记录的信息是按照这种方式命名,[年月日][who][什么事][在哪里][会议/讨论/研究/吃饭] 年月日:20190716,这种,一般笔记软件都会显示记录时间信息,但是用时间找并不方便,且不够显性化,所以我会直接打时间标签。
    [who]是个很重要的信息,可能是人名、机构、团队、组织等关键对象,
    [什么事]就是事情的关键点,比如说儿童教育主题,
    [在哪里]这个主要是在使用信息的时候,帮我建立起来场景化关联,让我更具像地能回溯到彼时彼地,很好建立其信息本身内在的关系和逻辑、能获得更多更细节的输入。 主题和时间建立目录,主要是通过事情的关键词+年月日,其实主要是这个事的关键线索,如果让自己大脑记住一堆相关、重叠、乱序的事情的信息、画面,其实蛮难的,也容易在需要的时候想不起来,关键线索显性化,会大大加速你找到相关信号和关联的效率。

    第三中方式就是用平台工具提供的搜索,尽管普遍比搜索引擎的技能要弱一些,但是模糊搜索还是能帮着提高不少效率。 

    还是有大头的记录、笔记、文件,其实主要是在自己的电脑里,保存在本地的文档和文件如何更快速定位、找到、方便使用,一直是个问题,而且这些文档、文件基本上散落在u盘、移动硬盘解决,或者电脑里, 早期还用过Google desktop search、百度桌面搜索这样的本地搜索工具,我之前也曾经介绍过一个很好用的everthing等本地文件搜索、mac上Alfred,都可以实现比较好的本地文件内容级别搜索,但是如果你文件分布的比较离散,而且有些很多内容还不在这个电脑上的话,这就没有办法了。 

    我自己的本地文件,目前还是主流,我通过两种方式来解决, 其一是用软件实现本地文档全文索引,方便需要的时候查询找到,我主要用AIfred。 其二也是建立一个良好的信息组织方式,我喜欢用时间+主题来组织,所以我会以这两个维度建一到两级的目录,

     (1)创建目录类别或者文件夹,这里主要是针对不同目的、不同事项的,比如在windows软件、产品经理培训等、相册备份等。 在分类目录体系,我一般喜欢最多分两级,多数情况都是一级。 比如,相册备份--->20160302iPhone7plus

    (2)以时间区间为维度,在时间区间内再用不同主题下分一下,并且以主题命名。比如,201903--->

    X项目 每个人可以按照自己的习惯和偏好规划自己的方式。



    只要符合自己认知和使用习惯,能够足够方便地在需要的时候快速找到,这就是目标。 目前我主要是通过云盘存储近期高频使用的文件在网络端,方便不同终端、随时按需调用,基本上就是一个云同步的功能。

    我个人的信息管理、知识管理终于要是通过几个方式,他能让我当前在做一些事情或者需要一些判断决策的时候,很快能在找到跟这个事情相关的历史背景、信息和相关的人、事情,帮我更好分析问题解决问题。 

    针对这个话题你有什么好的方法么?你手机里,有多少的文档、文件?你是怎么做管理归类的。

    标签: , , , , , , , , , ,

    阅读《怎么管理自己的笔记和文档》更多内容...
    This Written at 十月 08, 2019 by loverty.   ,