哈斯日志
纪录我们在网路上奔波的历程!
  • »新帖子
  • AI搜索引擎的兴起:挑战与机遇
  • 系统3:扩展和增强人类决策能力的关键
  • 决策增强与智能知识管理:人脑的第三个系统
  • 知识管理的算法
  • 信息知识管理技能
  • 碎片化阅读、海量信息时代的轻量级知识管理
  • 俞军和他的产品经理课
  • 为什么我们都对搜索不满意却又无可奈何
  • 搜索产品市场机会探讨:头条不做搜索做什么
  • 搜索产品市场机会探讨

  • Reward hasiblog
    知识管理的算法
    星期六, 八月 01, 2020

    有点长,先说观点,其实这篇也是2020 春节前在锐创的时候就写好了,没发出来。


    总结起来 就是,优秀的知识发现、灵活高效的分类标签体系、合理的权重策略、开放的结构和增长进化体系,分层共享 的访问授信机制。



    # 知识的发现

    数字信息的爆炸式增长淹没了我们用于对其进行分类的所有工具。标准的上下位分类目录导航的结构,是自上而下的少量小规模的数据处理范式。亦如上篇提到的.


    我们需要的是自下而上的自动化工具来理解大量数据、节省时间、提高使用效率。Google的PageRank算法使通过网页分析关键字和超链接,而不是通过人工判断为网页分配重要性和含义成为可能。这是一种自底向上的算法方法,可从数据特征的网络关系中计算获得含义。这项技术的要义在于,可以辅助人工判断重要与否并将这个特征量化表达出来、为后续的有效计算提供参数供给。


    在信息到知识的过程中,实际上是一种从泛在的信息的提取加工、并进行价值判断、形成知识工具的过程 ,那么这些泛在的信息在哪里、怎么产生的,以什么形式存在的、怎么发现怎么标引,除了 pagrank还有没有其他更好的方式。若干年前曾经尝试的 people rank 在解决那个维度的问题?


    #信息映射

    根据你的理解认知,建立所掌握的信息知识的关系结构,并能在特定场景/域下的对象和对象的用你掌握的类似、或者相关的逻辑结构来描述


    还有一点建立关联,基于域关联、场景方向,并能识别出场景和域下有多大差异,会导致迁移导致失效或者不完全等价,我一般定位一个知识和场景连接的适应性权重。


    一切困惑均可在历史中寻迹。当我带着困惑的时候,看到了1969年Robert Horn首次发表了一篇论文,概述了“信息映射”。


    信息映射是一种以研究为基础的方法,用来撰写明确、以用户为中心的信息(基于读者需求和信息使用目的),该方法主要被用于设计和撰写商务沟通及技术传播内容,已被全球范围的企业作为内容标准使用。这是创建技术参考的一种新方法。它是一种用于识别,分类和相互关联信息的原理系统,可以使你在复杂的,信息丰富的环境中更轻松地学习、获取信息、消费信息资讯中的知识。Robert E. Horn 的信息分类理论里明确了六种信息类型,几乎涵盖了商务沟通和技术传播的所有内容。根据它们对于读者的用途,这些类型对各元素进行了分类:





    先贤们很早就定义清楚,知识管理信息管理一定是以信息消费的读者的使用要解决的问题形态存在,而抽象出这种存在为中心的逻辑则是定义知识信息存在的结构,以访问为中心的逻辑则更关注的访问的相关性、一致性、易访问


    #知识管理的过程

    从获取的信息,知识化过程纵向抽象来看,包含这么一个过程:

    1 发现、初步学习

    2 重新学习

    3 参考

    4 扩展、延伸

    5 更新变化

    6 作为工具使用,并不断重复 2~6 的过程。


    通常情况下,费曼学习法、康奈尔科学笔记法、思维导图都是对知识的体系化梳理好工具,这些个工具在这里会有助于你整理、梳理、形成体系。


    #标签化你的知识信息

    标签(这里指的是 Tagging,类似于早期  furl、delicious 的taxonomy方式)可帮助我们即时感知,选择和思考的数据分组,以促进行动,而不仅仅是抽象的思想。


    且在不同笔记上标记标签,使我们能够感知跨学科的主题和模式,当前前提是你对你 Tagging的标签有要清晰的内涵定义,不能每次使用的边界都不稳定,这样可以使我们在特定的时刻仅关注最相关的信息,从而改善我们的思维。


    我们的思想塑造环境,然后环境塑造我们的思想。安迪·克拉克(Andy Clark)在《取代思想》一书中将“标签”描述为一种“增强现实技巧”。通过分配标签的简单行为,我们邀请大脑的模式识别能力来识别它们的相似性并从而预测其他哪些项目也适合该标签。我们实质上也是在调整笔记的信息环境,以突出显示或隐藏与当前任务最相关的功能。


    我们将标签视为可以即时创建的虚拟空间,唤起我们对空间导航的直观感觉,以理解复杂的抽象主题。我们能够创建更具体的概念结构,并使用我们的过程更有效的知识导航。 


    #信息的逻辑特征

    在阅粒搜藏的信息处理模式上,所有的信息可以从事理逻辑上可以分为,

    事实/概念

    经验

    观点

    数值数据

    历史

    权威信息(公理、定律、被验证的方法和专业人员发表的观点)


    从信息的泛在,到精选和再加工的内容处理过程,一般情况下,我们会:

    1 复述/转述--这个在抖音上还挺多人说,就是你自己掌握的标志是,讲给一个完全不懂的人,让他也轻松了解。说实话门槛不低。

    2 对这信息能发表自己的想法

    应对实际客观情况应用信息和知识进入的推理、判断、行为、决策参考


    这些都是相对的客观存在、公理性的认知无限接近与“事实”,我说的,是相对中立立场的看待知识信息。大家都知道没有绝对事实,前面都会有价值观、世界观、情感立场会影响你对这个的看法。


    #个人知识管理

    有效使用标签在个人知识管理中将极大增加你使用的知识管理工具的体验,阅粒搜藏就是用你的个性化 bot 帮你自动打标签分类整理。


    ##1  可以根据自己的使用习惯定义你的标签体系,除了主题、内容特征的语义标签,也可以定义状态、事件相关性、行动计划等

    有了标签,我们就有机会将我们的知识网络化。

    --标签应该易于记住

    --标签应该易于决定、易用有共识,尽量少歧义,比如你在任何时间定义同一内涵的东西,应该用的是统一的符号

    --标签应该是具体的

    --标签应支持正确的行为:在这种情况下,使用标签来管理工作流的各个阶段可以有效地使用知识

    --标签应该是有包容性的:通过维护标签来运行的组织系统可以方便我们通过网络化的连接最大化效用


    ##2 必要的时添加新的结构,使用积累的知识信息来指导您需要什么结构

    知识信息最有价值的特征之一就是它具有很高的延展性,随着对学科知识的积累和需求的变化,而且随着专业领域研究和知识的增加,我们可以通过逐步增加结构来利用可延展性。


    组织知识信息的方式预先决定一种结构,但是在个人知识管理方面,最重要的优先事项是满足您的日常需求,比如快速找到、快速回溯所有相关信息、甚至能帮你梳理和发现更深层次异同和映射到时间线上的变化。


    #知识管理的协作与共享

    《管理我们的数字资料的科学》中所有研究内容,确定知识信息、数字化资料可用“内部,外部和社交环境以及状态”来描述其“上下文”的信息的四个属性。


    ##1 你对笔记的想法,感觉,联想,关注和考虑事项,可以通过标签、mark、发布想法、评论等方式得以呈现,并跟这些信息在这个节点建立起关联。


    ##2 外部的相关的信息,这个通常情况下在开放互联网年代里 href、pingback 是最好的表述,但是目前随着网络部落化的严峻现实,我们也仅仅通过朋友圈截图管窥一二(开玩笑的哈哈),事实上可能需要更多技术手段参与


    ##3 社交环境是指与评论相关的其他人,例如项目合作者,推荐来源的人或与之共享的人,在搜藏中,我们出我们除了可以自己发表想法,还可以创建共享小组,引入相关的朋友一起对内容和信息本身发表深度思考、评价和讨论,仅限于这群相关的人才能互相浏览


    ##4 当前状态是指该注释所采取的任何操作,或该评论、followup所使用的任何可交付成果,它可以帮助我们通过标签、事件的关系,在思维建立上下文线索理解的可能。


    ##5 开发定制的特定于行业的分类标签

    哪一种才是“正确的”分类标签法,从古争执到今,亚里士多德认为,知识可以根据其实质,数量,质量,关系,位置,时间,位置,状态,行为和情绪进行分类。Francis Bacon将所有人类知识分为记忆(即历史),理性(即哲学)和想象力(即美术)。Shiyali Ramamrita Ranganathan认为,任何文件都可以根据其个性,物质,能量,空间和时间来定义。


    组织信息的历史在很大程度上与“分类法”有关,分类法是一种将信息分类为一个全包模型的分层系统。从这种角度来看,不为使用目的的分类,并不能说不对,只能说没用。


    最近看过一个数字图书馆的编目规范的学术研究,感觉从互联网信息、企业信息到传统严格知识分类体系上,差别很明显,各自都在朝着各自更实用的视角进化。


    但是对于特定的领域和专业,标签的可扩展性确实很重要,能够兼容通用性,又可以在特定领域引入专用领域,这就是说知识图谱技术可以发挥作用的空间,在通用体系上,可以引入行业、领域专业知识图谱,将极大增强标签易用性、一致性


    ##6 公共域、私有域、共享域的可见和可用度问题

    众所周知,对我们没有用的信息,看起来很每个字都认识,连起来却不知道啥意思的那种,确实对我们来说就是噪音和无意义的信息。


    知识信息在阅粒搜藏的体系内,被划分为私有域、共享域、公开域的内容,默认用户是可以轻松访问公开域的内容,但是共享域的内容却需要所有者或者利益相关者授权,私有域内容,只有创建人能看到,其他人都是不能访问的。


    为什么设计这么复杂的信息域体系,除了“没用就是噪音”的因素之外,还有搜藏其实支持 OCR、中英英中翻译、office 文件、PDF、markdown、txt 等大量私域内容,需要保护数据隐私。


    标签: , , , , , , ,

    阅读《知识管理的算法》更多内容...
    This Written at 八月 01, 2020 by loverty.   ,
    锻炼自己的深度思考能力,避免被芜杂的信息带着走
    星期五, 二月 22, 2019
    每天接收大量的朋友圈微博好友的推荐、订阅的媒体的推荐、搜索关键词的结果,我们的输入增长加速度不断被各种产品技术创新以几何级速度拉升,吸收零散的知识点消耗我们记忆、增加应用时候输出的复杂度和不确定性,迅速消耗掉我们的认知、判断资源。

    接收的信息过于碎片化、重复而且相对独立、还有就是规模巨大,技术和产品化的价值倾向很不一致,使得我们在消费这些信息的时候,一方面需要的找不到、找到的不全面、不权威,更严重的是这些内容缺少足够的提取线索被我们回忆起来、跟我们已有的知识储备建立起关系,最后只能是“万花丛中过,片叶不沾身,事如春梦了无痕”,那就更不用说转化成自己的认知和行动。

    于是,互联网、搜索、推荐引擎、社交网络、社群兴趣社区带来获取信息获取知识的便利,以至于助长了人的怠惰,除了从搜索里获取自己需要的信息,就是靠算法和推荐喂,喂啥就吃啥,越发变的愚昧而不知。遇到任何问题、不清楚的,都是上网找一找,查病症、查小孩发育成长中的遇到的问题、查社会系统中各种事情的办事指南,看其他人怎么说、看其他人怎么办,殊不知,社会、健康等作为复杂系统,不仅时时刻刻存在变化,更是有很多特定情况和约束背景,在特定条件下,某些输入信号才成立,而这个过程中,是否有隐藏层信息没有输入、有多少,你是无法察知的,

    在你熟悉的领域和相关系统里,你跟系统是同步成长,在不相关的空间里,你一旦进入就是个新领域,信息空间坍缩状态,需要不断回溯历史记录和信息,而且每个节点和演进也都有特殊变量存在。这个过程对接收输入的信息、信号那些是重点那些是一般辅助性信息,都需要重新归纳总结进行认知建模,否则follow步骤进行操作,都会有误差,而很多认知建模是消费信息理解文本、信息逻辑层面,少有能直接验证的,除非符合你已经掌握的、已经理解认同的常识、或者符合你的情感认同。科学性在于可以重复验证。

    所以,要解决好这个问题,需要有足够好的跨领域基础知识和认知能力,要有敏捷的分析建模能力,还要有好的归纳总结能力,针对信息输入,能迅速归纳提问,并基于此更有针对性地探索、挖掘新的知识和信息。

    基于信息获取、信息消费、解决问题方面的积累,我觉得核心是建立一个好的认知理解模型,能够极大地帮你在抓住要点、帮你更有效率地去理解吸收信息,为你更好的管理信息到知识到行动的转化。
    1 丰富基础知识和认知能力来源于广泛涉猎、广博的基础知识--我们常说的通识,建立起先验知识prior knowledge。自己兴趣面广泛有积累这是基础,对丰富多彩的大千世界充满好奇,能够让你有兴趣涉猎这些广博、基础、看起来无用的信息。

    2 敏捷的分析建模能力,来自于时时刻刻的思考,主动挖掘信息触点,扩大探索的边界,如果能够不断角色带入、换位思考,跨界思考(在你的认知框架上看它,在你行业专业领域看它,其他行业领域的人怎么看它)、求知若渴,在接收输入后能够不断挑战、思考和深入探究,自然能够建立起自己的分析解决问题框架,针对输入提出有效问题,并不端延伸扩展。

    思考的方法通常就是这集中,思考方法
    比较(compare)、联想(associate)、演绎(deduce)、归纳(induce)
    比如,从看到文章标题标题开始联想,不详细阅读,文章的大概内容是什么,会提及什么、你希望get到什么,推测其内容,通过你对问题的建模和系统化思考,去阅读验证,然后在各个节点上获取重要的信息并形成记忆,不断基于点线面去深度挖掘探索。

    这个过程中,如果不符合预期,那么为什么?超出预期,那么又有哪些点,然后带着这些主题、问题,然后再去找资料,根据主题来查阅资料,而不是根据资料来查阅主题

    3 充分利用最有效的方法去探索,用户搜索引擎,挖掘可供思考的素材是一个有效手段,同时广泛接触领域专家、获得更实践更专业的输入也是很好的方法。不要有了网络,就完全摒弃预传统的方法和路径。

    4 对get到的知识点,尝试用类比的问题求解,即运用积累的信息、知识和经验,想法尝试解决眼下具体的问题。类比相似的问题不断烧脑验证,没有终点。

    5 为了增加记忆、认知的深度,还可以借助结构化思考、可视化思考、清单法筛选等工具,利用A4纸或者白板记录积累想法,反复进行可视化表达,反复书写,也可以通过分享交流碰撞想法观点意见,深化和检验自己的思考和认识。

    这还全面,通常我们看一个事情,都往往有时间和空间的约束,如果我们能有健康的世界观、历史观和价值观,尽可能地以更广阔的空间感上、更长的时间轴从认识和思考这些问题,将能更有清晰的判断

    要提高自己的深度思考能力需要不断实践反馈、思考总结再加以训练,我们都能培养出自己的深度思考能力。

    标签: , ,

    阅读《锻炼自己的深度思考能力,避免被芜杂的信息带着走》更多内容...
    This Written at 二月 22, 2019 by loverty.   ,