哈斯日志
纪录我们在网路上奔波的历程!
  • »新帖子
  • AI搜索引擎的兴起:挑战与机遇
  • 系统3:扩展和增强人类决策能力的关键
  • 决策增强与智能知识管理:人脑的第三个系统
  • 知识管理的算法
  • 信息知识管理技能
  • 碎片化阅读、海量信息时代的轻量级知识管理
  • 俞军和他的产品经理课
  • 为什么我们都对搜索不满意却又无可奈何
  • 搜索产品市场机会探讨:头条不做搜索做什么
  • 搜索产品市场机会探讨

  • Reward hasiblog
    知识管理的算法
    星期六, 八月 01, 2020

    有点长,先说观点,其实这篇也是2020 春节前在锐创的时候就写好了,没发出来。


    总结起来 就是,优秀的知识发现、灵活高效的分类标签体系、合理的权重策略、开放的结构和增长进化体系,分层共享 的访问授信机制。



    # 知识的发现

    数字信息的爆炸式增长淹没了我们用于对其进行分类的所有工具。标准的上下位分类目录导航的结构,是自上而下的少量小规模的数据处理范式。亦如上篇提到的.


    我们需要的是自下而上的自动化工具来理解大量数据、节省时间、提高使用效率。Google的PageRank算法使通过网页分析关键字和超链接,而不是通过人工判断为网页分配重要性和含义成为可能。这是一种自底向上的算法方法,可从数据特征的网络关系中计算获得含义。这项技术的要义在于,可以辅助人工判断重要与否并将这个特征量化表达出来、为后续的有效计算提供参数供给。


    在信息到知识的过程中,实际上是一种从泛在的信息的提取加工、并进行价值判断、形成知识工具的过程 ,那么这些泛在的信息在哪里、怎么产生的,以什么形式存在的、怎么发现怎么标引,除了 pagrank还有没有其他更好的方式。若干年前曾经尝试的 people rank 在解决那个维度的问题?


    #信息映射

    根据你的理解认知,建立所掌握的信息知识的关系结构,并能在特定场景/域下的对象和对象的用你掌握的类似、或者相关的逻辑结构来描述


    还有一点建立关联,基于域关联、场景方向,并能识别出场景和域下有多大差异,会导致迁移导致失效或者不完全等价,我一般定位一个知识和场景连接的适应性权重。


    一切困惑均可在历史中寻迹。当我带着困惑的时候,看到了1969年Robert Horn首次发表了一篇论文,概述了“信息映射”。


    信息映射是一种以研究为基础的方法,用来撰写明确、以用户为中心的信息(基于读者需求和信息使用目的),该方法主要被用于设计和撰写商务沟通及技术传播内容,已被全球范围的企业作为内容标准使用。这是创建技术参考的一种新方法。它是一种用于识别,分类和相互关联信息的原理系统,可以使你在复杂的,信息丰富的环境中更轻松地学习、获取信息、消费信息资讯中的知识。Robert E. Horn 的信息分类理论里明确了六种信息类型,几乎涵盖了商务沟通和技术传播的所有内容。根据它们对于读者的用途,这些类型对各元素进行了分类:





    先贤们很早就定义清楚,知识管理信息管理一定是以信息消费的读者的使用要解决的问题形态存在,而抽象出这种存在为中心的逻辑则是定义知识信息存在的结构,以访问为中心的逻辑则更关注的访问的相关性、一致性、易访问


    #知识管理的过程

    从获取的信息,知识化过程纵向抽象来看,包含这么一个过程:

    1 发现、初步学习

    2 重新学习

    3 参考

    4 扩展、延伸

    5 更新变化

    6 作为工具使用,并不断重复 2~6 的过程。


    通常情况下,费曼学习法、康奈尔科学笔记法、思维导图都是对知识的体系化梳理好工具,这些个工具在这里会有助于你整理、梳理、形成体系。


    #标签化你的知识信息

    标签(这里指的是 Tagging,类似于早期  furl、delicious 的taxonomy方式)可帮助我们即时感知,选择和思考的数据分组,以促进行动,而不仅仅是抽象的思想。


    且在不同笔记上标记标签,使我们能够感知跨学科的主题和模式,当前前提是你对你 Tagging的标签有要清晰的内涵定义,不能每次使用的边界都不稳定,这样可以使我们在特定的时刻仅关注最相关的信息,从而改善我们的思维。


    我们的思想塑造环境,然后环境塑造我们的思想。安迪·克拉克(Andy Clark)在《取代思想》一书中将“标签”描述为一种“增强现实技巧”。通过分配标签的简单行为,我们邀请大脑的模式识别能力来识别它们的相似性并从而预测其他哪些项目也适合该标签。我们实质上也是在调整笔记的信息环境,以突出显示或隐藏与当前任务最相关的功能。


    我们将标签视为可以即时创建的虚拟空间,唤起我们对空间导航的直观感觉,以理解复杂的抽象主题。我们能够创建更具体的概念结构,并使用我们的过程更有效的知识导航。 


    #信息的逻辑特征

    在阅粒搜藏的信息处理模式上,所有的信息可以从事理逻辑上可以分为,

    事实/概念

    经验

    观点

    数值数据

    历史

    权威信息(公理、定律、被验证的方法和专业人员发表的观点)


    从信息的泛在,到精选和再加工的内容处理过程,一般情况下,我们会:

    1 复述/转述--这个在抖音上还挺多人说,就是你自己掌握的标志是,讲给一个完全不懂的人,让他也轻松了解。说实话门槛不低。

    2 对这信息能发表自己的想法

    应对实际客观情况应用信息和知识进入的推理、判断、行为、决策参考


    这些都是相对的客观存在、公理性的认知无限接近与“事实”,我说的,是相对中立立场的看待知识信息。大家都知道没有绝对事实,前面都会有价值观、世界观、情感立场会影响你对这个的看法。


    #个人知识管理

    有效使用标签在个人知识管理中将极大增加你使用的知识管理工具的体验,阅粒搜藏就是用你的个性化 bot 帮你自动打标签分类整理。


    ##1  可以根据自己的使用习惯定义你的标签体系,除了主题、内容特征的语义标签,也可以定义状态、事件相关性、行动计划等

    有了标签,我们就有机会将我们的知识网络化。

    --标签应该易于记住

    --标签应该易于决定、易用有共识,尽量少歧义,比如你在任何时间定义同一内涵的东西,应该用的是统一的符号

    --标签应该是具体的

    --标签应支持正确的行为:在这种情况下,使用标签来管理工作流的各个阶段可以有效地使用知识

    --标签应该是有包容性的:通过维护标签来运行的组织系统可以方便我们通过网络化的连接最大化效用


    ##2 必要的时添加新的结构,使用积累的知识信息来指导您需要什么结构

    知识信息最有价值的特征之一就是它具有很高的延展性,随着对学科知识的积累和需求的变化,而且随着专业领域研究和知识的增加,我们可以通过逐步增加结构来利用可延展性。


    组织知识信息的方式预先决定一种结构,但是在个人知识管理方面,最重要的优先事项是满足您的日常需求,比如快速找到、快速回溯所有相关信息、甚至能帮你梳理和发现更深层次异同和映射到时间线上的变化。


    #知识管理的协作与共享

    《管理我们的数字资料的科学》中所有研究内容,确定知识信息、数字化资料可用“内部,外部和社交环境以及状态”来描述其“上下文”的信息的四个属性。


    ##1 你对笔记的想法,感觉,联想,关注和考虑事项,可以通过标签、mark、发布想法、评论等方式得以呈现,并跟这些信息在这个节点建立起关联。


    ##2 外部的相关的信息,这个通常情况下在开放互联网年代里 href、pingback 是最好的表述,但是目前随着网络部落化的严峻现实,我们也仅仅通过朋友圈截图管窥一二(开玩笑的哈哈),事实上可能需要更多技术手段参与


    ##3 社交环境是指与评论相关的其他人,例如项目合作者,推荐来源的人或与之共享的人,在搜藏中,我们出我们除了可以自己发表想法,还可以创建共享小组,引入相关的朋友一起对内容和信息本身发表深度思考、评价和讨论,仅限于这群相关的人才能互相浏览


    ##4 当前状态是指该注释所采取的任何操作,或该评论、followup所使用的任何可交付成果,它可以帮助我们通过标签、事件的关系,在思维建立上下文线索理解的可能。


    ##5 开发定制的特定于行业的分类标签

    哪一种才是“正确的”分类标签法,从古争执到今,亚里士多德认为,知识可以根据其实质,数量,质量,关系,位置,时间,位置,状态,行为和情绪进行分类。Francis Bacon将所有人类知识分为记忆(即历史),理性(即哲学)和想象力(即美术)。Shiyali Ramamrita Ranganathan认为,任何文件都可以根据其个性,物质,能量,空间和时间来定义。


    组织信息的历史在很大程度上与“分类法”有关,分类法是一种将信息分类为一个全包模型的分层系统。从这种角度来看,不为使用目的的分类,并不能说不对,只能说没用。


    最近看过一个数字图书馆的编目规范的学术研究,感觉从互联网信息、企业信息到传统严格知识分类体系上,差别很明显,各自都在朝着各自更实用的视角进化。


    但是对于特定的领域和专业,标签的可扩展性确实很重要,能够兼容通用性,又可以在特定领域引入专用领域,这就是说知识图谱技术可以发挥作用的空间,在通用体系上,可以引入行业、领域专业知识图谱,将极大增强标签易用性、一致性


    ##6 公共域、私有域、共享域的可见和可用度问题

    众所周知,对我们没有用的信息,看起来很每个字都认识,连起来却不知道啥意思的那种,确实对我们来说就是噪音和无意义的信息。


    知识信息在阅粒搜藏的体系内,被划分为私有域、共享域、公开域的内容,默认用户是可以轻松访问公开域的内容,但是共享域的内容却需要所有者或者利益相关者授权,私有域内容,只有创建人能看到,其他人都是不能访问的。


    为什么设计这么复杂的信息域体系,除了“没用就是噪音”的因素之外,还有搜藏其实支持 OCR、中英英中翻译、office 文件、PDF、markdown、txt 等大量私域内容,需要保护数据隐私。


    标签: , , , , , , ,

    阅读《知识管理的算法》更多内容...
    This Written at 八月 01, 2020 by loverty.   ,
    搜索产品市场机会探讨:头条不做搜索做什么
    星期二, 十月 08, 2019

    搜索到底有没有机会?(三)

     loverty 哈斯日志 1010月2日 搜索引擎 今日头条 字节跳动 bytedance 移动搜索

    这里说的搜索先做个约定,指的是以文本或者语音输入搜索请求,来通过产品和后台系统获得在大规模数据集合里返回符合需要的信息,表现形式可以是搜索框输入的形态,亦可以是语音输入等方式,并能够提供好的信息消费价值转换体验、当然能在信息召回,提供问题解决的信息消费闭环,则更有效了。搜索的核心价值是找到,围绕这个价值点延伸体验和衍生需求都应该是这个价值闭环的重要组成部分。

    前几篇文章推送后,不少老朋友跟我交流的一个重要议题,比如推荐、语音助手、问答机器人是不是搜索,个人认为这都算泛搜索形态。所以,大家聊过之后普遍有一个共识,现在的搜索引擎的体验太差了,尤其是“找到”这个层面,而且这不是一个技术问题,而是体验创新上没有张力了

    任何一个产品成为一个时代标签的产品,都是很多趋势恰好同时相遇,比如我们讨论移动互联网社交、通讯、移动支付、推荐引擎、本地生活、出行通勤服务,比较典型地体现了趋势的价值,智能手机的大幅度降低使用门槛、价格降低极大增加了人群的覆盖、同时为此支持所构建的3G网络基础设施到4G网络基础设施的演进、手机上网资费的大幅度的下降,这些事情基本可以说互为因果,并不能单一地说,因为这些公司的产品做的好,就带来了称霸一域的机会。体验做的比别同期其他产品、公司强,这是必要条件,不是充分条件,这一切加起来恰好才使得这一创新和体验驱动的大规模落地形成了这个时段增长的引擎。这段述说,主要是想说,搜索在这个阶段是个从属者、享受了红利,并没有因为体验创新和技术创新带来新的价值增长,这是一个客观现象。

    搜索进入到移动时代,基本的用户覆盖一直在上行,却没有形成在移动上统一搜索入口的品牌、路径和习惯。百度是PC的搜索品牌形象在移动上平行迁移,目前在手机上用百度搜索恐怕你已经在潜意识里有一个界定,就是找网页,这个是相当solid而且规模很大的一个需求。然后更有商业价值的流量在此进入搜索类产品之前就被分流走了,比如去了垂直APP、比如去了微博、头条、微信和知乎,去了电商交易、旅行、通行、本地生活服务APP。

    PC时代搜索引擎相对单一入口,比如搜索门户、浏览器默认,所以搜索行为和流量的收敛更容易,而移动时代这种变化则是颠覆性的,移动APP都是屏幕独占、移动APP从数量上讲,已经接近500万个了,哈斯日志前一篇文章提到了,中文网站数也大致相当,算各种封闭生态的各种号微博号头条号公众号、各种快应用,移动时代创作和内容承接的题要丰富的多的多,PC才时代才多少生产者,移动时代这个规模大大增加。但是移动时代到底有没有找到一条信息的全部副本集的、对信息的丰富有强烈的需求?用户搜索一个信息,你给他返回说,在N个APP找到了N个跟这个词相关的结果,我个人使用感受来说,没有这个需求,我只需要找到即可,2017年Q2团队几个小伙伴做过一个全局搜索,把web content做结构化展示直接在手机搜索直接召回信息本身,测试体验和数据效果还可以。


    概括一下,在移动搜索需求体现出几个明显特征
    (1)对精准和效率有更高的要求,曾经做过 一个分析,前3条搜索结果满足95%的占比很高。
    (2)入口更随意,以方便为准 ,反正对那个框里能够满足什么样的需求,其实在进入APP的icon这个层级已经有了区分和取舍,缺乏统一入口和强势品牌入口影响。
    (3)穿透APP里的内容和数据,建立统一搜索方式获取消费内容的入口,可能是长线大一统的根本路径。我曾经尝试过,并没有显著成果。最近听说一帮Google的同学出来创业做这个方向。

    今天的话题主要想聊聊,今日头条为什么在这样一个节点,明显不是一个强势增长的领域,头条倒是大规模投入资源进入这个市场?头条为什么必须做搜索?搜索市场作为存量市场的商业价值增长支点在哪里,效率能不能更高。

    1  在移动时代不一样了,搜索几乎成了所有有一定规模的内容APP必须具备的基本能力,所以基本上你看到一个类似搜索框就可以去搜索。尽快能力和效果良莠不齐,但是对用户基本上已经形成一个客观引导和认知,手机设备上,并没有唯一搜索入口和路径约束。

    搜索入口碎片化,与用户使用搜索行为之间在互相教育,最后形成的是在移动上,去通用搜索里搜的行为集中度变低了,用户对品牌化搜索产品的诉求需求更离散,基本变成在其他地方找不到的时候才会想起来去搜索。另一个角度上,浏览器APP、系统搜索框又从底层在侵入。

    2  通用搜索引擎产品是一个趋于成熟期的产品,换句话说,增长空间、用户价值、市场价值都是可以伸伸脖子就能看到峰顶的状态,而手机上搜索流量主要分布在,国内目前每天承接搜索量较大的入口,百度、手机厂商浏览器默认、各大手机浏览器、微信微博和头条这样的平台级应用、手机负一屏和全局搜索入口等。

    市场进入的新玩家提供可类比的产品体验的体验差异、支持体验的成本、用户访问的生命周期商业价值也都不会有明显的优势。当然,如果产品体验差异明显、价值替代能力强,其实还是能做到更好的体验的,更好的体验往往意味着更高的价值产出,从获客成本到生命周期价值角度来衡量,粗略的算了一下,Google人均季度内单个用户的生命周期商业价值贡献也就只有百度的6倍,而总收入差距放到了10倍,这个差距被放到了更大。

    所以,作为市场后进入者的头条能不能找到这一差异化价值替代能力强的着力点,如果头条搜索只是百度的全网搜索的另一镜像版本,这个价值是不够的。在上一篇比较文章中,我提到了,头条搜索的价值落脚点,可见范围对标的还是偏向于微博搜索,对资讯、热点、八卦和消遣性信息的value,并不断在这个层次上拉大价值差异度,但是其实蛮难的,从内容创作生态来看,微博的内容生产、内容稀缺程度还是要略强悍。

    3  头条宣布头条搜索市场化说明他们自认为准备好了,这个准备好了包含产品、技术研发体系、商业变现、内容生态、流量生态。这一点在这个话题的有大量公开信息。搜藏上我也建立了一个小组专门分享这一主题的信息、资讯和数据,我们可以一起来研究。

    4 从各种第三方监测数据来看,搜索更像是已有流量的用户生命周期价值挖掘、是个衍生商业能力,而不是用户需求或体验的补充,至少目前做到用户覆盖比微博的搜索用户占比还是略低。

    5 我其实叨叨那么多,头条为啥还非要做?换个思路想一下,如果头条不做搜索做什么。众所周知,广告、电商、游戏和互金(小贷、理财、众筹、保险、虚拟信用卡等),是目前规模化流量变现的主要方式,今日头条或者大部分toC的产品,通过产品化低成本获取和积蓄流量池,在此基础上做商业变现,能做的也就是这些,而信息服务和社交又是最底层需求广泛人群庞大的用户产品的底层逻辑,以这种方式搭配组合实现变现或套利。

    所以从头条APP是一种新闻资讯APP,过去三年的用户覆盖、时长以及活跃度来看,资讯浏览已经先达看到山尖的状态。而在这个技术上,把流量洗到一个新的增长型、或者收益更大的模型上,进而不断在流量基础上挖掘更大的商业价值,才是下一步的重要诉求。我就是说,通过头条极速版再把低价值信息消费(这里专指非效率优先的消费需求,不要过度解读)人群再分流一次,通过搜索、浏览的加深和衍生、延长用户生命周期价值贡献,在这上面做广告游戏电商金融的商业化转化。

    所以头条聚焦于浏览和搜索上主题聚合,来衍生用户的访问路径深化和时间的延长。聚焦于把聚合的信息簇社区化,比如加入主题小组、加入搜索,都是在某种意义上去衍生单个用户生命周期价值。

    与其他的搜索产品相比,走的效率优先的产品价值导向不同的是,头条更倾向于用户使用的碎片化时间,更多的时长、更多访问Pageview贡献。

    6  那么搜索市场作为存量市场的商业价值增长支点在哪里,效率能不能更高?这个要从两个角度看,搜索跟推荐的互相替代的临界体验点在哪里,头条系产品,其实都是典型打碎片化时间和娱乐消遣为主,这一点跟搜索的价值导向和效率优先的价值导向是矛盾的,推荐并不是以用户效率优先,而是时长优先,而搜索是找到目标的效率优先,所以搜索又很难形成所谓的碎片化时间来刷一刷的诉求。

    越来越多的人在消费微博信息的时候不是发timeline为主要停留,而是以热榜、以各种场景化的聚合来形成landing和转化,也是很明显地体现了这一点。

    在碎片化时间的使用上,目前在社交通讯上,微信和朋友圈,其二,是游戏。前几年我做社交产品,当时做过一个研究,其实用户的碎片化时间,可以按照时间区间切分,可能会对用户心智的侵占会更有效,比如5分钟时间看啥?在微信上打打小游戏?10分钟以内的王者荣耀、比如20分钟的刺激战场,这个是没有严格意义的论证,只是根据我和身边的人群的工作情况做的简单切割,对效率优先的人群这样的判断才有意义。

    其实对于没有严格意义的效率追求的人群来说,这种判断是没有意义的,对没有效率要求的人群而言,陪伴、关注、互动才是主要需求,泛大众化市场上的自上而下的广播、自下而上的关注、围观才是常态,这也是微博在调整内容生产生态策略以后带来的第二春的重要原因。

    7  稍微了解头条团队和他们做的创新尝试的情况的人都清楚,其实头条从业务基本盘,产品形态覆盖几乎我们目前能看到的所有主流产品形态,尽快你熟知就那么几个,是大部分你还不知道而已,或收购后持续发展在垂直领域独占一域,或者在垂直人群、细分市场已经有相当影响力,而大众市场则还默默无闻,在头条系的产品矩阵,用户覆盖范围已经超过我们的了解。

    而金融、财经貌似因为互金规范化等宏观因素的影响,而客观上能形成规模化收益增长的就只有游戏、直播、广告--当然这个广高的增长基本上都不是传统的搜索广告中小覆盖为主,而是大平台比如阿里京东的广告的用户群触达。所以,搜索是支撑头条商业收入上一个台阶的重要承载。

    另外一点,就是头条系APP能够触达的流量里,用户的识别、广告重定向的水平及商业变现的效率是能做到比同类竞品更好的效果的,头条sdk在优化的行为去获取用户、设备识别上很强,加上优秀的算法,另外还因为头条的广告生而为了移动转化,所以效率要比传统的广告联盟的变现能力要强。这个是头条广告联盟的伙伴们可以分享一下你们的经验。

    对比其他搜索厂商,还在花大量时间引导客户投放物料移动适配相比,Google的ads升级、阿里妈妈、百度广告联盟都是在移动化上做了很大优化,这既是契机又是包袱。这一点上,头条可能略占便宜。搜索流量是变现效率其他业态变现效率更高的玩法、规模化能力更强。

    8   头条现在做搜索很明显是比切入其他领域收益价值更大的事情,严重怀疑头条弄一堆SNS产品其实是烟雾弹。

    9   移动搜索还是个流量生意,核心竞争力来自对路径的效率,而这一点又是厂商和搜索引擎服务商博弈的一个重要点,厂商以为自己也能 做个搜索, 搜索厂商更夸张,为了拿下厂商的默认流量,几乎这些流量上的收入全部给厂商、甚至有些还要赔钱,那结局就像房地产泡沫。

    手机厂商终究会明白,只有一个APP搜索应用下载的需求+浏览器默认搜索应该不太能养的起搜索投放变现、广告销售体系这一摊。(当然你可以嘲笑我,5年前,厂商力推自己的应用市场的时候,搜索厂商和应用商店平台也是这么想的,呵呵)

    搜索厂商也迟早会明白,早把自己变成后面的数据服务公司、算法SAAS服务才是坐地赚钱的正确之道。现在错位到各自都想成为这摊生意的controller,这种争霸的思维使得商业市场的money test的价值在被稀释摊薄,更难以形成规模化优势、难以以体验的平衡来协同增长。

    10   跨APP搜索里边的内容,形成更广泛、多样的内容覆盖,而不是有用PC web上网页内容来填充移动搜索的体验,这应该是有巨大期待和共识的一件事。不知道能不能通过快应用联盟、小程序生态等这些部落之间的准签机制,实现内容消费的体验最优化,作为网民,我有需要我也强烈期待。头条搜索不是干这个的,厂商负一屏搜索有这样的价值。总体上我的观点是,搜索业态通过技术创新和产品创新依然能够获得较高的变现能力,但是这种姿势只是一种商业模式的延续,必须通过商业模式的创新,才能获得更高商业附加值的获得。

    标签: , , , , , , , , , ,

    阅读《搜索产品市场机会探讨:头条不做搜索做什么》更多内容...
    This Written at 十月 08, 2019 by loverty.   ,
    需求的理解是个问题
    星期五, 八月 01, 2008

    今天突然特别想把鼠标的邮件菜单给他收拾收拾,现在这种功能排布太不好用.比如鼠标右键"电子邮件图片和打印图片"两个菜单项.没啥用,还把右键重要位置给占了.

    百度一下,看看高手们怎么删除的.结果百分之九十五的人都是说,用超级兔子或者优化大师,里边定义右键菜单来解决.呵呵,基本上说明,这些人要不就是没有用过这两个软件的这个功能,要么就是没弄懂要删除右键"电子邮件图片"这个功能上干啥地.

    这点上,专业论坛就是彪悍,deepin.org的一大堆回复中,有一条就是有效的,我是xp sp3/ie6所以,

    Restorator 修改system32/shdoclc.dll
    修改编号为24641的菜单资源.
    删除其"图像"内容菜单内的下列菜单: 电子邮件图片(&E)... 打印图片(&I)...
    保存文件即可.
    文件可能被锁定而且被系统保护的,先解锁文件并替换系统库文件.
    ok,问题解决了.

    引申一下,对于需求不能臆测,除非有明确的认知上的同位感,才能跟接近需求的真实目的.

    标签: ,

    阅读《需求的理解是个问题》更多内容...
    This Written at 八月 01, 2008 by loverty.   ,