哈斯日志
纪录我们在网路上奔波的历程!
  • »新帖子
  • AI搜索引擎的兴起:挑战与机遇
  • 系统3:扩展和增强人类决策能力的关键
  • 决策增强与智能知识管理:人脑的第三个系统
  • 知识管理的算法
  • 信息知识管理技能
  • 碎片化阅读、海量信息时代的轻量级知识管理
  • 俞军和他的产品经理课
  • 为什么我们都对搜索不满意却又无可奈何
  • 搜索产品市场机会探讨:头条不做搜索做什么
  • 搜索产品市场机会探讨

  • Reward hasiblog
    人是怎么学习知识,机器算法能不能模拟人类进行信息自我学习和迭代
    星期二, 十月 08, 2019

    人是怎么学习知识

     loverty 哈斯日志  7月28日 知识管理,信息管理,竞争情报

    人的知识是怎么形成的,机器和算法能不能模拟这个过程?上周五去百科名医和几个创始人、核心团队交流,COO王老师跟我分享说,一个职业医师需要8年学习培训才能上岗,算法和技术能在这里做什么?

    写这段文字,我试图驾驭一段文字诉说我所理解的,我们是怎么形成认知和智慧的,这是一个巨大巨宏观的命题,并不是这个简单的一个模式或者框架就能解读的足够清楚,我试着用神经网络的计算引擎的技术逻辑来类比这一过程,感觉有相当的合理性,作为问题分析的框架,分享出来,跟大家一起探讨。

    人是不断通过每天跟人、事和各种工具的交互,获得数据的采集、信息的输入,通过对信息输入后的再加工,转换成知识、经验等智慧,进而形成对自己下一步行为的影响和优化,通过传播和分享,形成对其他人的参考影响和优化。往具体的说一下就是阅读理解(图文、视频、看书、看电视、听音频)、交流沟通(分享、交谈和讨论)和做事实践这三种行为模式




    抽象到这个目标输出的话,我试图产出一个类比分析框架,我认为,人获得知识通常经历过这个几个步骤,

    第一步,信息、数据的采集,进入我们的缓存,让我们的计算系统能够有运算和处理的基本操作对象,对于我们每天的经历、输入,则会根据一定的特征 有些存储到持久化系统里,有的只是在缓存中,处理完当前场景的事情,就会从内存释放掉,并不会被持久保存。

    第二步,基于输入的信息、数据专程相应的计算语料,其中对于事情基本都会抽象出,3w1h,什么时间谁发生了什么。

    第三部分,建立起关键特征的向量索引,便于在需要的场景被搜索到召回出来,因为不同人对于事情本身的理解和建模方式不同,导致被召回调用的效率就差别很大,比如有的人其实抽象的维度特别高,其实就只是存了一个模型,需要输入向量特征比较相似的情况下,直接路由到这个模型来进行下一步处理和行为操作,而有的人抽象的比较浅,就会发现这里条件不一直,那里变量有差异,无法有效识别已有处理模式跟新的输入之间的关系,导致决策、判断速度效率和质量都会有不同程度的差异。

    第四部分,就是不断根据行为结果的反馈迭代和优化模型和算法,从现实角度就叫学习能力,不断能通过输入迭代优化自己模型 、并能通过这种优化及时通过下一步行为进行迭代。

    基于事实或者发生的现象,我们有我们自己的观点、也能抽象出我们想要解决的问题,并以此为目标,分析、拆解、推演,并在没有信息知识存量的问题里引入新的输入,形成解决问题的路径和方法,并通过拆分后的具体问题解决的各个节点上路径上的反馈和迭代,并不断完善问题解决方法和形成问题解决方法的方法,最终实现问题的解决,并在回溯信息输入和存量知识直接的关联交叉和融合,形成数据信息化,信息知识化,知识经验化,经验方法论化,知识认知建模模型。这只是形成里知识库建立和输入,还需要不断的反刍、挖掘关联、建立符合自己思维特点和性格、价值倾向的知识图谱结构,以便于在需要的时候能够快速调用。


    私有的知识经验和信息通过更分享传播和验证,才能迭代进化

    如果你的知识经验仅仅是在你的局部发生影响、产生作用,那他迭代的速度就不够快,就无法形成更高效率和优化。

    人发明各种工具、方法都是在为了提升效率,提升个人迭代效率、提升工作输出效率,提升合作产出效率,提升产品产业迭代效率。从这个角度,公共基础科学、哲学和社会系统运行制度则是为效率提升 提供基础土壤和底盘,如果一个秩序影响了效率的迭代,必然会被淘汰。只是诉说我对“道法自然”的解读,没有其他意思,如果有其他意思那是你解读的意思,不一定是我的意思(:


    信息在被传播过程中不断是被迭代、被优化的过程,放大到更宏观的经验上,政治、社会、市场、技术,作为社会的底层支撑,则被解读为自由平等共享连接,而这也是人类智慧共同进化的一个需要和动力。


    传播的知识或者信息被怎么解读和运用

    一旦这些方法、经验、思考和关系逻辑被具象化成信息、书等,就会成为一种客观存在,在传播的链路上,不断跟各个节点交合、产生新的进化和变异,进而成为更多的知识。如kk的分享,认为技术是一种生命体,其实信息知识也可以这么理解,它是一种新的进化载体。信息技术则是两者杂交后,为人的进化赋能的载体。

    但是遗憾的是,客观事实和现象,通常我们并不能完整记录全貌,即使技术如此发达的今天,我们可以视频录影,但是他所能反映也只是彼时彼刻所有被具象化的模拟信号,还有很多维度、因素并没有显性化。

    通常情况下,我们看到的听到的信息,和我们理解的信息,我们记录的信息,我们分享传播的信息,以及接收方的get到的信息,都是不完全一样的。每个节点上,都会有新的情感、个体、价值观、偏好、利益和能力要素作为变量带入,所以本质上对输入要做信号放大和裁剪是必然的,但是从学习知识提升自我的角度,我觉得近可能高保真还原,是最好的选择。

    获得知识不是目的,最终要用来探索和创造

    基于现有的经验和知识,提出新问题,并追求问题的解决,这个过程就是过去经验知识的片段组合应用,从这个一点上,对客观世界的理解和解读所形成的知识体系和对人类发明的社会系统的体系结构的理解,互相影响相互作用,形成了这个知识体系的不断完善、优化和进化。

    分析解决问题的路径:提出要解决的命题-->找到加速思考的进程的线索-->获得高可靠性信息输入-->得到命题解决的新视角、切入点-->获得灵感和想法-->将想法实施变成成果

    分析问题解决问题的时候调用现有的计算模式和方法,有3种基本方法,
    其一是通过相关来计算关联性,获得匹配模式和方法,
    其二是类比法,通过问题的抽象找到跟这个问题类比相对接近的问题,找到经验里这个问题的解决方法,从而复用此前的方法、套路来解决。
    其三是分解并具体化,把问题按照事理逻辑进行拆解,当问题具像具体之后,再用前两个来找具体的解决方案并整合在一起。

    其实本质上就分类和联想,跟已有的认知和知识建立关联。

    标签: , , ,

    阅读《人是怎么学习知识,机器算法能不能模拟人类进行信息自我学习和迭代》更多内容...
    This Written at 十月 08, 2019 by loverty.   ,
    AI辅助机器写作的几个案例和归纳
    星期二, 二月 12, 2019
    Bloomberg的Cyborg写作机器人写财经、通讯类文章,快速抽取商业金融新闻领域数据信息(business financial journalism),帮助信息发布及时性的竞赛中,为对冲基金人工智能为客户提供新鲜事实fresh facts。除了为彭博社报道公司收入外,机器人记者还为美联社,“华盛顿邮报”的小棒球联盟和“洛杉矶时报”的地震创作了相关通讯报道。


    福布斯正在测试一种名为Bertie的工具,为记者提供粗略的草稿和故事模板,它建立在出版商的内容管理系统中半自动主题推荐功能的基础上,能根据记者以前的记录、工作生成写作提示。

    路透社(Reuters) 推出的Lynx Insights会涉及与报道相关的关键数据——例如,帮助记者快速分析大宗商品定价的历史趋势。

    Automated Insights是一家专门从事语言生成软件的技术公司,会为客户、合作伙伴生成大量的通讯报道,他们也做公司的财务收益分析的报道,获得TO B服务的收益。自从与Automated Insights合作以来,美联社已经从每季度收入报告的300篇文章发展到3,700篇。

    The Post有一位名为Heliograf的内部机器人记者,通过报道2016年夏季奥运会和2016年选举,展示了它的实用性。The Post战略计划主管杰里米吉尔伯特表示,该公司还使用人工智能推广具有本地定位的文章,这些文章涉及特定地区读者的,“无论是国内还是国际,你都有可能失去那些对小社区的故事感兴趣的读者的兴趣。” “所以我们问,'我们如何扩展我们的专业知识?”

    对于致力于本地新闻的全国性新闻机构Patch,AI为其110名员工记者和众多自由职业者提供协助,他们覆盖了大约800个社区,特别是他们对天气的报道。该公司首席执行官沃伦·圣约翰表示,在一周内,补丁上有超过3,000个帖子,产量的5%到10% 都是由机器生成的。

    其基本的设定都是,人工准备素材、模板,设定条件,机器自动创作。其中素材的采集、模板讨论、创作运行条件这些都还是需要大量依靠人的工作。


    从目前的AI辅助内容创作的情况来看,主要在以下几个方面发挥了作用,

    --机器人写手生成内容速度更快,且出错率更低。美联社(Associated Press)与初创公司Automated Insights合作,在2015年部署了一名人工智能写手,该写手一秒钟能撰写大约2000篇文章,出错率比人类写手低。

    --AI可以帮助发现有趣的故事.通过AI技术对大量的数据和信息进行分析再加工,能发现很多新奇的角度和线索。发现新闻事件中意想不到的趋势,或者承担一些目前由人类记者完成的耗时的跑腿工作,这将是一个用途。

    --自动化工具已经节省了记者报道企业盈利方面的20%时间,以美联社的案例看,它将为媒体在报道的时效性竞争优势上、效率上提供比较大的价值。

    --AI工具成为报告和发现线索的生产工具。

    --华尔街日报和道琼斯正在试验这项技术,以帮助完成各种任务,包括采访的转录或帮助记者识别“深度假货”,通过AI产生的令人信服的捏造图像。国内在黄反、敏感内容、作弊得识别和应用上也是比较多的。

    --“纽约时报”表示,它没有机器生成新闻报道的计划,但该公司已尝试使用人工智能来个性化新闻通讯,帮助评论审核、AntiSpam、攻击型行为识别等,并在图像数字化存档时识别图像。


    “华尔街日报”的马可尼先生表示同意,将新闻室中增加的人工智能比作电话的介绍。“它为您提供了更多访问权限,并且您可以更快 地获得更多信息,”他说。“这是一个新领域,但技术在变化。今天它是人工智能,明天是区块链,10年后它将成为别的东西。新闻标准没有改变。“

    对于AI创作新闻报道是否会替代人类,Mr. Marconi同意这种说法,更像是在新闻采编室内引入电话, “It gives you more access, and you get more information quicker,”  “It’s a new field, but technology changes. Today it’s A.I., tomorrow it’s blockchain, and in 10 years it will be something else. What does not change is the journalistic standard.”

    国内企业百度百家号后面的创作工具支持、头条的xiaomingbot、新浪新闻的在通讯类信息的采编上得应用,跟清华合作的,都是不错的机器人写作应用案例。

    如上总结,是看了这篇文章获得的启发



    标签: , , ,

    阅读《AI辅助机器写作的几个案例和归纳》更多内容...
    This Written at 二月 12, 2019 by loverty.   ,