决策用强化与系统性机器学习

决策用强化与系统性机器学习总结

系统的不同部分是有联系的。

系统思维的基本准则就是在时间和空间上因果是可以分开的。

孤立的学习时不完备的

系统性机器学习的其它一方面是为了了解系统界限,决定系统的相互作用,同时也尝试显现系统和子系统的各种行为的影响。

系统性知识构建更多的是构建完整的知识。因此,这里不可能是一个孤立的决策者。

学习是一个连续的过程,新方案观察和新方案出现

通过观察来学习需要构建有意义的观察对象和情景的分类。

当人们做决策时所遇到的方案和对象时之前学习阶段没有遇到过的 推理,迁移学习fds

三种仿生学习机制

  • 知觉学习
    学习新的对象,策略和关系
  • 案例学习
    基于事件间的相关信息
  • 过程学习解决
    基于行为和动作序列来完成的学习
    其本质为人类认知内的知识对机器智能水平的传授

对于人脑,人类的学习时选择性增强的,不需要大量的训练集。机器学习是计算机编程方法的研究。为了让机器智能化工作,可以像人一样学习经验。某些任务下替代人类,如自动化设备或者是在极少数动态环境下精度等级要求高的重复性任务

统计数据更多的是理解数据及其之间的模式,数据挖掘寻求决策和分析模式的相关数据

通常情况下,学习和理解同时发生。

新的和已有的知识都是围绕学科主要概念和原理时促进学习发展的。在学习过程中,要么一些原理已经存在(计算机语言中用if then),要么在工作过程中发展为学习指南。

学习也需要prior knowledge。学习者使用他们已知来构造新的理解。此外,他们有不同的视角和元认知。学习是通过识别、监控和调节元认知策略的使用二促进发展的

最后加一点机器学习的想法:

机器学习

归纳induction,从特殊到一般,泛化generalization

演绎deduction,从一般到特殊,归纳学习inductive learning

感知机 perceptron

“从样例中学习”的一大主流是符号主义学习
代表包括决策树和基于逻辑的学习
decision tree 以信息论为基础,以信息熵最小化为目标,直接模拟了人类对概念进行判定的树状流程基于逻辑的学习的代表为归纳逻辑程序设计(indective logic programming,ILP 使用一阶逻辑来进行知识表示,通过修改和扩充逻辑表达式来完成对数据的归纳