240 发简信
  • 机器学习笔记19: 线性二次型高斯

    线性二次型高斯(Linear Quadratic Gaussian (LQG)) 在现实世界中,我们通常不能获取到所有的状态st。比如一个自动驾...

  • 机器学习笔记18: 微分动态规划

    上一节中我们介绍了一个特殊的MDP模型:线性二次型调节控制(LQR)。事实上很多问题都可以用LQR来解决,即使动态模型是非线性的。尽管LQR是一...

  • 机器学习笔记17: 线性二次型调节控制

    有限边界的MDP 在前面两章关于强化学习的介绍中,我们定义了马尔可夫决策过程(MDP)以及价值迭代/策略迭代这两种用于求解MDP的算法。特别地,...

  • 120
    机器学习笔记16: 马尔可夫决策过程(下)

    到目前为止,我们一直都在讨论有限状态下的MDP问题,现在我们来看下当状态数量是无限时如何求解MDP问题。 离散化 也许求解无限状态下的MDP问题...

  • 机器学习笔记15: 马尔可夫决策过程(上)

    这一节开始我们介绍强化学习(reinforcement learning)。在监督学习中,对于一个给定的输入x,我们可以明确知道输出y。而在很多...

  • 机器学习笔记14: 独立成分分析

    这一节的主题是独立成分分析(Independent Components Analysis, ICA)。和PCA的降维思路不同,ICA主要解决的...

  • 120
    机器学习笔记13: 主成分分析

    上一节我们介绍了因子分析,该模型通过一系列变换可以将高维数据用低维数据来表示。因子分析基于的是概率模型,并且需要用到EM算法进行参数估计。 这一...

  • 机器学习笔记12: 因子分析

    上一节我们介绍了用EM算法求解混合高斯模型,但这个算法通常是在样本数足够多的情况下才成立,即满足样本数m远远大于特征数n。 如果n >> m,那...

  • 120
    机器学习笔记11: K-Means算法和EM算法

    这一节开始我们讨论非监督学习(Unsupervised Learning)的算法。在监督学习算法中,训练数据既包含特征也包含标签,通常表示为{(...