secondplayer - 简书

secondplayer

IP属地：上海

机器学习笔记19: 线性二次型高斯
线性二次型高斯(Linear Quadratic Gaussian (LQG)) 在现实世界中，我们通常不能获取到所有的状态st。比如一个自动驾...

0.1 3749 0 2
机器学习笔记18: 微分动态规划
上一节中我们介绍了一个特殊的MDP模型：线性二次型调节控制(LQR)。事实上很多问题都可以用LQR来解决，即使动态模型是非线性的。尽管LQR是一...

4735 0 0

机器学习笔记17: 线性二次型调节控制
有限边界的MDP 在前面两章关于强化学习的介绍中，我们定义了马尔可夫决策过程(MDP)以及价值迭代/策略迭代这两种用于求解MDP的算法。特别地，...

2804 1 0
机器学习笔记16: 马尔可夫决策过程(下)
到目前为止，我们一直都在讨论有限状态下的MDP问题，现在我们来看下当状态数量是无限时如何求解MDP问题。离散化也许求解无限状态下的MDP问题...

0.1 1477 0 0
机器学习笔记15: 马尔可夫决策过程(上)
这一节开始我们介绍强化学习(reinforcement learning)。在监督学习中，对于一个给定的输入x，我们可以明确知道输出y。而在很多...

0.1 3552 0 1
机器学习笔记14: 独立成分分析
这一节的主题是独立成分分析(Independent Components Analysis, ICA)。和PCA的降维思路不同，ICA主要解决的...

2509 0 0
机器学习笔记13: 主成分分析
上一节我们介绍了因子分析，该模型通过一系列变换可以将高维数据用低维数据来表示。因子分析基于的是概率模型，并且需要用到EM算法进行参数估计。这一...

534 0 0

机器学习笔记12: 因子分析
上一节我们介绍了用EM算法求解混合高斯模型，但这个算法通常是在样本数足够多的情况下才成立，即满足样本数m远远大于特征数n。如果n >> m，那...

2409 0 0
机器学习笔记11: K-Means算法和EM算法
这一节开始我们讨论非监督学习(Unsupervised Learning)的算法。在监督学习算法中，训练数据既包含特征也包含标签，通常表示为{(...

4654 1 2