吕鹏_hunhun - 简书

IP属地：广东

读论文Deterministic Policy Gradient Algorithms
近期打算把基于策略梯度的增强学习的几篇论文读了，包括DPG、DDPG、TRPO和A3C，希望能对策略梯度的学习有一个促进。第一篇论文是Dete...

0.1 12998 1 18 1
读论文Dueling Network Architectures for Deep Reinforcement Learning
ICMl2016的最佳论文有三篇，其中两篇花落deepmind，而David Silver连续两年都做了 deep reinforcement ...

6921 1 10 2

读论文Target-driven Visual Navigation in Indoor Scenes using Deep Reinforcement Learning
这篇论文是飞飞出品，你知道的，imageNet的光环。论文主要是通过深度增强学习让机器人在房间里面找东西。那么对于基于DRL的算法，确实存在论...

0.1 4095 2 8
读论文CONTINUOUS CONTROL WITH DEEP REINFORCEMENT LEARNING
DPG那篇论文读起来很困难，全部是数学公式（话说简书什么时候支持公式编辑啊，只能贴图片，痛苦），今天读的是后续的一篇论文CONTINUOUS C...

5136 1 5 1
这周做了啥？6-18-2017
1、udacity的term2的最后一个project周一提交，周五才审核通过，好吧，总算完成了term2，五次作业分别是ekf（扩展卡尔曼滤波...

192 0 4
读书笔记《未来简史》
Harari在《人类简史》的结尾处提到“那些永不知足又不负责任的造物主们连他们究竟想要什么都不知道，还有比这更危险的吗？”然后呢，他又写了本《未...

268 0 4 1
梁宁-产品思维30讲思维导图

0.3 3596 1 3

这周做了啥？ 2018-01-28
1、上周孩子们的考试终于结束了，成绩结果都一般般，不过首先反思的还是自己，陪孩子的时间太少，有限的时间还往往不耐烦。差评。 2、上线的版本质量总...

116 0 3
2018-01-07
1、2018年的第一周是忙碌的一周，解决上线的产品故障，吃自己的狗粮。 2、收到了购物留言的6万多条记录，嗯，应该可以做一个分类器 3、做了一个...

249 0 3