240 发简信
IP属地:北京
  • Ubuntu 编码问题

    Windows 下的zip文件 方法Ubuntu下乱码。 让Ubuntu支持gbk字符集 查看系统支持的字符集 cat /usr/share/i...

  • Resize,w 360,h 240
    #David Silver Reinforcement Learning # 笔记4 MC-TD

    本节主要介绍 Model-free prediction。从一个未知的MDP中估计出值函数。 1. Monte-Carlo Reinforcem...

  • Resize,w 360,h 240
    #David Silver Reinforcement Learning # 笔记3-DP

    这节主要讲了动态规划在强化学习中的用法。 引入两个问题的定义,Prediction,Control。Prediction: 预测问题,MDP的信...

  • Resize,w 360,h 240
    #ACL-2016#A Persona-Based Neural Conversation Model

    问题:同样的问题,不同的表述,生成的回复就不一致。 方法:在seq2seq的的decoder 加入了用户向量,类似词向量,利用用户帐号信息,如性...

  • Resize,w 360,h 240
    #David Silver Reinforcement Learning # 笔记2-MDP

    这节课同样讲的一些基础概念,为之后的课程做铺垫。 马尔科夫过程(Markov Processes) S是一个有限的状态集合P是state之间的转...

  • Resize,w 360,h 240
    #David Silver Reinforcement Learning 笔记1#

    这节课主要讲了一些基本概念。 强化学习的特点 非监督,只需要一个奖励R 奖励是非即时的 agent 的actions 影响它后续的数据 1. R...

  • Resize,w 360,h 240
    #NIPS-2015# Pointer Networks

    Pointer Networks 论文地址:https://arxiv.org/abs/1506.03134 因为上一篇博客CopyNet引用了...

  • Resize,w 360,h 240
    #ACL-2016# CopyNet

    Incorporating Copying Mechanism in Sequence-to-Sequence Learning 作者来自香港大...

  • Ubuntu 安装

    首先是ubuntu的安装 制作U盘启动(windows下UltralSO工具制作)。 开机狂按F12(不同的机器,快捷键不同),进入BIOS界面...