梯度上升 - 简书

发简信

梯度上升

11
关注
1
粉丝
2
文章
3731

字数
2

收获喜欢

IP属地：四川

2019-02-22 Transformer （GPT、BERT的核心）
前几天细读GPT的paper，里面使用的基础模型和BERT一样都是Transformer，区别就在于GPT用的是单向Transformer，而B...

3849 0 2
2019-02-19 GPT-2.0 Language Models are Unsupervised Multitask Learners
这两天能一本正经胡说的语言模型GPT-2.0大火，官方OPENAI以模型太强大担心被坏人使用为由，也只公布了117M的模型，是不到号称的15亿参...

3194 0 0

暂无个人介绍