seq3中的一个oov处理方法

  • 单词表只用15k的,但是有10oov相当于一个简单的copy形式
  • 就是输入到网络之前将不在词表中的词替换成oov,然后decoder的时候将此事的oov替换回原来的词

推荐阅读更多精彩内容

  • 本文另两篇系列 NLP的巨人肩膀(上) NLP的巨人肩膀(下) 3. 梯子的一级半 除了在word级别的embed...
    weizier阅读 3,197评论 0 10
  • 转载 序 文本摘要是自然语言处理中比较难的一个任务,别说是用机器来做文摘了,就连人类做文摘的时候都需要具备很强的语...
    城市中迷途小书童阅读 95评论 0 1
  • 转载 序 文本摘要是自然语言处理中比较难的一个任务,别说是用机器来做文摘了,就连人类做文摘的时候都需要具备很强的语...
    readilen阅读 3,933评论 1 8
  • 官网 中文版本 好的网站 Content-type: text/htmlBASH Section: User ...
    不排版阅读 1,236评论 0 2
  • 本文上两篇系列 NLP的巨人肩膀(上) NLP的巨人肩膀(中) 4.6 Bidirectional Encoder...
    weizier阅读 3,026评论 0 14