240 发简信
IP属地:北京
  • Resize,w 360,h 240
    transformer语言模型原理解读

    一、简介 基于假设:一个词在句子中的意思,与上下文(语境)有关。与哪些词有关呢?Transformer就是:利用点积将句子中所有词的影响当成权重...

    0.4 4008 1 4 1
  • Dataloader重要参数与内部机制

    @[TOC] 一、pytorch数据输入 Dataset负责生产数据,DataLoader负责数据的分批(batch_size)、采样(samp...

  • google-research/bert官方代码中的坑_run_classifier_效果很差原因

    [[TOC好像还不支持]] 简介 bert官方代码google-research/bert中有很多很强的设定,稍有改动就会导致结果很差。此文档简...