240 发简信
IP属地:四川
  • Resize,w 360,h 240
    transformer再记(解码器)

    上一篇:transformer再记(编码器)解码器与编码器在细节上有差异。 解码器的Attention decoder第一级自注意力的key, ...

  • Resize,w 360,h 240
    Attention Is All You Need简记(多头注意力、自注意力、层归一化、位置嵌入)

    首先注意力模型可以宏观上理解为一个查询(query)到一系列(键key-值value)对的映射。将Source(源)中的构成元素想象成是由一系列...

  • Resize,w 360,h 240
    吴恩达·注意力模型(Attention Model)简记

    机器翻译模型的编码器是先读取整个句子后传递到解码器中翻译,对于过长句子序列(例如超过30个词的句子)的记忆能力弱,翻译效果不理想。此时就出现了注...

    5.0 8039 0 48
  • CNN感受野(VGG)

    从图像中提取CNN特征,VGG模型是首选算法 。VGG是牛津大学Visual Geometry Group(视觉几何组)的缩写,以研究机构命名。...

    1.5 4036 6 17
  • Resize,w 360,h 240
    语谱图,滤波器组(Filter banks、MFCC)

    Speech Processing for Machine Learning: Filter banks, Mel-Frequency Ceps...

  • Resize,w 360,h 240
    吴恩达·RNN & GRU循环序列模型简记

    RNN是一个链式结构,每个时间片使用的是相同的权值矩阵RNN一个特殊的点是输入数据总是比输出数据提前一个time_step,在准备训练数据时需注...

  • Resize,w 360,h 240
    关于1x1卷积(AKA网络中的网络)

    首先channel(信道)为1的1x1卷积过滤器就相当于给输入矩阵乘以一个常数。 其次channel不为1的过滤器的卷积操作如下图所示:(图中卷...

  • 决策树简记

    具有不同划分准则的算法决策树原理剖析及实现(ID3)理解决策树算法(实例详解)-ID3算法与C4.5算法 ID3(根据 信息增益 划分子节点) ...

  • Resize,w 360,h 240
    初识抽象语法树(AST)

    基本概念 基本字:阿拉伯数字、大小写拉丁字母、其他字符(~、!、%、&、_、-、+、=、{}、[]、:、;、<、>、,、.、?、/、|、\)、空...