240 发简信
  • 详解梯度下降优化算法

    1. 文章 An overview of gradient descent optimization algorithms 2. 概要 梯度优化...

  • 120
    【可视化】网络Attention层

    1. 前言 准备中期答辩,补充了一个实验,需要对网络结构中的attention层进行可视化,观察序列输入的哪些词或者词组合是网络比较care的...

  • 120
    详解深度学习中“注意力机制”

    1. 前言 本文翻译自《Attention?Attention!》博客 最近几年,注意力——在深度学习社区中,已然成为最广为流行的概念和实用工具...

    1.4 32496 2 27 1
  • Java核心技术--对象与类

    4.5 方法参数 方法参数的使用 一个方法不能修改一个基本数据类型的参数(即数值型和布尔型) 一个方法可以改变一个对象参数的状态 一个方法不能让...

  • Java核心技术--接口与内部类

    6.1 接口implement 继承接口,即履行“义务” 接口中所有的方法自动属于public,在接口声明中,不必提供关键字public 接口中...

  • 机器学习面试006—朴素贝叶斯

    1. 怎么理解朴素贝叶斯中的“朴素”? 因为它假定所有的特征在数据集中的作用是独立同分布的,但这个假设在现实生活中很不真实,因此很“朴素”。 2...

  • 算法面试小结

    1. 求一个数转化为二进制后,包含1的数量 2. 求平均值 解析:x&y是取相同位与,结果是x和y相同位的和的一半;x^y是取x和y的不同位,右...

  • 机器学习面试001—支持向量机SVM

    1. 关于min和max交换位置满足的 d* <= p* 的条件并不是KKT条件 Ans:这里并非是KKT条件,要让等号成立需要满足strong...

  • 机器学习面试005—决策树

    1. 请问(决策树、随机森林,Boosting、Adaboot)GBDT和XGBoost的区别是什么? Ans:①首先,随机森林是一个包含多个决...