240 发简信
IP属地:四川
  • Resize,w 360,h 240
    FM算法

    问题 传统线性模型问题:1 稀疏性:onehot带来数据稀疏性(尤其是id特征),使得特征空间变大;2 线性组合的权重,训练不充分,也会带来稀疏...

  • 中心极限定理和大数定理

    中心极限定理(用样本估计总体)1 样本均值约等于总体平均值2 样本均值呈现正态分布 大数定理如果统计数据足够大,那么事物出现的频率就能无限接近它的期望

    0.1 58 0 1
  • 整理书写的意义

    知识管理的目的是构建自己系统的知识体系。如何更好的提取、利用知识。 问题 碎片知识特别多,无法转换为自己; 看过容易忘记; 堆积了很多,但是过了...

  • deep neural networks for youtube recommmendations

    一篇特别好的将业务需求和算法结合的文章。是推荐系统业内最经典的深度学习架构之一。 1 商业模式: a UGC模型下,不和爱奇艺等来源于头部内容,...

  • Resize,w 360,h 240
    word2vec

    word2vec: 本质上是一种降维操作,将从巨大维度降低至小维度。Word2Vec模型中,主要有Skip-Gram和CBOW两种模型,从直观上...

  • 算法公平性

    1 公正反而会伤害弱势群体么?有一定情况下是的:对弱势群体降低门槛会致使他们无法完成期预期目标,使他们信用度降低,造成更长久的伤害。我们不仅要考...

  • AUC和线上点击率指标不一致

    问题: 深度模型相比LR模型,离线auc高于基线,线上ctr也高于,但是线上深度模型AUC低于基线。一般,线上样本存在bias,新模型去测试基线...

  • Resize,w 360,h 240
    多臂赌博机和Thompson Sampling

    老虎机是赌场常见设备,每次摇动都可能后悔或者获得一定额度的奖励。可以选择不同的老虎机臂最大化自己利益,属于强化学习问题reinforcement...