eerfgaofree - 简书

IP属地：四川

FM算法
问题传统线性模型问题：1 稀疏性：onehot带来数据稀疏性(尤其是id特征)，使得特征空间变大；2 线性组合的权重，训练不充分，也会带来稀疏...

0.2 140 0 3
中心极限定理和大数定理
中心极限定理(用样本估计总体)1 样本均值约等于总体平均值2 样本均值呈现正态分布大数定理如果统计数据足够大，那么事物出现的频率就能无限接近它的期望

0.1 58 0 1

整理书写的意义
知识管理的目的是构建自己系统的知识体系。如何更好的提取、利用知识。问题碎片知识特别多，无法转换为自己；看过容易忘记；堆积了很多，但是过了...

156 0 0
deep neural networks for youtube recommmendations
一篇特别好的将业务需求和算法结合的文章。是推荐系统业内最经典的深度学习架构之一。 1 商业模式： a UGC模型下，不和爱奇艺等来源于头部内容，...

196 0 0
word2vec
word2vec：本质上是一种降维操作，将从巨大维度降低至小维度。Word2Vec模型中，主要有Skip-Gram和CBOW两种模型，从直观上...

179 0 0
算法公平性
1 公正反而会伤害弱势群体么？有一定情况下是的：对弱势群体降低门槛会致使他们无法完成期预期目标，使他们信用度降低，造成更长久的伤害。我们不仅要考...

892 0 0
AUC和线上点击率指标不一致
问题：深度模型相比LR模型，离线auc高于基线，线上ctr也高于，但是线上深度模型AUC低于基线。一般，线上样本存在bias，新模型去测试基线...

1450 0 0

python 读写数据

40 0 0
多臂赌博机和Thompson Sampling
老虎机是赌场常见设备，每次摇动都可能后悔或者获得一定额度的奖励。可以选择不同的老虎机臂最大化自己利益，属于强化学习问题reinforcement...

299 0 0