Avatar notebook default
9篇文章 · 11702字 · 1人关注
  • xDeepFM架构理解及实现

    本文主要是为了讲解xDeepFM的框架,及如何用tensorflow去实现主干部分,如果需要直接拆箱可用,可以参考:xDeepFM,我的部分代码...

  • Auto Machine Learning初探

    前言 最近在看AutoML,业界在 automl 上的进展还是很不错的,个人比较看好这个方向,所以做了一些了解: Google: Cloud A...

  • Resize,w 360,h 240
    量化评估推荐系统效果

    推荐系统最有效的方法就是A/B test进行模型之间的对比,但是由于现实原因的局限,存在现实实时的困难性,所以,梳理了一些可以补充替代的指标如下...

  • Resize,w 360,h 240
    理论:FM理论解析及应用

    FM的产生背景 我其实没有做过很多ctr预估的事情,但是我在工作中常常遇到CRM流失预估、订单预估这些依赖于特征工程的事情,其中就涉及到特征的组...

  • 理论:Logistic使用前提

    1.样本量问题 工程效果经验,坏样本个数至少要是你的特征变量个数的10倍以上;总样本个数要是你的特征变量个数的20-30倍以上。比如假设你会采用...

  • Resize,w 360,h 240
    理论:随机森林-枝剪问题

    通常情况下, 随机森林不需要后剪枝。 剪枝的意义是:防止决策树生成过于庞大的子叶,避免实验预测结果过拟合,在实际生产中效果很差 剪枝通常有两种:...

  • Resize,w 360,h 240
    理论:聚类算法思路总结

    1.cost function 1.1 距离 常见的为欧式距离(L1 norm)&&p=2,拓展的可以有闵可夫斯基距离(L2 norm)&&p=...

  • 理论:因子分析原理剖析

    因子分析概述: 因子分析分为Q型和R型,我们对R型进行如下研究: 一.因子分析步骤: 1.确认是是否适合做因子分析 2.构造因子变量 3.旋转方...

  • Resize,w 360,h 240
    理论:决策树及衍射指标

    一、常用的决策树节点枝剪的衡量指标: 熵: 如果一件事有k种可的结果,每种结果的概率为 pi(i=1…k) 该事情的信息量: 熵越大,随机变量的...

文集作者