240 发简信
IP属地:广东
  • 240
    特征工程

    1、数据分桶(分桶后需要编码) 连续值经常离散化或者分离成“箱子”进行分析, 为什么要做数据分桶呢? 离散后稀疏向量内积乘法运算速度更快,计算结果也方便存储,容易扩展; 离散...

  • 数据指标大全

    APP主要数据指标 1、活跃用户指标 日活(DAU):一天内日均活跃设备数(去重,每个公司活跃的定义不一样)周活跃数(WAU):一周内活跃设备数(去重,每个公司活跃的定义不一...

  • 240
    因子分析

    1 因子分析概念 因子分析是一种数据简化的技术。它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个假想变量来表示其基本的数据结构。这几个假想变量能够...

  • 广告效果评估方案

    问题: 假设云课堂的运营微专业为提升报名人数,在优酷上做了一个 30秒的视频广告。 请给出这个视频广告的广告效果评估方案,方案需包括: 1、评估方案简介 2、效果评估指标建议...

  • 【Hive】SQL语句大全

    这是我的CSDN博客:https://blog.csdn.net/u014532291/article/details/105853787 库操作 创建数据库 查询数据库 修...

  • 240
    总结:sklearn机器学习之特征工程

    0 关于本文 ​ 主要内容和结构框架由@jasonfreak--使用sklearn做单机特征工程提供,其中夹杂了很多补充的例子,能够让大家更直观的感受到各个参数的意义,有...