240 发简信
  • 120
  • 120
    Imbalanced-learn for NSL-KDD

    RawData Over-sampling RandomOverSample SMOTE ADASYN BorderlineSMOTE Unde...

  • FP-growth

    FP-growth(频繁模式增长) 数据库的第一遍扫描用来统计出现的频率;第二遍扫面中考虑那些频繁元素 优点: 大约比Apriori算法快一个数...

  • Apriori算法

    关联分析概念: 关联分析是一种在大规模数据集中寻找有趣关系的任务;目标是发现频繁项集和发现关联规则; 频繁项集:是经常出项在一块的物品的集合; ...

  • K-Means

    原理 聚类是无监督学习,将相似的对象归到同一个簇中,簇内的对象越相似,聚类的效果越好; 首先,随机确定K个初始点作为质心; 然后,将数据集中的每...

  • 120
    树回归

    原理: 将数据集切分成很多份易建模的数据 利用线性回归技术建模 优点 可以对复杂和非线性的数据建模 缺点 结果不易理解 适用数据类型 数值型和标...

  • 120
    回归

    线性回归 原理: 寻找一组最优参数来拟合数据 优点 结果易于理解,计算上不复杂 缺点 对非线性的数据拟合不好 适用数据类型 数值型和标称型数据 ...

  • 提升方法(boosting)

    原理: 通过改变训练样本的权重,学习多个分类器,并将这些分类器进行线性组合,提高分类的性能; bagging是通过随机抽样的替换方式,得到与原数...

  • 天池o2o优惠券使用预测比赛解析(初级)

    天池o2o优惠券使用预测比赛解析(初级) 赛题链接: 天池o2o优惠券使用预测 加载数据 缺失值处理 统计 比赛的意义是把优惠券给那要购买商品却...

个人介绍
关注Web安全和机器学习的小白