240 发简信
  • 120
    天池新闻推荐比赛-多路召回

    一、多路召回 所谓的“多路召回”策略,就是指采用不同的策略、特征或简单模型,分别召回一部分候选集,然后把候选集混合在一起供后续排序模型使用,可以...

  • 天池新闻推荐比赛-数据探索

    train_click_log.csv文件数据中每个字段的含义¶[https://tianchi.aliyun.com/mas-notebook...

  • 天池新闻推荐比赛-赛题理解

    一 赛题简介: 二评价方式 假设article1就是真实的用户点击文章,也就是article1命中,则s(user1,1)=1,s(user1,...

  • 120
    特征选择feature_selection

    一、Filter过滤法 在做特征选择之前,有三件非常重要的事:跟数据提供者开会!跟数据提供者开发,跟数据提供者开会 1.1、Filter过滤法 ...

  • 120
    数据预处理(preprocessing & impute)

    一、数据无量纲化 在机器学习算法实践中,我们往往有着将不同规格的数据转换到同一规格,或不同分布的数据转换到某个特定分布的需求,这种需求统称为将数...

  • 120
    随机森林04

    一、Bagging vs Boosting 二、RFC的参数列表 三、 RFC的属性列表 四、 RFC的接口列表

  • 120
    随机森林03

    一、案例随机森林调参 1.1、导入库 1.2、导入数据集,探索数据 1.3、进行一次简单的建模,看看模型本身在数据集上的效果 1.4、随机森林调...

  • 120
    随机森林02

    一、 重要参数,属性与接口(RandomForestRegressor)回归 所有的参数,属性与接口,全部和随机森林分类器一致。仅有的不同就是回...

    0.1 39 0 1
  • 随机森林01

    RandomForestClassifier 随机森林是非常具有代表性的Bagging集成算法,它的所有基评估器都是决策树,分类树组成的森林就叫...

个人介绍
大学是学的软件工程,研究生也是软件工程,写过大数据,玩过Java,手撕过python,写过爬虫 搞过聊天机器人。