240 发简信
  • 106-商业数据分析与线性回归

    1、商业数据分析简介 分析是一门使用数据构建模型的科学,这些模型可为公司、机构和个人的决策增加价值。 唯一客观的事实是数据。模型的作用就是帮助我...

  • 120
    105-WIN10+Firefox配置RSelenium

    1、安装Firefox 根据系统位数,下载对应最新版本,安装。 https://www.mozilla.org/zh-CN/firefox/ne...

  • 104-linux mint安装配置RSelenium

    注意:一定要注意浏览器与对应驱动间的版本对应关系,否则会报错。 1、Firefox浏览器 Firefox与对应的geckodriver:火狐下载...

  • 120
    103-mlr3之德国信用卡案例2

    1、数据准备 2、创建任务 3、交叉验证 使用十折交叉验证评估所有的超参数配置。 4、参数调优 paradox包定义超参数的搜索空间,mlr3t...

  • 120
    102-mlr3之德国信用卡案例1

    1、数据准备与数据理解 其中credit_risk为结果变量,表示信用卡风险情况。查看数据集缺失值等概况。 Table: Data summar...

  • 120
    101-非监督学习之OPTICS密度聚类

    DBSCAN在输入参数的选取上比较困难,即DBSCAN对输入参数比较敏感。当给定全局参数eps和minPts时,会存在问题:不同的全局参数会得到...

  • 120
    100-非监督学习之DBSCAN密度聚类

    k-means (K均值)和 分层聚类衡量行间、及行与中心点的距离。k-Means算法比较适用于簇为球型的,对于非球型的,一般需要基于密度的聚类...

  • 120
    99-非监督学习之hclust分层聚类

    k-means 输出为扁平的聚类结果,分层(层次)聚类输出为树状的聚类结果,当数据为多层级结构时适用。层次聚类(hierarchical clu...

  • 120
    98-非监督学习之k-means聚类

    聚类:在数据中识别相似行的技术。常见聚类技术:k-means, DBSCAN, OPTICS k-means 是一种基于划分的聚类算法,它以 k...