240 发简信
IP属地:广东
  • Resize,w 360,h 240
    reshape2包

    1.长/宽数据 R语言中,90%的情况下都是使用长型数据,比如构建回归模型,或者利用ggplot2构图,因此当遇到宽型数据时,第一时间就是要把它...

  • Resize,w 360,h 240
    ggplot2超详细讲解

    一.基本概念 "一张统计图形就是从数据到几何对象(geometric object, 缩写为geom, 包括点、线、条形等)的图形属性(aest...

    13.2 50696 6 171 4
  • Resize,w 360,h 240
    数据分析思维

    数据分析思维,是分析思维的引申应用。再优秀的思考方式,都需要佐证和证明,数据就是派这个用处的。如果分析思维是一种结构化的体现,那么数据分析思维在...

    16.4 7919 4 198
  • Resize,w 360,h 240
    利用Kmeans聚类分析两类问题

    聚类分析是一种无监督的学习方法,根据一定条件将相对同质的样本归到一个类总(俗话说人以类聚,物以群分)正式一点的:聚类是对点集进行考察并按照某种距...

    1.4 5863 2 16
  • 用SMOTE算法和XGBoost模型处理信用卡欺诈数据

    如果分类问题中类别型的因变量可能严重失衡,例如欺诈问题中,欺诈类观测在样本集中占少数;客户流失问题中,忠实的客户也是往往占很少一部分;某营销活动...

    1.1 6586 1 13
  • Resize,w 360,h 240
    利用Logistic回归拟合信用评分卡模型

    一、关于互联网金融授信产品的风控建模 如何利用机器学习以及大数据技术来降低风险呢?如何建立信用评分的模型呢?本文将针对这些问题简单介绍互金行业中...

    2.6 20286 10 33 1
  • 用决策树和随机森林解决泰坦尼克号沉没问题

    决策树和随机森林既可以解决分类问题,也可以解决预测问题。 随机森林的构建有两个方面:数据的随机性选取,以及待选特征的随机选取。数据的随机选取:第...

    0.6 4163 2 11
  • Resize,w 360,h 240
    SAS复习

    一.建立数据集的基础和高级议题从最简单的建立SAS数据集开始,逐步深入,介绍如何产生新变量、如何对数据集中的变量进行修饰、如何合理地运用输入和输...

  • Resize,w 360,h 240
    数据处理工具--Pandas模块

    强大的数据处理模块Pandas,可以解决数据的预处理工作,如数据类型的转换、缺失值的处理、描述性统计分析和数据的汇总等 一、序列与数据框的构造 ...

    4.9 4208 5 38
个人介绍
初入数据分析,请多多指教