利用观测数据判断总体是否服从正态分布的检验称为正态性检验,它是统计判决中重要的一种特殊的拟合优度假设检验。直方图初判 / QQ图判断 / K-S...
最广泛无监督算法+基础的降维算法通过线性变换将原始数据变换为一组各维度线性无关的表示,用于提取数据的主要特征分量 →高纬度数据降维二维数据降维、...
1--和方差 2--均方差、均方根 3-- R -square(确定系数) R -square越接近1,越好,大于0.8就不错了 4--如何求出...
数据缺失主要包括记录缺失和字段信息缺失等情况,其对数据分析会有较大影响,导致结果不确定性更加显著缺失值的处理:删除记录 / 数据插补 / 不处理...
Pandas时间戳索引:DatetimeIndex核心:pd.date_range() 1--# pd.DatetimeIndex()与Time...
连续属性变换成分类属性,即连续属性离散化在数值的取值范围内设定若干个离散划分点,将取值范围划分为一些离散化的区间,最后用不同的符号或整数值代表每...
数据的标准化(normalization)是将数据按比例缩放,使之落入一个小的特定区间。 在某些比较和评价的指标处理中经常会用到,去除数据的单位...
【课程2.5】 Pandas数据结构Dataframe:基本概念及创建"二维数组"Dataframe:是一个表格型的数据结构,包含一组有序的列...
1---一维数组索引及切片 2---二维数组索引及切片 3---布尔型索引及切片 布尔型 条件判断