240 发简信
IP属地:广东
  • 数据挖掘150道试题

    单选题 1. 某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?(A) A. 关联规则发现 B. 聚类 ...

  • 随机森林算法

    1.随机森林使用背景 1.1随机森林定义 随机森林是一种比较新的机器学习模型。经典的机器学习模型是神经网络,有半个多世纪的历史了。神经网络预测精...

  • Resize,w 360,h 240
    L0,L1,L2范数及其应用

    原文作者链接 L0,L1,L2范数及其应用 在线性代数,函数分析等数学分支中,范数(Norm)是一个函数,其赋予某个向量空间(或矩阵)中的每个向...

  • Resize,w 360,h 240
    数据清洗的一些梳理

    数据清洗, 是整个数据分析过程中不可缺少的一个环节,其结果质量直接关系到模型效果和最终结论。在实际操作中,数据清洗通常会占据分析过程的50%—8...

  • Hadoop面试,选择、判断题

    1. 下面哪个程序负责 HDFS 数据存储。答案C datanode a)NameNode b)Jobtracker c)Datanode d)...

    0.1 2870 0 14
  • Resize,w 360,h 240
    DBSCAN聚类原理

    DBSCAN(Density-Based Spatial Clustering of Applications with Noise)聚类算法,...

  • hadoop面试45题

    来源:http://www.cnblogs.com/mlj5288/p/4449877.html 1.Hadoop集群可以运行的3个模式? 单机...

  • Resize,w 360,h 240
    Boosting 和 GBDT简介

    GBDT(Gradient Boosting Decision Tree) 又叫 MART(Multiple Additive Regressi...

    0.1 2760 0 12
  • 特征选择之Chi卡方检验

    卡方检验最基本的思想就是通过观察实际值与理论值的偏差来确定理论的正确与否。具体做的时候常常先假设两个变量确实是独立的(行话就叫做“原假设”),然...

个人介绍

◢ ██████◣      ◢████◣
◢◤      ◥◣    ◢◤     ◥◣
◤        ◥◣  ◢◤      █...
▎   ◢█◣   ◥◣◢◤  ◢█   █
◣  ◢◤  ◥◣      ◢◣◥◣ ◢◤.
◥██◤  ◢◤         ◥◣
      █ ●       ●  █
      █ 〃   ▄   〃 █
      ◥◣   ╚╩╝   ◢◤
       ◥█▅▃▃ ▃▃▅█◤
         ◢◤   ◥◣ 
         █     █ 
        ◢◤▕   ▎◥◣
       ▕▃◣◢▅▅▅◣◢▃▕