• 随机森林算法简介

    随机森林算法就是建立n个决策树,将要预测的数据放入n个决策树,得到结果次数最多的类就是该数据属于的类。 建立n个决策树: 采用自助法重采样技术,...

  • hive insert into语句 和 insert overwrite语句

    刚开始学hive,查hiveinsertinto语句和insertoverwrite语句区别的时候百度出来第一条写错了,差点被坑。。。。。 1....

  • oracle分析函数介绍

    分析函数分为函数部分和OVER分析语句部分。 函数部分就是常见的count(),sum()这些函数, over分析语句是定义一个作用域,让作用域...

  • 120
    元胞自动机实现生命游戏

    元胞自动机(CA)是一种新的研究复杂系统的模型,主要将连续系统离散化,方便研究具有相互作用系统的动力学及其时空演化过程。如雪花以及湍流等复杂现象...

  • 120
    聚类算法之k-means的实现

    聚类算法是给一大堆原始数据,然后通过算法将其中具有相似特征的数据聚为一类。 k-means聚类,也叫k均值聚类,要先给出原始数据所含的类数,然后...

  • 朴素贝叶斯分类原理

    为什么叫朴素贝叶斯分类呢? 1.它用到了贝叶斯定理 2.这种方法的思想真的很朴素🐒 对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率...

  • 120
    regress函数的最小二乘算法原理

    得到一组数据时: 比如 产量 13.2 15.1 16.4 17.1 17.9 18.7 19.6 21.2 22.5 24.3 温度 20 ...

  • 120
    python3.5爬虫实例(二)模拟登陆

    很多网站的全部内容需要登录后才能查看,因此本文会介绍一个模拟登录知乎并输出自己关注话题的小例子。 step1:获取登陆所需的参数 我的知乎是用手...

  • 120
    python3.5爬虫实例(一)简单图片抓取

    为了提高教学的趣味性,先不从基本的正则表达式入手介绍,用到的时候会解释一下。 先直接一个图片抓取的实例(能快速保存页面的所有图片到本地): 读取...