Avatar notebook default
15篇文章 · 28365字 · 6人关注
  • 画一棵树,用来决策

    #决策树简介#决策树(Decision Tree)是一种简单但是广泛使用的分类器。通过训练数据构建决策树,可以高效的对未知的数据进行分类。决策数...

    0.1 1849 2 20
  • 最“懒惰”的kNN分类算法

    1. K-近邻算法#### k-近邻算法(k Nearest Neighbor),是最基本的分类算法,其基本思想是采用测量不同特征值之间的距离方...

  • Resize,w 360,h 240
    逻辑回归:比概念稍微深入一点的细节

    1 逻辑回归的定位 首先,逻辑回归是一种分类(Classification)算法。比如说: 给定一封邮件,判断是不是垃圾邮件 给出一个交易明细数...

    0.1 5127 2 13
  • Resize,w 360,h 240
    一名业余数据分析爱好者对于北京朝阳北苑地区各小区房价的粗浅分析

    1 数据来源 本次分析的数据源来自链家网。链家网中有"二手房-成交房源"这个板块,可以查看到所有通过链家成交的二手房的信息,其中最值得称赞的是成...

  • Resize,w 360,h 240
    数据挖掘的入门概念

    1 数据挖掘 数据挖掘(Data Mining,简称DM),是指从大量的数据中,挖掘出未知的且有价值的信息和知识的过程 2 机器学习 与 数据挖...

    0.5 8079 7 66
  • Resize,w 360,h 240
    华山论剑的活动预算问题(爬山算法)

    1. 组团旅游问题 有一天,东邪西毒南帝北丐中神通决定搞一次华山论剑,于是这五绝需要从四面八方坐飞机到西安咸阳机场,然后一起租车到华山比武: 王...

  • 搜索引擎的基本原理

    搜索引擎最初阶段: 利用网页爬虫进行抓取,通过网页中的链接层层深入,对网页去掉Tag后进行分词,保存每个单词在网页中的位置……查询时允许多单词,...

  • 分类算法之朴素贝叶斯(NaiveBayes)

    我个人认为,在数据挖掘领域,分类算法是最为重要。它根据以往的数据来对新的数据做预测。垃圾邮件判断,潜在用户挖掘等都会用到分类算法。今天把总结朴素...

    0.3 3302 1 17
  • 还是推荐电影,这次是基于物品的协同过滤

    基于用户的协同过滤,适用于物品较少,用户也不太多的情况。如果用户太多了,针对每个用户的购买情况来计算哪些用户和他品味类似,效率很低下。如果商品很...

文集作者