240 发简信
  • 也许你也曾走过魔镜迷宫

    年少时走过的路,仿佛在迷宫里狂奔。一个人的悟性有多高,他就能跑多快。 魔镜迷宫,是一条蜿蜒的、由三角形块拼接成的出路,每块三角形中,两边是镜子,一边是出口。简单的设计,本来清...

  • 什么样的特征是一个好特征

    引言 特征是非常重要的——特征决定了模型的上限,而算法只是在逼近这个上限。 好特征的标准 1、模型角度带有准确的独立的意义,即该特征含义非常明确,能够恰好表达这个含义。 2、...

  • 喝茶与肾结石

    来源:CHH某回复 美食被我们吃进肚子后,除了人体需要的营养外,还会产生草酸盐、尿酸盐这类垃圾。路过肾脏时,肾脏很嫌弃地把它们像丢垃圾一样丢进尿里。正常情况下,这些家伙就跟着...

  • 共享单车,一件皇帝的新衣

    随着共享单车的两大玩家摩拜,ofo都卖身成功,创始人作为80后的成功人士代表刷屏朋友圈,这场闹剧终于体面地结束了。是的,作为吃瓜群众的我认为这完全就是一场闹剧,就像皇帝的新衣...

  • Mapreduce

    一句话总结:Mapreduce的原理就是一个归并排序。Hadoop是一个实现了MapReduce模式的开源的分布式并行编程框架。 Map是一个拆解数据块的过程,把数据拆成:<...

  • 马尔科夫相关概率问题

    用来描述一个动态过程的:1.经过某个状态的概率;2.到达了终止状态后,经过多少路程的期望;3.足够长时间后的稳定状态。 1.经过某个状态的概率例题:持续抛硬币,抛出第一个00...

  • 120
    红黑树

    一句话概括:着色了的二叉查找树。二叉树若退化成了一棵具有n个结点的线性链后,则此些操作最坏情况运行时间为O(n)。红黑树通过着色等一些性质使得树相对平衡,使得最终查找、插入、...

  • 野指针

    概念:野指针指指向一个已删除的对象或未申请访问受限内存区域的指针。与空指针不同,野指针无法通过简单地判断是否为NULL避免,而只能通过养成良好的编程习惯来尽力减少。 主要的成...

  • STL

    内存分配问题:push_back的时候怎么分配? 为了实现连续存放:先开一个固定大小的vector,如果push_back的时候超过这个大小就再开一个2倍大小的,把这些元素都...

  • open、fopen、freopen区别(文件操作)

    同样的,还有:write、fwrite、read、fread、close、fclose 主要区别:open是系统底层的,fopen是c/c++的库函数,freopen也是库函...

  • 约瑟夫环

    问题:1~n个人围成一圈,从1开始报数,每次数到m这个人就出列,问最后剩下的是几号? 做法:递归。 假设剩下的是f(n)号,那么要找f(n)与f(n-1)等的关系,又因为这个...

  • 120
    B-树、B+树和B*树

    用途:Mysql数据库里面的索引主要基于Hash和B+树。 B-树 (读作B shu,中间不是减号)一句话总结:就是矮胖版的搜索二叉树。为什么要矮胖?主要是减少磁盘的IO。因...

  • 120
    simhash-海量数据(文章、网页)场景下如何比较相似度

    原贴:simhash 比较相似度一般的做法都是:1.生成特征向量,(例1.对文章分词,然后给每个词算权重,权重作为向量,其中权重可以是词出现的次数;例2.对文档建hash)2...

  • 随机森林

    随机森林是一种分类算法,实战中往往比较有用。 简介:如其名,算法里面有一些随机性,另外,主要的思想是很多的决策树(形成森林)的分类结果加权,得到最后的分类结果。 步骤:1.对...

  • 120
    格雷码Graycode

    格雷码是什么见百度百科。 这是一个简单的递归问题:1.生成n+1位的格雷码:第一位不反转,递归生成n位的格雷码;然后第一位反转,再递归生成n位的格雷码。2.要保证的就是第一位...

  • 120
    Python数据分析学习路径图(120天Get新技能)

    Python是一种面向对象、直译式计算机程序设计语言,由Guido van Rossum于1989年底发明。由于他简单、易学、免费开源、可移植性、可扩展性等特点,Python...

  • OOP(面向对象)

    详细内容见:OOP 三大特性:封装,继承,多态。 封装:就是打包,即,把数据和针对数据的操作,都统一到一个class里面。另:软件对扩展开放,对修改关闭(开闭原则 open-...