Avatar notebook default
17篇文章 · 29650字 · 0人关注
  • Resize,w 360,h 240
    决策树与随机森林及其在SparkMllib中的使用

    一.概念 决策树和随机森林:决策树和随机森林都是非线性有监督的分类模型。 决策树是一种树形结构,树内部每个节点表示一个属性上的测试,每个分支代表...

  • Resize,w 360,h 240
    Apache Kylin 从零开始构建Cube(含优化策略)

    前言 Apache Kylin采用“预计算”的模式,用户只需要提前定义好查询维度,Kylin将帮助我们进行计算,并将结果存储到HBase中,为海...

  • Scala中的协变与逆变

    协变与逆变的概念 对于一个带类型参数的类型,比如 List[T],如果对A及其子类型B,满足 List[B]也符合 List[A]的子类型,那么...

  • Oracle中物化视图的概念

    前言 Oracle中的物化视图也是种视图。Oracle的物化视图是包括一个查询结果的数据库对像,它是远程数据的的本地副本,或者用来生成基于数据表...

  • Resize,w 360,h 240
    【数据结构与算法】青蛙跳台阶问题解析

    一只青蛙一次可以跳上1级台阶,也可以跳上2级……它也可以跳上n级。求该青蛙跳上一个n级的台阶总共有多少种跳法。 因为n级台阶,第一步有n种跳法:...

  • 如何在1TB文件中找到重复的两行数据

    前言 之前在网上看过一个很有意思的问题? 在单机且内存不能放下全部足量的数据的情况下,如何在1T的文件中,找到重复的两行? 看完这个问题,不妨我...

    1.4 1161 4 9 1
  • Memcache实现Session共享

    前言 session的常见实现形式是会话cookie(session cookie),即未设置过期时间的cookie,这个cookie的默认生命...

  • 阻塞与非阻塞,同步与非同步,你真的懂吗?

    按照《Unix网络编程》的划分,IO模型可以分为:阻塞IO、非阻塞IO、IO复用、信号驱动IO和异步IO。按照POSIX标准来划分只分为两类:同...

  • Shiro的简单身份验证

    前言 身份验证,即在应用中谁能证明他就是他本人。一般提供如他们的身份 ID 一些标识信息来表明他就是他本人,如提供身份证,用户名/密码来证明。 ...

文集作者