240 发简信
IP属地:山西
  • Spark机器学习1:朴素贝叶斯分类

    本文原始地址 分类 每个人每天都会进行很多次的分类操作。比如,当你看到一个陌生人,你的大脑中的分类器就会根据TA的体貌特征、衣着举止,判断出TA...

  • 翻译:Hadoop权威指南之Spark-5

    本文原始地址 剖析Spark工作的运行 我们来看下当我们运行一个Spark工作时,会发生什么。在最高级别上,有两个独立的实体:驱动(driver...

  • 翻译:Hadoop权威指南之Spark-4

    本文原始地址 Persistence 回到本章开头的例子,我们可以把“年度-气温”的中间数据集缓存在内存中: 调用cache()不会立刻把RDD...

  • 翻译:Hadoop权威指南之Spark-3

    本文原始地址 Resilient Distributed Datasets RDD是每个spark程序的核心,本节我们来看看更多细节。 Crea...

  • 翻译:Hadoop权威指南之Spark-2

    本文原始地址 A Scala Standalone Application 在Spark shell中运行了一个小程序之后,你可能想要把它打包成...

  • 翻译:Hadoop权威指南之Spark-1

    本文翻译自O'Reilly出版Tom White所著《Hadoop: The Definitive Guide》第4版第19章,向作者致敬。该书...