240 发简信
IP属地:上海
  • Spark Python API Docs(part two)

    pyspark.sql module Module context Spark SQL和DataFrames中的重要类: pyspark.sql...

    0.5 5373 0 19
  • 线性回归分析预测模型的python实现

    1. 简介 在统计学中,回归分析(regression analysis)指的是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。回...

  • Resize,w 360,h 240
    可视化工具grafana

    grafana 简介 Grafana是一个开源的度量分析和可视化套件。它最常用于可视化基础设施和应用程序分析的时间序列数据,但也用于许多其他领域...

  • Resize,w 360,h 240
    聚类算法之K均值算法(k-means)的Python实现

    算法简介 K-means算法是硬聚类算法,是典型的基于原型的目标函数聚类方法的代表,它是数据点到原型的某种距离作为优化的目标函数,利用函数求极值...

  • 时序数据库influxdb

    influxdb 简介 Influxdb是一个开源的分布式时序、时间和指标数据库,使用go语言编写,无需外部依赖。 特性: 时序性(Time S...

  • Resize,w 360,h 240
    pycharm + spark 的实现

    这篇博客主要介绍了在window上(类unix上也是可行的)实现在pycharm上编写spark脚本。在Windows上跑主要是为了测试,脚本没...

  • flink是什么

    架构 Apache Flink是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态计算。Flink设计为在所有常见的集群环境中运行,以内...

  • Elasticsearch集群的搭建

    简介 ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。...

  • scala编程知识点简介

    简介 scala是一门综合了面向对象和函数式编程概念的静态类型的编程语言。函数式编程以两大核心理念为指导:第一个理念是函数是一等的值。(可以将函...