转载自:https://zhuanlan.zhihu.com/p/360858309[https://zhuanlan.zhihu.com/p/...
1、你要切换到yarn-cluster或者yarn-client模式,很简单,将我们之前用于提交spark应用程序的spark-submit脚本...
一、kafka默认的发送一条消息的大小是1M,如果不配置,当发送的消息大于1M是,就会报错 二、具体配置 1、 kafka topic 2、se...
原因: scala版本不一致造成的 解决方案: 更改pom文件里scala版本可参考:https://blog.csdn.net/weixin_...
以下四种方法,总有一种适合你:1、清缓存IDEA--File--Invalidate Caches,然后重启IDEA 2、File--Setti...
一、单机版kafka的安装 1、下载kafka的安装包并解压 tar -txvf kafka_2.11-0.9.0.1.tgz -C path(...
一、HDFS的shell(命令行客户端)操作 二、hdfs的工作机制 1、概述 2、HDFS写数据的流程 2.1、概述 客户端要向HDFS写数据...
一、hadoop背景介绍 1.1 什么是HADOOP HADOOP是apache旗下的一套开源软件平台 HADOOP提供的功能:利用服务器集群,...
单列离散化: 多列同时离散化: 不同离散化方式:http://www.javashuo.com/article/p-hnamuksv-ec.ht...