北郁 - 简书

发简信

北郁

22
关注
1
粉丝
2
文章
1838

字数
0

收获喜欢
1

总资产

IP属地：广东

北郁

Zookeeper以及分布式事务概要
一，ZooKeeper： Zookeeper集群中的角色Leader领导者Learner学习者：Follower跟随者Observer观察者3.集群节点的状态：1.LOOKI...

277 0 0
北郁

JAVA线程
1.Java线程1.1 进程与线程进程：是操作系统的结构基础，是一个程序运行时的实例，是系统进行资源分配和任务调度的基本单位。线程：线程是进程中的一个执行流程，是CPU调度和...

146 0 0

北郁

Future模式
Future模式是多线程开发中非常常见的一种设计模式。它的核心思想是异步调用。对于多线程来说，线程A需要等待线程B的结果，它没必要一直等待B，可以先拿到一个未来的Futur...

zfylin
1520 0 1
北郁

spark源码阅读之shuffle模块②
在spark源码阅读之shuffle模块①中，介绍了spark版本shuffle的演化史，提到了主要的两个shuffle策略：HashBasedShuffle和SortedB...

invincine
520 0 2
北郁

祝威廉
写了 263680 字，被 3536 人关注，获得了 2394 个喜欢

新博客地址： <a href="https://links.jianshu.com/go?to=https%3A%2F%2Fwww.zhihu.com%2Fpeople%2Fallwefantasy" target="_blank">https://www.zhihu.com/people/allwefantasy</a>
北郁

Spark Tungsten-sort Based Shuffle 分析
Tungsten-sort 算不得一个全新的shuffle 方案，它在特定场景下基于类似现有的Sort Based Shuffle处理流程，对内存/CPU/Cache使用做了...

祝威廉
12444 0 15 1
北郁

code_solve
写了 141192 字，被 148 人关注，获得了 409 个喜欢

实力来自点点滴滴的积累，专注原创，分享大数据技术。

北郁

Spark性能优化指南——高级篇
原文：https://tech.meituan.com/spark-tuning-pro.html Spark性能优化指南——高级篇前言继基础篇讲解了每个Spark开发人...

code_solve
1158 0 34
北郁

游善朱哥
写了 0 字，被 40092 人关注，获得了 1025 个喜欢
北郁

ad4d39659223
写了 39805 字，被 317 人关注，获得了 281 个喜欢

HBase技术交流社区，共同探讨HBase技术
北郁

HBase场景 | 都是HBase上的SQL引擎，Kylin和Phoenix有什么不同？
大数据时代，数据的价值越来越被重视，企业从海量大数据中挖掘所需要的信息，用来驱动业务决策以获得更大的商业价值。与此同时，出现了越来越多的大数据技术帮助企业进行大数据分析，例如...

ad4d39659223
1298 1 15
北郁

大猪大猪
写了 274027 字，被 3012 人关注，获得了 5779 个喜欢

我是大猪、一个让你沉迷于文章内容的IT写作者！

北郁

spark
Frank_8942 编，-4 篇文章，4 人关注

基本靠猜...
北郁

flink
小C菜鸟编，78 篇文章，246 人关注

Flink流式计算框架
北郁

19 Spark Streaming中空RDD的处理
在Spark Streaming中，job不断的产生，有时候会产生一些空RDD，而基于这些空RDD生成的job大多数情况下是没必要提交到集群执行的。执行没有结果的job，就是...

海纳百川_spark
7344 10 14
北郁

Spark Structured Streaming 2.4 踩的一些坑
最近参与一个公司大数据项目开始入坑Spark，Spark从2.0开始从RDD 的底层API转向了面向Dataset/Dataframe 的高级API，Spark Stream...

华安火车迷
4437 5 9
北郁

偏差(Bias)和方差(Variance)——机器学习中的模型选择
模型性能的度量在监督学习中，已知样本，要求拟合出一个模型（函数），其预测值与样本实际值的误差最小。考虑到样本数据其实是采样，并不是真实值本身，假设真实模型（函数...

城市中迷途小书童
1445 0 26

暂无个人介绍