动机 本身是java码农. 运维的Hadoop小集群上硬盘故障已经成为每天日常, 有各种hdfs故障. 最严重一次,文件没法从datanode同...
原文 概览 HDFS上的中心化缓存是一个显式的缓存机制, 使得用户可以指定哪个路径被缓存. Namenode和拥有指定文件块的DataNode们...
来源以下加粗术语对完成今天的题目非常有用. 事件Event, 样本空间Sample Space 和 概率 Probability 在概率论中, ...
译自 Day 0: Weighted Mean 加权平均 weighted mean给一组数值的集合,和一组对应的权重值的集合,则加权平均的计算...
来源 对今天挑战有用的概念都已高亮列出如下. 负二项分布实验 一个负二项分布实验是一个有以下性质的统计实验: 实验包含n次重复的测试. 每次测试...
来源你会发现对今天的挑战有用术语列在下面. 条件概率 Conditional Probability 这个是这么定义的, 当某个事件发生时, 可...
原文 介绍 HDFS滚动升级可以升级单独的HDFS守护进程. 例如, datanode们可以独立于namenode来升级. 一个namenode...
来源 标准差 Standard Deviation 期望值 Expected Values: 一个离散随机变量X的期望值,基本上就是平均值(μ)...
四分位距 Interquartile Range 一个数组的四分位距是第一个四分位数(Q1)和第三个四分位数(Q3)的差. (例如:(Q3 - ...