val trainedTrees = trees.map(s=>growTree(getRandomSubsample(data, subSampleSize/numSamples.toDouble, seed), maxHeight, numColumns))
确实没实现并行,因为driver去解析生成这个dag的时候,会迭代去执行它,而不是将trees的操作全部触发,虽然trees里面每个元素是独立存在的。
运行类似于: array.foreach{
action operator
}
程序只会在遇到action算子的时候去触发dag,trees里面的操作会一个一个执行...
异常点检测算法isolation forest的分布式实现无监督领域有一个准度和效率双佳的异常点检测算法,我在实践中使用过几次,效果奇好,就是最近几年非常流行的isolation forest(孤立森林)。该算法在sklearn中有...