机器学习监督算法的基本思路是 让拟合的模型尽量接近真实数据, 换句更通俗的话, 要让我们的模型尽量简单又能很好的反应已知数据之间关系。在这个贴近...
hive的库、表等数据实际是hdfs系统中的目录和文件,让开发者可以通过sql语句, 像操作关系数据库一样操作文件内容, 比如执行查询,统计,插...
SVM是数据挖掘算法中比较复杂难懂的,反复观看斯坦福机器学习的视频, 以及网上零散学习各种数学和SVM相关资料, 对SVM还只能算有个粗浅的理解...
Attention机制源于对Seq2Seq模型的几个问题优化。Seq2Seq是基于Encoder-Decoder架构思想实现。Encoder和D...
本人是hadoop入门级小白, 一边学习Hadoop权威指南英文版, 一边翻译相关内容, 希望达到加深理解的效果, 发 布博客上, 希望能和大家...
上一篇文章中,线性回归关键问题之一:求解系数的方法梯度下降。梯度下降在数据挖掘很多算法中都有应用, 属于比较基本的数学基础方法, 本文对此算法进...
常见回归算法基础概念,参见下如下文章,个人感觉是介绍比较好的文章: 7 Types of Regression Techniques you s...
SerDe是Serialize/Deserilize的简称,目的是用于序列化和反序列化。 序列化作用 序列化是对象转换为字节序列的过程。序列化是...
逻辑回归是回归系列中一个分类模型,而且是一个二分类模型。逻辑回归模型简单但应用广泛,本文从模型介绍、适用场景以及优缺点等几个方面介绍下。 模型介...