从0开始搭建产品经理AI知识框架:机器学习2方法篇

上篇内容介绍关于机器学习一些基础概念的理解,今天深入的介绍机器学习的各种方式,以及在产品中的有哪些应用。

机器学习都有哪些学习方式?

涉及到机器学习相关知识:

  • 监督学习:需要“标签”当老师,明确要预测什么。
  • 无监督学习:不告诉机器正确答案,让机器自己学习,给出结果。
  • 半监督学习:训练的数据,只有一小部分是标记过的,大部分是没有标记。
  • 强化学习:通过反馈,边实践边学习。
  • 迁移学习:在某个垂直领域训练完成后,移致去其他相关领域调优发挥作用。

监督学习

什么是监督学习:

  • 概念:监督学习就是通过样例给定输入与输出,让程序学会一些通用的规则,这样对于需要预测的数据,得到输出。
  • 诠释:有一个明确预测的目标,比如:预估房价,给予机器大量的有标签的数据,以及最终的销售价,来训练这个模型。

监督学习主要解决的是两类问题:

  • 回归问题:

    • 概念:预测结果是连续的,意味着我们尝试将输入变量映射到一些连续函数。
    • 举例:如预测房价的例子,通过大量输入输出数据,以及各种房屋类型,环境等标签,训练模型后,输入新的数据,既可预测房价。
  • 分类问题:

    • 概念:预测结果是离散的,意味着我们尝试将输入变量映射到离散类别。
    • 举例:如芒果的例子,同样通过大量输入输出数据,包括芒果,颜色,大小,形状,以及甜度,成熟度等标签,当输入新的数据,机器计算出属于这个芒果是在吃,还是在不好吃的分类里。

监督学习主要涉及到的算法模型如下:

  • 线性回归模型(Linear Regression)
  • K-近邻算法(k-Nearest Neighbors,KNN)
  • 决策树(Decision Trees)
  • 朴素贝叶斯(Naive Bayesian)
  • 逻辑回归(Logistic Regression)

个人建议产品经理对于算法重视,初期知道解决的是什么问题即可,不要从学习的视角去深入,而是实际遇到问题,遇到问题时候再研究。

无监督学习

什么是无监督学习:

  • 诠释:无监督学习就是不给数据提供标签,由程序自动对数据进行聚类、关联、降维等工作。
  • 诠释:我们拥有大量的数据,但是不知道答案,需要用无监督学习的方法,让它们根据某些特征自动分成若干组,从而找到数据中存在的价值。

无监督学习主要解决的三类问题:

  • 关联

    • 概念:为了发现各种现象同时出现的概率。
    • 举例:经典例子,男人买啤酒和买尿布的关联性非常高,超市把啤酒和尿布放在一起,从而提高业绩。
  • 聚类

    • 概念:把样本分堆,使同一堆中的样本之间很相似,而不同堆之间的样本就有些差别。
    • 举例:Google新闻,每天会搜集大量的新闻,然后把它们全部聚类,就会自动分成几十个不同的组(比如娱乐,科技,政治......),每个组内新闻都具有相似的内容结构。
  • 降维

    • 概念:降维意味着减少数据集中变量的个数,但是仍然保留重要的信息。主要作用是压缩数据与提升机器学习其他算法的效率。
    • 举例:房价包含房子的长、宽、面积与房间数量四个特征,也就是维度为4维的数据。而面积=长 × 宽,通过降维算法我们就可以去除冗余信息,即从4维的数据压缩到2维

无监督学习主要涉及到的算法模型如下:

  • K 均值算法(K-means)
  • 自编码(Autoencoding)
  • 主成分分析(Principal components analysis)
  • 随机森林(Random forests)

同理,解决实际问题中,再深入到算法里提升自己的认知。

半监督学习

什么是半监督学习:

  • 概念:使用大量的未标记数据,以及同时使用标记数据,来进行模式识别工作。
  • 诠释:大概意思就是,监督学习与无监督学习相结合的一种学习方法,介于两者之间。

半监督学习解决问题:

  • 相比监督学习:节约人力成本,提高投入产出比。
  • 相比无监督学习:可以得到分配更高精度的模型。

具体适用场景的举例:

  • 例如:视频网站上有几百万的视频,但其中只有几十万的视频有标签,如果把剩下几百万视频都打上标签,工作量和成本是巨大的,而用无监督的方法,在很多情况下精度会很低,所以使用半监督的方法,可以在节省人力的情况下,得到分类更高精度的模型。
  • 例如:垃圾信息过滤,一般的方法是监督,需要大量的语料标注,告知系统哪些可能是垃圾信息。但用户产会生了大量的信息,且垃圾信息的发布者也在调整策略,无法进行实时标注,这里可以用半监督的方法,根据垃圾信息发布者的特殊行为,发布内容等找到相似性,进行过滤。

强化学习

什么是强化学习:

  • 概念:强化学习就是智能系统从环境到行为映射的学习,以使奖励信号(强化信号)函数值最大。如果Agent的某个行为策略导致环境正的奖赏(强化信号),那么Agent以后产生这个行为策略的趋势便会加强。
  • 诠释:针对没有标注数据集的情况而言,通过反馈来区分是否越来越接近目标。比如常见一个猜价格的游戏,你来猜这个东西值多少钱,别人告诉你猜的价格是高了还是低了。
  • 例如:阿尔法狗,自己跟自己下围棋,通过一盘盘的胜负,自我学习、自我修炼、自我改正,然后一个一个迭代,自己跟自己下了1000万盘之后,完全就是一个新的狗狗。

强化学习和监督学习的区别:

  • 监督学习总的来说是一个开环的学习。

    • 通常,监督学习任务会从环境中收集一批数据;
    • 接着我们用监督学习算法从数据中产生模型;
    • 最后就可以用这个模型来做预测了。
  • 但是对于强化学习来说,它面对的是一个闭环的学习。

    • 首先,也是从环境中产生数据;
    • 用强化学习的算法从数据中产生模型;
    • 还要把模型放回到环境中运行,接着又会产生新的数据出来,再重复以上步骤。

强化学习的应用:

  • 例如:训练机器臂,把一个指的位置的物体,拿到另外一个指定的位置上,这里你不告诉它怎么做,让他通过一遍遍的训练,找到最佳的移动物体路径。
  • 例如:个性化推荐,当推荐你某个分类内容时候,你会点击或查看,它就会根据你的行为,推荐给你更多该分类的内容。
  • 例如:无人机操作,指定你的无人机进行某种动作飞行,通过强化学习来控制高度,速度,姿态等等,根据奖励让它自己学习策略,来达到目的

迁移学习

什么是迁移学习:

  • 概念:一般就是指要将从源领域学习到的东西应用到目标领域上去。
  • 诠释:比如你会骑自行车,你会控制车把,刹车,控诉,躲避,踩踏,平衡感等等,然后让你骑摩托车时候,你也可以轻易上手,逐渐适应速度和动力上的特殊性。

迁移学习应用:

  • 模拟中学习:不管是无人车,还是机械臂,在现实中学习耗时且昂贵。通过模拟的方法,在虚拟中完成部分的训练,迁移到现实中,当然这种方法存在很多问题,毕竟虚拟世界无法做到跟现实一模一样,比如物理引擎,但是作为初始训练是可行的。
  • 适应新领域:在线推荐系统中利用迁移学习,例如影像资料领域做好一个推荐系统,然后应用在稀疏的、新的垂直领域书籍资料里。
  • 跨语言传播知识:从一种语言学习然后将所得知识应用于另一种语言,是迁移学习的另一个重要应用。比如英语训练之后,迁移到印度本土语言上。

以上就是本人对于机器学习中各种学习方式理解,而其中的「深度学习」部分会单独谈谈自己理解。

AI PM认知系列的相关阅读:
第一篇:从0开始搭建产品经理的AI认知体系
第二篇:产品经理的AI知识框架:计算机视觉
第三篇:产品经理的AI知识框架:语音识别与合成
第四篇:产品经理的AI知识框架:机器学习1基础篇

作者:兰枫,前腾讯游戏,新浪微博PM,Elex产品总监,连续创业者。

推荐阅读更多精彩内容