漫谈机器学习（Machine Learning）

机器学习是人工智能的一个重要分支。什么是机器学习？以下是两种解释：

（1）机器学习算法是一类从数据中分析获得规律，并利用规律对未知数据进行预测的算法。

（2）机器学习就是通过算法，使得机器能从大量历史数据中学习规律，从而对新的样本做智能识别或对未来做预测。

机器学习通常包括下面几种类别：

（1）监督学习从给定的训练数据集中学习出一个函数，当新的数据到来时，可以根据这个函数预测结果。监督学习的训练集要求包括输入和输出，或者说是特征和目标，训练集中的目标是由人标注的。常见的监督学习算法包括回归分析和统计分类。

（2）无监督学习与监督学习相比，训练集没有人为标注的结果。常见的无监督学习算法有聚类。

（3）增强学习通过观察来学习做成更有效的动作。每个动作都会对环境有所影响，学习对象根据观察到的周围环境的反馈来做出判断。

文/黄成甲

机器学习的对象是特征

机器学习需要一个精致的引擎和相当专业的知识来设计一个特征提取器，把原始数据（如图像的像素值）转换成一个适当的内部特征表示或特征向量，然后对输入的样本进行检测或分类。而特征学习是一套给机器灌入原始数据，就可以自动发现需要进行检测和分类的特征的方法。深度学习就是一种特征学习方法，把原始数据通过一些简单的但是非线性的模型转变成为更高层层次的、更加抽象的表达。通过足够多的转换的组合，非常复杂的函数也可以被学习。对于分类任务，高层次的表达能够强化输入数据的区分能力方面，同时削弱不相关因素。深度学习的核心方面是，各层的特征都不是利用人工工程来设计的，而是使用一种通用的学习过程从数据中学到的。

举个例子：如果我们分析把选橙子的问题定义成标准的机器学习问题。

随机选择一个市场上的橙子，作为我们要研究的目标。你可以用一个表格描述橙子的属性和类型的关系，每一行可以放一个橙子的数据，包括橙子的各种物理属性（Feature )：颜色、大小、形状、产地等，还有品尝时橙子的属性（Output Variables)：甜度、成熟度、多汁度等。现在这就是一个多分类问题，或者是回归问题，自动从数据中学习出特征与橙子类型的各种关系等。如果用决策树算法，那么这个模型的样子就是你的规则库。当然，你也可以使用其他模型，比如线性模型，这样就是特征的线性组合了。下次你去买水果，采集了一个橙子的各个指标特征，扔进你的模型，模型就会告诉你这个橙子的各种属性。甚至你选择橙子的模型稍微变化下就可以选择香蕉了，这就叫迁移学习。甚至你的模型会随着新的样本、新橙子的种类，变得越来越好，越来越全面，增量学习。

监督学习（Supervised Learning）

监督学习是机器学习中一种典型的学习方法，顾名思义，监督式学习就是有个人在旁边看着你学习，随时纠正你学习中的错误。怎么纠正呢？对错误学习给予惩罚，对正确学习给予奖励。

监督式学习中，所有输入数据都被称为“训练数据”，每组数据实际上有两个部分构成：正确的训练集和错误的训练集，这两部分最好数量上相等，并且样本数量足够全，能覆盖到最多的情况。接下来，将训练这些数据并将识别和预测结果与实际的人为标定过的“训练数据”做比较，不断地调整模型，直到模型的预测结果达到一个预测的准确度。

无监督学习（Unsupervised Learning）

无监督学习，也就是没有“人”在旁边督促你学习，没有人为标定好的训练数据，没有告诉模型哪些数据是正确的，哪些是不正确的。在无监督学习中，学习模型是为了推断数据的内在结构。很常见的应用场景包括关联规则的学习即聚类等。比如说，我们讲苹果和香蕉混合在一起，并没有告诉模型苹果和香蕉的特征，模型自己去聚类学习，有可能学习出来很多种类别，除了特征相差较大的苹果和香蕉两种不同的水果外，还能发现某些苹果和香蕉的特殊品种，这种发现是由算法自己找出的。非监督学习的常见算法包括Apriori算法及K-Means算法。

增强学习（Reinforcement Learning）

增强学习也称为强化学习。增强学习就是将情况映射为行为，也就是去最大化收益。学习者并不是被告知哪种行为将要执行，而是通过尝试学习到最大增益的行为并付诸行动。也就是说增强学习关注的是智能体如何在环境中采取一系列行为，从而获得最大的累积回报。通过增强学习，一个智能体应该知道在什么状态下应该采取什么行为。RL是从环境状态到动作的映射的学习，我们把这个映射称为策略。

增强学习要解决的是这样的问题：一个能感知环境的自治agent，怎样通过学习选择能达到其目标的最优动作。强化学习目的是构造一个控制策略，使得Agent行为性能达到最大。Agent从复杂的环境中感知信息，对信息进行处理。Agent通过学习改进自身的性能并选择行为，从而产生群体行为的选择，个体行为选择和群体行为选择使得Agent作出决策选择某一动作，进而影响环境。

增强学习是指从动物学习、随机逼近和优化控制等理论发展而来，是一种无导师在线学习技术，从环境状态到动作映射学习，使得Agent根据最大奖励值采取最优的策略；Agent感知环境中的状态信息，搜索策略（哪种策略可以产生最有效的学习）选择最优的动作，从而引起状态的改变并得到一个延迟回报值，更新评估函数，完成一次学习过程后，进入下一轮的学习训练，重复循环迭代，直到满足整个学习的条件，终止学习。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 156,265评论 4赞 359
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 66,274评论 1赞 288
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 106,087评论 0赞 237
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 43,479评论 0赞 203
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 51,782评论 3赞 285
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 40,218评论 1赞 207
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 31,594评论 2赞 309
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 30,316评论 0赞 194
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 33,955评论 1赞 237
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 30,274评论 2赞 240
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 31,803评论 1赞 255
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 28,177评论 2赞 250
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 32,732评论 3赞 229
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 25,953评论 0赞 8
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 26,687评论 0赞 192
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 35,263评论 2赞 267
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 35,189评论 2赞 258

漫谈机器学习（Machine Learning）

推荐阅读更多精彩内容