【读书笔记】《人工智能基础——高中版》

《人工智能基础——高中版》.png

就是这个书,我一个啥都不懂的文科生竟然能看懂各种专业名词,真厉害哈哈哈,顺便记录一下~
这是一本很科普又很专业的书(相对某些畅销书来说),几句话就把几个概念说明白。定位受众是高中生,没机会回炉重造读高中了,只能读读书了,hhhh......

【第一章】人工智能:新时代的开启

1956年,闵斯基、约翰·麦卡锡、克劳德·香农、纳撒尼尔·罗切斯特在美国组织了达特茅斯会议,会议提出了Artificial Intelligent(AI)即人工智能,宣告人工智能作为一门学科的诞生。

  • 第一次浪潮(1956-1974):伟大的首航——人工智能初露头角
  • 第二次浪潮(1980-1987):专家系统的兴衰——专家系统、人工神经网络
  • 第三次浪潮(2011-今):厚积薄发、再造辉煌——重大突破
人工智能在各个领域的应用:
  • 安防:视频分析、视频检测、检测异常;
  • 医疗:医学影像分析;
  • 智能克服:电子商务、金融、通信、物流、旅游等;
  • 自动驾驶
  • 工业制造:工业4.0,人工智能系统提升生产效率、降低生产风险;

监督学习:为每个样本提供预测量的真实值来获得模型;
无监督学习:在不提供监督信息(预测量的真实值)的条件下进行学习;
半监督学习:对小部分样本提供预测量的真实值;
强化学习:在下棋、股票交易、或商业决策等场景中,关注行动能否带来最大收益,目标是获得一个策略去指导行动;

【第二章】牛刀小试:察异辨花(分类问题)

  • 分类器(classifier):完成分类任务的人工智能系统


    分类器
  • 向量:把数据中的特征放在一组数据
    向量可以做加减法、乘法、内积(对应相乘并求和)
    向量内积:(X1 , X2)·(Y1, Y2)=(X1Y1+X2Y2)


    特征空间

    特征点与特征点之间的距离被用来衡量相似程度;

  • 训练集:当一个数据集被用于分类器训练,我们称之为训练集;
    训练线性分类器的方法:

  • 感知器:使用被分错的样本来调整分类器
    损失函数:误分类的数据点离得越远,损失函(loss)数越大;
    优化:调整分类器的参数,使损失函数最小;

  • 支持向量机SVM(support vector machine):在特征空间上,分类间隔最大的分类器



归一化:将一个向量压缩到另一个向量中,使其每一个元素的范围在(0,1)之间,并且所有元素的和为1。也就是看每一个向量的概率

【第三章】别具慧眼:识图人物(图像分类)

图像可以表示成为一个由数字组成的矩阵阵列,即矩阵(matrix)
彩色图片(RGB),按立方体排列的数字阵列为三阶张量(tensor)


色彩表示

张量:标量属于零阶张量;向量属于一阶张量;矩阵是二阶张量。

卷积:卷积和加减乘除一样,是一种数学运算,参与卷积运算的可以是向量、矩阵、三阶张量;

向量卷积
矩阵的卷积
  • 卷积神经网络:当一个神经网络以卷积层为主体时,我们称之为卷积神经网络;

  • 全连接层:输入图片在经过若干卷积层之后,会将得到的特征图转换为特征向量,用到的就是全连接层;

  • 非线性激活层:保留多层结果(这个不是很理解??)

  • 池化层:降低特征图的分辨率,减少计算量;

  • 反向传播算法:从后往前调整参数;


  • 过拟合:迎合训练数据,在新数据上表现很差;(在已有数据优秀)

  • 欠拟合:在训练数据和新数据上表现都很差;(都不行)

【第四章】耳听八方:析音赏月(声音识别)

声音:频率是声音的重要特征;人的发声的频率范围在85-1100Hz;
声波到Mp3 文件的过程:采样(sampling)、量化(quantization)、编码(encoding);

计算机里音频文件是按照时间先后顺序排列的数据点,所以也被称为“时间序列”;
采样的频率比较高时,波形看起来是近似连续的;


声音的变化
  • 声学模型:把一系列语言转为若干音素的过程利用了语言的声学特性;
  • 语言模型:从音素到文字的过程需要用到语言表达的特点,这样才能从同音字中挑出正确的文字,组成意义明确的语句;

【第五章】冰雪聪明:看懂视频(视频识别)

小伙伴的iPad丢了,今天和她去警察局看录像,警察局的录像,真的是无力吐槽啊,作为一个在AI公司工作的人,我们表示,现在技术的发展和应用的鸿沟还蛮大的。。

  • 小插曲:
    警察叔叔说他们在招“视频员”,问我俩换不换工作,我们只想技术应用赶紧替换掉他们需要的这个人。
    【视频员,顾名思义—— 1、随时检查辖区内的发生的情况,有什么事件发生赶紧通知在外的同事去处理(人工的视频行为识别);2、在有人需要看回放的时候帮别人找录像资料(人工视频数据员)】


  • 行为识别的重要特征:运动
  • 运动的刻画:光流
    光流就是同一个点在相邻两帧的位移,计算光流的关键就是把两帧之间相同的点对应起来;


【第六章】无师自通:分门别类(图片分类)

  • K值聚类:
    KMeans算法是最常用的聚类算法,主要思想是:在给定K值和K个初始类簇中心点的情况下,把每个点(亦即数据记录)分到离其最近的类簇中心点所代表的类簇中,所有点分配完毕之后,根据一个类簇内的所有点重新计算该类簇的中心点(取平均值),然后再迭代的进行分配点和更新类簇中心点的步骤,直至类簇中心点的变化很小,或者达到指定的迭代次数。


  • 层次聚类:将每个样本单独当成一个类,而后重复地合并最相似的两个类,当所有的类别间的距离都超过一个预设的截止距离时,层次聚类就完成了;

【第七章】识字断文:理解文本(语义分析)

  • 词袋模型(bag-of-words model): 用于描述文本的一个数学模型,也是常用的一种文本特征提取方式;——词袋模型将一篇文档看作装有若干词语的袋子,只考虑词语在文档中出现的次数,而忽略词语的顺序和句子的结构;


  • 停止词:“的”“也”“了”这样不携带任何主体信息的高频词;

TF-IDF(词频-逆文档频率):

  • 词频 (term frequency, TF)指的是某一个给定的词语在该文件中出现的次数。
  • 逆文档频率(nverse Document Frequency,IDF) 是一个词语普遍重要性的度量,它的大小与一个词的常见程度成反比,计算方法是语料库的文档总数除以语料库中包含该词语的文档数量,再将得到的商取对数。


    IDF

【第八章】神来之笔:创作图画(图像生成)

  • 对抗生成网络(GAN:generative adversarial network):由生成网络(generative network)——生成器 和判别网络(discriminative network)——判别器 两部分组成,生成网络用于生成数据,判别网络用来分辨数据是真还是假;
  • 数据空间(data space):数据所在的空间;
  • 数据分布(data distribution):数据在空间中的分布情况;

emmm较好的视觉效果???

【第九章】运筹帷幄:围棋高手(强化学习,reinforcement learning)

  • 强化学习:强化学习与监督学习、无监督学习一样,为机器学习算法中的一种,强化学习与监督学习最主要的区别在于其收到的反馈是评估性的,而不是指导性的。
    强化学习使计算机像人一样通过完全自主学习来掌握一项技能。alphago通过自我对弈左右互搏来提升棋技。
    *主题与环境的交互:
    做出决策的实体叫主体(agent),主体存在于环境(environment)中,主体行为作用于环境并接受环境的反馈。
    主体通过发出特定的动作(action),来改变环境目前的状态(state),环境改变后,会返回给主体一个观察(observation),同时返回给主体一个回报(reward)。


  • 策略(policy):指的是主体的行为是一个从状态集合到动作集合的映射;强化学习的目的就是找到一个最佳策略。
  • 蒙特卡洛搜索算法(Monte Carlo tree search):一种通过随机推演建立一颗搜索树的启发式搜索过程,我们也可以将其看成某种意义上的强化学习算法。

alphago的部分有的没看懂。。。就大概是这样

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,117评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,328评论 1 293
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,839评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,007评论 0 206
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,384评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,629评论 1 219
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,880评论 2 313
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,593评论 0 198
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,313评论 1 243
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,575评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,066评论 1 260
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,392评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,052评论 3 236
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,082评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,844评论 0 195
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,662评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,575评论 2 270

推荐阅读更多精彩内容