新一代人工智能发展的机遇 --《2017年新一代人工智能发展白皮书》读后感

0.137字数 20336阅读 8296

一、概述

随着生物识别技术、自然语音处理技术、大数据驱动的智能感知、理解等技术的不断发展和深入,人工智能的技术瓶颈以及应用成本已从根本上得以突破。这使得人工智能的发展也日趋接近于人类智能水平,人工智能正从学术驱动转变为应用驱动、从专用智能迈向通用智能。根据新一代人工智能面临的新形势、驱动的新因素、呈现的新特征,本文的目的是通过对《新一代人工智能发展白皮书》学习,对人工智能发展的历史、驱动要素、主要特征、技术架构及产业化应用等方面进行概述,使从事人工智能领域研究、开发、生产及服务型企业及个人对新一代人工智能有一定的认知,也希望从中掌握新一代人工智能的发展机遇,制定企业发展战略和个人规划,使其能在行业中占有一席之地。

二、人工智能发展历程

人工智能从诞生至今,人工智能已有 60 年的发展历史,大致经历了三次浪潮。第一次浪潮为 20 世纪 50 年代末至 20 世纪80 年代初;第二次浪潮为 20 世纪 80 年代初至 20 世纪末;第三次浪潮为 21 世纪初至今。在人工智能的前两次浪潮当中,由于技术未能实现突破性进展,相关应用始终难以达到预期效果,无法支撑起大规模商业化应用,最终在经历过两次高潮与低谷之后,人工智能归于沉寂。随着信息技术快速发展和互联网快速普及,以 2006 年深度学习模型的提出为标志,人工智能迎来第三次高速成长[摘抄原文]。

三、驱动人工智能发展的要素

3.1人机物互联互通成趋势,数据量呈现爆炸性增长

随着互联网、社交媒体、移动设备和传感器的大量普及,其产生并存储的数据量急剧增加,为通过深度学习的方法来训练人工智能提供了良好的土壤,海量的数据将为人工智能算法模型提供源源不断的素材,人工智能从各行业、各领域的海量数据中积累经验、发现规律、使其深度学习成果得以持续提升。

3.2数据处理及运算能力的大幅提升

人工智能领域富集了海量数据,传统的数据处理技术难以满足高强度、 高频次的处理需求,人工智能一个神经元的处理需要数百甚至上千条指令才能完成,传统主流的X86、ARM的CPU架构难已与之匹配。目前,出现了 GPU、 NPU、 FPGA 和各种各样的 AI-PU专用芯片,这些人工智能芯片的出现加速了深层神经网络的训练迭代速度,让大规模的数据处理效率显著提升,极大地促进了人工智能行业的发展。

3.3深度学习研究成果卓著,带动算法模型持续优化

2006 年,加拿大多伦多大学教授杰弗里•辛顿提出了深度学习的概念,极大地发展了人工神经网络算法,提高了机器自学习的能力。随着算法模型的重要性进一步凸显,全球科技巨头纷纷加大了这方面的布局力度和投入,通过成立实验室,开源算法框架,打造生态体系等方式推动算法模型的优化和创新。目前,深度学习等算法已经广泛应用在自然语言处理、语音处理以及计算机视觉等领域,并在某些特定领域取得了突破性进展,从有监督式学习演化为半监督式、无监督式学习。

3.4资本与技术深度耦合,助推行业应用快速兴起

当前,在技术突破和应用需求的双重驱动下,人工智能技术已走出实验室,加速向产业各个领域渗透,产业化水平大幅提升。在此过程中,资本作为产业发展的加速器发挥了重要的作用,一方面,跨国科技巨头以资本为杠杆,展开投资并购活动,得以不断完善产业链布局。人工智能已在智能机器人、无人机、金融、医疗、安防、驾驶、搜索、教育等领域得到了较为广泛的应用。

四、新一代人工智能主要特征

4.1大数据成为人工智能持续快速发展的基石

智能终端和传感器的快速普及,海量数据快速累积;计算能力、数据处理能力和处理速度实现了大幅提升,机器学习算法快速演进,大数据的价值得以展现。新一代人工智能是由大数据驱动的,通过给定的学习框架,不断根据当前设置及环境信息修改、更新参数,具有高度的自主性。例如,在输入 30 万张人类对弈棋谱并经过 3 千万次的自我对弈后,人工智能 AlphaGo 具备了媲美顶尖棋手的棋力。

4.2文本、图像、语音等信息实现跨媒体交互

计算机图像识别、语音识别和自然语言处理等技术在准确率及效率方面取得了明显进步,并成功应用在无人驾驶、智能搜索等垂直行业。与此同时,随着互联网、智能终端的不断发展,多媒体数据呈现爆炸式增长,并以网络为载体在用户之间实时、动态传播,文本、图像、语音、视频等信息突破了各自属性的局限,实现跨媒体交互,智能化搜索、个性化推荐的需求进一步释放。未来人工智能将逐步向人类智能靠近,模仿人类综合利用视觉、语言、听觉等感知信息,实现识别、推理、设计、创作、预测等功能。

4.3基于网络的群体智能技术的应用

随着互联网、云计算等新一代信息技术的快速应用及普及,大数据不断累积,深度学习及强化学习等算法不断优化,人工智能研究的焦点,已从单纯用计算机模拟人类智能,打造具有感知智能及认知智能的单个智能体,向打造多智能体协同的群体智能转变。群体智能充分体现了“通盘考虑、统筹优化”思想,具有去中心化、自愈性强和信息共享高效等优点,相关的群体智能技术已经开始萌芽并成为研究热点。例如,我国研究开发了固定翼无人机智能集群系统,并于 2017 年 6月实现了 119 架无人机的集群飞行。

4.4自主智能系统成为新兴发展方向

随着生产制造智能化改造升级的需求日益凸显,通过嵌入智能系统对现有的机械设备进行改造升级成为更加务实的选择。在中国制造 2025引导下,自主智能系统正成为人工智能的重要发展及应用方向。例如,沈阳机床以 i5 智能机床为核心,打造了若干智能工厂,实现了“设备互联、数据互换、过程互动、产业互融”的智能制造模式。

4.5人机协同正在催生新型混合智能形态

人类智能在感知、推理、归纳和学习等方面具有机器智能无法比拟的优势,机器智能则在搜索、计算、存储、优化等方面领先于人类智能,两种智能具有很强的互补性。人与计算机协同,互相取长补短将形成一种新的“1+1>2”的增强型智能,也就是混合智能,这种智能是一种双向闭环系统,既包含人,又包含机器组件。其中人可以接受机器的信息,机器也可以读取人的信号, 两者相互作用,互相促进。在此背景下,人工智能的根本目标已经演进为提高人类智力活动能力,更智能地陪伴人类完成复杂多变的任务。

五、新一代人工智能技术框架

5.1新一代人工智能的技术演变

5.1.1 从原有的 CPU 架构,转变为 GPU 并行运算架构

大数据技术带来的数据洪流满足了人工智能的深度学习算法对于训练数据量的要求,但是算法的实现还需要更快更强大的处理器予以支撑。当前主流的 CPU 只有 4 核或者 8 核,可以模拟出 12 个处理线程来进行运算,但是普通级别的 GPU 就包含了成百上千个处理单元,高端的甚至更多,可以快速处理图像上的每一个像素点,其海量数据并行运算的能力与深度学习需求非常符合。这对于多媒体计算中大量的重复处理过程有着天生的优势。吴恩达教授领导的谷歌大脑研究工作结果表明, 12 颗英伟达(Nvidia)公司的 GPU 可以提供相当于 2000 颗 CPU 的深度学习性能,为人工智能技术的发展带来了实质性飞跃。

5.1.2从单一算法驱动,转变为数据、运算力、算法复合驱动

与早期人工智能相比,新一代人工智能体现出数据、运算力和算法相互融合、优势互补的良好特点。1、数据方面,人类进入互联网时代后,数据技术高速发展,各类数据资源不断积累,为人工智能的训练学习过程奠定了良好的基础。2、运算力方面,摩尔定律仍在持续发挥效用,计算系统的硬件性能逐年提升,云计算、并行计算、网格计算等新型计算方式的出现拓展了现代计算机性能,获得更快的计算速度。3、算法方面,伴随着深度学习技术的不断成熟,运算模型日益优化,智能算法不断更新,提升了模型辨识解析的准确度。

5.1.3从封闭的单机系统,转变为快捷灵活的开源框架

人工智能系统的开发工具日益成熟,通用性较强且各具特色的开源框架不断涌现,如谷歌的TensorFlow、Facebook 的Torchnet、百度的PaddlePaddle 等,其共同特点均是基于 Linux 生态系统,具备分布式深度学习数据库和商业级即插即用功能,能够在GPU 上较好地继承 Hadoop 和 Spark 架构,广泛支持 Python、Java、 Scala、 R 等流行开发语言,与硬件结合生成各种应用场景下的人工智能系统与解决方案。

5.1.4从学术研究探索导向,转变为快速迭代的实践应用导向

目前,人工智能围绕医疗、金融、交通、教育、零售等数据较集中且质量较高的行业的实践需求,在算法模型、图像识别、自然语言处理等方面将持续出现迭代式的技术突破,在深度应用中支撑人工智能实现“数据-技术-产品-用户”的往复正循环,正由学术驱动向应用拉动转化。在人工智能技术准备期,由于提供数据支撑较少,技术提升度慢,一旦进入应用期,大量的优质数据有助于分析技术弊端,通过对相关技术进行改进升级,提升了产品的应用水平,用户在得到更好的产品体验后,继续为应用平台创造了更大规模的后台数据,用来进行下一步的技术升级与产品改良,由此进入了大规模应用阶段。在技术快速迭代发展的过程中,数据累积和大规模应用起到了至关重要的作用,能够持续推动人工智能技术实现自我超越。

5.2新一代人工智能技术体系

新一代人工智能技术体系由基础技术平台和通用技术体系构成,其中基础技术平台包括云计算和大数据平台,通用技术体系包括机器学习、模式识别与人机交互。

5.2.1云计算:基础的资源整合交互平台

云计算主要共性技术包括虚拟化技术、分布式技术、计算管理技术、云平台技术和云安全技术,具备实现资源快速部署和服务获取、进行动态可伸缩扩展及供给、面向海量信息快速有序化处理、可靠性高、容错能力强等特点,为人工智能的发展提供了资源整合交互的基础平台。尤其与大数据技术结合,为当前受到最多关注的深度学习技术搭建了强大的存储和运算体系架构,促进了神经网络模型训练优化过程,显著提高语音、图片、文本等辨识对象的识别率。

5.2.2 大数据:提供丰富的分析、训练与应用资源

大数据主要共性技术包括采集与预处理、存储与管理、计算模式与系统、分析与挖掘、可视化计算及隐私及安全等,具备数据规模不断扩大、种类繁多、产生速度快、处理能力要求高、时效性强、可靠性要求严格、价值大但密度较低等

特点,为人工智能提供丰富的数据积累和价值规律,引发分析需求。同时,从跟踪静态数据到结合动态数据,可以推动人工智能根据客观环境变化进行相应的改变和适应,持续提高算法的准确性与可靠性。

5.2.3机器学习:持续引导机器智能水平提升

机器学习指通过数据和算法在机器上训练模型,并利用模型进行分析决策与行为预测的过程。机器学习技术体系主要包括监督学习和无监督学习,目前广泛应用在专家系统、认知模拟、数据挖掘、图像识别、故障诊断、自然语言理解、

机器人和博弈等领域。机器学习作为人工智能最为重要的通用技术,未来将持续引导机器获取新的知识与技能,重新组织整合已有知识结构,有效提升机器智能化水平,不断完善机器服务决策能力。

5.2.4模式识别:从感知环境和行为到基于认知的决策

模式识别是对各类目标信息进行处理分析,进而完成描述、辨认、分类和解释的过程。模式识别技术体系包括决策理论、句法分析和统计模式等,目前广泛应用在语音识别、指纹识别、人脸识别、手势识别、文字识别、遥感和医学诊断等领域。随着理论基础和实际应用研究范围的不断扩大,模式识别技术将与人工神经网络相结合,由目前单纯的环境感知进化为认知决策,同时量子计算技术也将用于未来模式识别研究工作,助力模式识别技术突破与应用领域拓展。

5.2.5人机交互:支撑实现人机物交叉融合与协同互动

人机交互技术赋予机器通过输出或显示设备对外提供有关信息的能力,同时可以让用户通过输入设备向机器传输反馈信息达到交互目的。人机交互技术体系包括交互设计、可用性分析评估、多通道交互、群件、移动计算等,目前广泛应用在地理空间跟踪、动作识别、触觉交互、眼动跟踪、脑电波识别等领域。随着交互方式的不断丰富以及物联网技术的快速发展,未来肢体识别和生物识别技术将逐渐取代现有的触控和密码系统,人机融合将向人机物交叉融合进化发展,带来信息技术领域的深刻变革。

六、新一代人工智能的产业化应用

随着人工智能理论和技术的日益成熟,应用范围不断扩大,潜在需求的逐渐明确和商业模式的日渐成熟,人工智能核心产业的边界与范围将逐步扩展。通过人工智能核心产业发展所形成的辐射和扩散效应,获得新提升、新增长的国民经济其它行业集合,均可视为人工智能带动的相关产业。

通过梳理从研发到应用所涉及的产业链各个环节,将新一代人工智能在当前的核心产业分为基础层、技术层和应用层,结合目前常见应用场景,依据产业链上下游关系,再将其主要划分为既相对独立又相互依存的若干种产品及服务,其新一代人工智能当前核心产业链如下图所示。



6.1基础层

基础层主要包括智能传感器、智能芯片、算法模型,其中,智能传感器和智能芯片属于基础硬件,算法模型属于核心软件。

随着应用场景的快速铺开,既有的人工智能产业在规模和技术水平方面均与持续增长的市场需求尚有差距,倒逼相关企业及科研院所进一步加强对智能传感器、 智能芯片及算法模型的研发及产业化力度。预计到 2020 年,全球智

能传感器、 智能芯片、算法模型的产业规模将突破 270 亿美元, 我国智能传感器、 智能芯片、算法模型的产业规模将突破 44 亿美元。

6.1.1智能传感器:智能转型引领行业发展

智能传感器属于人工智能的神经末梢,是实现人工智能的核心组件,是用于全面感知外界环境的最核心元件,各类传感器的大规模部署和应用是实现人工智能不可或缺的基本条件。随着传统产业智能化改造的逐步推进,以及相关新型智能应用和解决方案的兴起,对智能传感器的需求将进一步提升,预计到 2020 年全球智能传感器的产业规模将超过54 亿美元,其中我国智能传感器的产业规模为 11 亿美元。

核心技术: 智能传感器本质上是利用微处理器实现智能处理功能的传感器,必须能够自主接收、分辨外界信号和指令,并能通过模糊逻辑运算、主动鉴别环境,自动调整和补偿适应环境,以便于大幅减轻数据传输频率和强度,显著提高数据采集效率。目前,智能传感器集成化、小型化的特点愈发突出,更多的功能被集成在一起,控制单元所需的外围接插件和分立元件越来越少,促使其通用性更强,应用范围更宽广,制造成本也进一步下降。同时,原子材料、纳米材料等新材料技术也在智能传感器领域得到日益广泛的应用,使其表现出更为灵敏的物理性能。

主要产品: 智能传感器已广泛应用于智能机器人、智能制造系统、智能安防、智能人居、智能医疗等各个领域。例如,在智能机器人领域,智能传感器使机器人具有了视觉、听觉和触觉,可感周边环境,完成各种动作,并与人发生互动,包括触觉传感器、视觉传感器、超声波传感器等。在智能制造系统领域,利用智能传感器可直接测量与产品质量有关的温度、压力、流量等指标,利用深度学习等模型进行计算,推断出产品的质量,包括液位、能耗、速度等传感器。在安防、人居、医疗等与人类生活密切相关的领域,智能传感器也广泛搭载于各类智能终端,包括光线传感器、距离传感器、重力传感器、陀螺仪、心律传感器等。

典型企业:智能传感器市场主要由国外厂商占据,集中度相对较高。由于技术基础深厚,国外厂商通常多点布局,产品种类也较为丰富,较为典型的有霍尼韦尔、美国压电、意法半导体、飞思卡尔。如霍尼韦尔生产的产品包括了压力传感器、温度传感器、湿度传感器等多个产品类型,涉及航空航天、交通运输、医疗等多个领域。美国压电生产的产品涵盖了加速度传感器、压力传感器、扭矩传感器等,并涉及核工业、石化、水力、电力、和车辆等多个不同领域。相比之下,我国厂商经营内容仍较为单一,如高德红外主要生产红外热成像仪,华润半导体主要生产光敏半导体,但其中也出现了华工科技、中航电测等少数企业试水扩大布局范围。人工智能根据客观环境变化进行相应的改变和适应,持续提高算法的准确性与可靠性。

6.1.2 智能芯片:初创企业蓄势待发

智能芯片是人工智能的核心,与传统芯片最大的差别在于架构不同,传统的计算机芯片均属于冯•诺依曼体系,智能芯片则仿照大脑的结构设计,试图突破冯•诺依曼体系中必须通过总线交换信息的瓶颈。当前各大科技巨头正积极布局人工智能芯片领域, 初创企业纷纷入局,随着市场将进一步打开,预计到 2020 年全球智能芯片的产业规模将接近 135 亿美元,其中我国智能芯片的产业规模近 25 亿美元。

核心技术:深度学习已成为当前主流的人工智能算法,这对于处理器芯片的运算能力和功耗提出了更高要求,目前软件企业采取的主流方案是通过应用 GPU 和 FPGA 提高运算效率,与 CPU 少量的逻辑运算单元相比, GPU 就是一个庞大的计算矩阵,具有数以千计的计算核心,可实现 10-100倍应用吞吐量,而且支持对深度学习至关重要的并行计算能力,可以比传统处理器更加快速,大大加快了训练过程。同时,一些针对深度学习算法而专门优化和设计的芯片也已经面市,由于是量身定制,运行更为高效。

主要产品:数据和运算是深度学习的基础,可以用于通用基础计算且运算速率更快的 GPU 迅速成为人工智能计算的主流芯片。 2015 年以来,英伟达公司的 GPU 得到广泛应用,并行计算变得更快、更便宜、更有效,最终导致人工智能大爆发。同时,与人工智能更匹配的智能芯片体系架构的研发成为人工智能领域的新风口,已有一些公司针对人工智能推出了专用的人工智能芯片。如 IBM的类脑芯片 TureNorth及神经突触计算机芯片 SyNAPSE、高通的认知计算平台Zeroth、英特尔收购的 Nervana、浙江大学与杭州电子科技大学的学者合作研制的类脑芯片“达尔文”,中国科学院计算技术研究所的寒武纪芯片。

典型企业: 作为核心和底层基础,智能芯片已经成为各大公司布局的重点领域。目前传统芯片巨头如英特尔、英伟达,大型互联网公司如谷歌、微软已经在该领域发力,这些公司资金实力雄厚,除了自行研发外,通常也采用收购的方

式快速建立竞争优势。例如,谷歌继 2016 年发布第一代 TPU后,于今年谷歌 I/O 大会上推出了第二代深度学习芯片 TPU,英特尔则以 167 亿美元收购 FPGA 生产商 Altera 公司。由于智能芯片刚刚兴起,技术、标准都处于探索阶段,我国芯片厂商换道超车的机会窗口闪现,涌现出了一批优秀的创业型公司,如寒武纪、深鉴科技等。

6.1.3算法模型:通过开源构建生态已是大势所趋

人工智能的算法是让机器自我学习的算法,通常可以分为监督学习和无监督学习。随着行业需求进一步具化,及对分析要求进一步的提升,围绕算法模型的研发及优化活动将越发频繁。当前,算法模型产业已初具规模,预计到 2020

年全球算法模型产业规模将达到 82 亿美元,我国算法模型产业规模将突破 8 亿美元。

核心技术:算法创新是推动本轮人工智能大发展的重要驱动力,深度学习、强化学习等技术的出现使得机器智能的水平大为提升。全球科技巨头纷纷以深度学习为核心在算法领域展开布局,谷歌、微软、 IBM、 Facebook、百度等相继在图片识别、机器翻译、语音识别、决策助手、生物特征识别等领域实现了创新突破。

主要产品: 目前,随着大数据环境的日渐形成,全球算法模型持续取得应用进展,深度学习算法成为推动人工智能发展的焦点,各大公司纷纷推出自己的深度学习框架,如谷歌的 TensorFlow, IBM 的 System ML, Facebook 的 Torchnet,百度公司的 PaddlePaddle。更为重要的是,开源已成为这一领域不可逆的趋势,这些科技巨头正着手推动相关算法的开源化,发起算法生态系统的竞争。与此同时,服务化也是算法领域未来发展的重要方向,一些在算法提供商正将算法包装为服务,针对客户的具体需求提供整体解决方案。

典型企业: 目前,在算法模型领域具备优势的企业基本均为知名的科技巨头,正在通过构建联盟关系,扩展战略定位等方式布局人工智能产业。 2016 年 9 月, Facebook、亚马逊、谷歌 Alphabet、 IBM 和微软自发聚集在一起,宣布缔结新的人工智能伙伴关系, 10 月,谷歌公司更是调整战略方向从移动优先转变为人工智能优先。我国科技企业也纷纷落子人工智能, 2017 年 3 月,阿里巴巴正式推出“NASA”计划,腾讯成立人工智能实验室, 5 月,百度公司将战略定位从互联网公司变更为人工智能公司,发展人工智能已经成为科技

界的共识。

6.2技术层

技术层主要包括语音识别、 图像视频识别、文本识别等产业,其中语音识别已经延展到了语义识别层面,图像视频识别包括了人脸识别、手势识别、指纹识别等领域,文本识别主要是针对印刷、手写及图像拍摄等各种字符进行辨识。

随着全球人工智能基础技术的持续发展与应用领域的不断丰富,人工智能技术层各产业未来将保持快速增长态势。预计到 2020 年,全球语音识别、图像视频识别、文本识别等人工智能技术层产业规模将达到 342 亿美元,我国人工智能

技术层产业规模将突破 66 亿美元。

6.2.1语音识别:正在步入应用拉动的快速增长阶段

语音识别(Speech Recognition, SR)技术是将人类语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用及产品。在大数据、移动互联网、云计算以及其他技术的推动下,全球的语音识别产业已经步入应用快速增长期,未来将代入更多实际场景,预计到 2020 年全球语音识别产业规模将达到 236 亿美元,国内语音识别产业规模达到 44.2亿美元。

核心技术:语音识别的主要目的是让智能设备能够具有和人类一样的听识能力,同时将人类语言所表述的自然语义自动转换为计算机能理解和操作的结构化语义,完成实时的人机交互功能。近年来,语音唤醒技术、声学前端处理技术、

声纹识别技术、语义理解技术、对话管理技术等语音识别领域核心技术的蓬勃发展,有助于构建智能语音交互界面系统,提高语音识别的准确率与响应速度,满足垂直领域对自然语义识别和声音指令的应用需求,为用户提供自然、友好和便捷的人机交互体验。

主要产品:伴随着移动互联网技术的发展与智能硬件设备的普及,人类已经不再满足于键盘输入和手写输入等传统人机交互方式,语音识别技术在电子信息、互联网、医疗、教育、办公等各个领域均得到了广泛应用,形成了智能语音

输入系统、智能语音助手、智能音箱、车载语音系统、智能语音辅助医疗系统、智能口语评测系统、智能会议系统等产品,可以通过用户的语音指令和谈话内容实现陪伴聊天、文字录入、事务安排、信息查询、身份识别、设备控制、路径

导航、会议记录等功能,优化了复杂的工作流程,提供了全新的用户应用体验。

典型企业: 语音识别领域具有较高的行业技术壁垒,在全球范围内,只有少数的企业具有竞争实力。目前, Nuance、苹果、三星、微软、谷歌、科大讯飞、云知声、百度、 阿里、凌声芯、思必驰等知名企业均重点攻克语音识别技术,推出大量相关产品。 Nuance 曾经是全球最大的语音识别技术提供商,侧重于为服务提供商提供底层技术解决方案,随着企业战略目标以及商业环境的改变,目前转型为客户端解决方案提供商;苹果公司以 Siri 语音助手为平台关联 iOS 系统相关应用与服务,倾向于改善用户的智能手机使用体验和创新商业模式;微软致力于提高语音识别技术的准确率,英语的语音识别转录词错率仅 5.9%,达到了专业速录员水平,并将相关技术应用于自身产品“小冰”和“小娜”之中;科大讯飞作为国内智能语音和人工智能产业的领导者,中文语音识别技术已处于世界领先地位,并逐渐建立中文智能语音产业生态;云知声重点构建集机器学习平台、语音认知计算和大数据交互接口三位一体的智能平台,垂直应用领域集中于智能家居和车载系统;阿里人工智能实验室借助“天猫精灵”智能音箱构建基于语音识别的智能人机交互系统,并通过有效接入第三方应用实现生活娱乐功能的进一步拓展。

6.2.2图像视频识别:在安防监控市场具有巨大增长潜力

图像识别(Image Recognition, IR)技术是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式状态下的目标和对象,包括人脸、手势、指纹等生物特征。视频从工程技术角度可以理解成静态图像的集合,所以视频识别与图像识别的定义和基本原理一致,在识别量和计算量上明显提高。随着人类社会环境感知要求的不断提升和社会安全问题的日益复杂,人脸识别和视频监控作用更加突出,图像视频识别产业未来将迎来爆发式增长,预计到 2020 年全球图像视频识别产业规模将达到 82 亿美元,国内图像视频识别产业规模达到 15.2 亿美元。

核心技术: 图像视频识别是通过计算机模拟人类器官和大脑感知辨别外界画面刺激的过程,既要有进入感官的信息,也要有记忆中存储的信息,对存储的信息和接受的信息进行比较加工,完成图像视频的辨识过程。围绕以上特定需求,

图像预处理技术、特征提取分类技术、图像匹配算法、相似性对比技术、深度学习技术等构成了图像视频识别的核心技术体系框架,能够对通过计算机输入和照相机及摄像头获取的图片视频进行变换、压缩、增强复原、分割描述等操作,显著提高图像视频识别质量和清晰度,有助于快速准确完成图像视频的响应分析流程。

主要产品: 随着工业生产及生活消费领域影像设备的日益普及,每天都会产生海量蕴含丰富价值和信息的图片及视频,单靠人力无法进行分拣处理,需要借助图像视频识别功能进行集中快速获取与解析。目前,智能图片搜索、人脸识

别、指纹识别、扫码支付、视觉工业机器人、辅助驾驶等图像视频识别产品正在深刻改变着传统行业,针对种类繁杂、形态多样的图形数据和应用场景,基于系统集成硬件架构和底层算法软件平台定制综合解决方案,面向需求生成图像视

频的模型建立与行为识别流程,为用户提供丰富的场景分析功能与环境感知交互体验。

典型企业: 近年来,国内外从事图像视频识别的公司显著增加,谷歌、 Facebook、微软、旷视科技、图普科技、格灵深瞳等国内外知名企业重点集中在人脸识别、智能安防和智能驾驶等领域进行技术研发与产品设计。国外公司大多进行底层技术研发,同时偏重于整体解决方案的提出,积极建立开源代码生态体系,如谷歌推出 Google Lens 应用实时识别手机拍摄的物品并提供与之相关的内容, Facebook 开源三款智能图片识别软件,鼓励研发者们围绕其图像视频识别技术框架开发各类功能丰富的应用产品;国内企业直接对接细分领域,商业化发展道路较为明确,如旷视科技目前重点研发人脸检测识别技术产品,加强管控卡口综合安检、重点场所管控、小区管控、智慧营区等领域的业务布局,图普科技在阿里云市场提供色情图像和暴恐图像识别的产品和服务,确定准确率超过 99.5%,满足了云端用户的安全需求。

6.2.3文本识别:全面进入云端互联时代

文本识别(Text Recognition, TR)技术是指利用计算机自动识别字符,包括文字信息的采集、信息的分析与处理、信息的分类判别等内容。文本识别可以有效提高如征信、文献检索、证件识别等业务的自动化程度,简化工作流程,提高相关行业效率。随着政府、金融、教育、科技等领域需求中国电子学会的进一步上升,文本识别将在工业自动化流程与个人消费领域取得长足发展,预计到 2020 年全球文本识别产业规模将达到 24 亿美元,国内文本识别产业规模达到 6.6 亿美元。

核心技术: 文本识别技术目前正由嵌入式设备本地化处理向云端在线处理全面演进发展,过去由鼠标与键盘输入的文本信息,现在则主要由摄像头、麦克风和触摸屏采集获取。在此基础上,以往的文本识别核心技术, 如模版匹配技术、字符分割技术、光学字符识别技术(Optical Character Recognition, OCR)、逻辑句法判断技术等需要与应用程序编程接口(API)技术、智能终端算法技术、云计算技术等结合,衍生出面向云端与移动互联网的新型文本识别系统,通过开放的平台与服务为广大的企业及个人用户提供方便快捷的服务。

主要产品: 当今信息社会背景下,文本信息不仅体量巨大,表现形式也日趋复杂,包括印刷体、手写体以及通过外接设备输入到计算机系统的字符图形。同时,随着世界不同语言文明地区交流逐渐增多,对实时语言文本翻译系统的需

求更加强烈。目前,基于文本识别技术开发的文件扫描、名片识别、身份证信息提取、文本翻译、在线阅卷、公式识别等产品正在金融、安防、教育、外交等领域得到广泛应用,通过不同的授权级别,为企业级用户部署专业的文档管理、移动办公与信息录入基础设施,同时为个人用户提供个性化的人脉建立、信息咨询和远程教育服务。

典型企业: 随着文本识别在各类垂直应用领域的应用逐渐普及,国内外企业也结合自身业务和区域发展特色积极展开布局。谷歌、微软、亚马逊等跨国科技巨头在自身产品服务中内嵌文本识别技术,以增强产品使用体验和用户粘度,

如谷歌推出的在线翻译系统可提供 80 种语言之间的即时翻译,并将自身的语音识别技术与文本识别相结合,提高了翻译效率。国内公司在中文文本识别领域也有多年积累,具备良好的技术优势与产业背景,汉王科技、百度、腾讯等均有

较为成熟的产品推出,如汉王正在构建以识别云和设备云为核心的文本识别 2.0 系统。

6.3应用层

应用层主要包括智能机器人、智能金融、智能医疗、智能安防、智能驾驶、智能搜索、智能教育、智能制造系统及智能人居等产业。其中,智能机器人产业规模及增速相对突出; 智能金融、 智能驾驶、 智能教育的用户需求相对明确且市场已步入快速增长阶段;智能安防集中于行业应用和政府采购,市场集中度相对较高;智能搜索、智能人居的产品尚未完善,市场正在逐步培育;智能医疗则涉及审批机制,市场尚未放量。预计到 2020 年,全球人工智能应用层产业规模将达到 672 亿美元,其中,智能机器人、智能驾驶、智能教育、智能安防及智能金融的产业规模将超过 68%,同时我国人工智能应用层产业规模将突破 110 亿美元。

6.3.1智能机器人

智能机器人是指具备不同程度类人智能,可实现“感知-决策-行为-反馈”闭环工作流程,可协助人类生产、服务人类生活,可自动执行工作的各类机器装置,主要包括智能工业机器人、智能服务机器人和智能特种机器人。受智能工业机

器人助推智能制造升级和智能家用服务机器人率先放量的带动,智能机器人全球产业规模在 2020 年会接近 90 亿美元,我国将达到 25 亿美元。

核心技术: 由于高频人机互动特点,智能机器人的核心技术重点聚焦在智能感知、智能认知和多模态人机交互领域。同时依据应用领域的不同,智能机器人也存在着大量带有典型行业特征的特色关键技术。智能工业机器人运用传感

技术和机器视觉技术,具备触觉和简单的视觉系统, 更进一步运用人机协作、多模式网络化交互、自主编程等技术增加自适应、自学习功能,引导工业机器人完成定位、检测、识别等更为复杂的工作,替代人工视觉运用于不适合人工作业的危险工作环境或人工视觉难以满足要求的场合;智能家用服务机器人重点应用移动定位技术和智能交互技术,达到服务范围全覆盖及家用陪护的目的;智能医疗服务机器人重点突破介入感知建模、微纳技术和生肌电一体化技术,以达到提升手术精度、加速患者康复的目的;智能公共服务机器人重点运用智能感知认知技术、多模态人机交互技术、机械控制和移动定位技术等,实现应用场景的标准化功能的呈现和完成;智能特种机器人运用仿生材料结构、复杂环境动力学控制、微纳系统等前沿技术,替代人类完成高危环境和特种工况作业。

主要产品: 智能工业机器人领域, 随着柔性生产模式的转型, 具备感知、规划、学习能力的智能定位机器人和智能检测机器人加速出现, 智能定位机器人通过机器视觉系统结合双目摄像头, 引导机械手进行准确的定位和运动控制,不仅可以完成对工件的抓取和放置等操作,同时还能进行焊缝、 抛光、喷涂、外壳平整等多项作业; 智能检测机器人用机器视觉检测方法大大提高生产效率和生产的自动化程度。智能服务机器人领域,随着人均收入水平的提升,对家用工具智能化程度的需求日益增长,扫地机器人、擦窗机器人等智能家政服务产品大量涌现;同时由于全球老龄化引发的社会问题,情感陪护类机器人市场需求也逐步成熟,辅助人类进行陪伴和沟通;随着全球医疗投入的持续增加以及微创类

手术需求的快速上升,智能医疗服务机器人进一步促进了医疗解决方案的高效化和精准化。智能特种机器人领域,人类工作及探索的环境边界不断拓展,为降低在高危及不确定环境的工作难度,智能军用机器人、应急救援机器人及消防机

器人等正在逐渐代替人类从事高危环境和特殊工况;无人机则广泛应用在警用、城市管理、农业、地质、气象、电力、抢险救灾、视频拍摄等行业,实现大面积巡查,完成实时监测和评估。

典型企业: 智能工业机器人领域,国际四大巨头仍占据较高市场份额, 日本发那科和安川、德国库卡、瑞士 ABB、意大利柯马侧重具有分拣和装配能力的智能工业机器人,英国 Meta、德国 Scansonic、日本安川聚焦激光视觉焊缝跟踪系统; 国内智能工业机器人“三巨头”新松、云南昆船和北京机科占据国内 90%市场份额,均有典型产品推出,新松重点提供自动化装配与检测生产线、物流与仓储自动化成套设备,云南昆船侧重烟草行业服务,北京机科主要应用于印钞造币、轮胎及军工领域。智能服务机器人领域,美国 iRobot、中国科沃斯、美国 Intuitive Surgica、 以色列 Rewalk、荷兰Hot-Cheers 分别聚焦于清洁、手术、康复及分拣等细分领域。智能特种机器人领域,波士顿动力围绕着拥有液压驱动核心技术的“大狗”机器人,不断构筑技术壁垒;大疆在国内消费级无人机领域占有率达 75%,成为估值超百亿美元的“独角兽”企业;美国 Howe and Howe Techonologies 则专注生产消防机器人,应用于应急救援场景。

6.3.2 智能金融

金融行业与整个社会存在巨大的交织网络,每时每刻都能够产生金融交易、客户信息、市场分析、风险控制、投资顾问等多种海量数据。促进人工智能技术与金融行业相融合,在前端可以增强用户的便利性和安全性,在中台支持授信、各类金融交易和金融分析中的决策,在后台用于风险防控和监督。这将大幅改变金融行业现有格局,推动银行、保险、理财、借贷、投资等各类金融服务的个性化、定制化和智能化。 受智能客服、金融搜索引擎及身份验证入口级产品的广泛普及和应用, 智能金融全球产业规模在 2020 年会接近 52 亿美元,我国将达到 8 亿美元。

核心技术: 当前,线上交易引发的隐私泄露及金融诈骗频出,同时随着移动终端和金融机构客户端的普及,提取的用户金融数据逐步丰富,金融机构线上服务能力和用户隐私和交易风控就变得至关重要,语音识别、自然语音处理、计

算机视觉、生物特征识别和机器学习等技术得到了广泛应用。语音识别与自然语音处理技术可以为前端服务客户实现批量人性化和个性化的服务;计算机视觉与生物特征识别技术则为金融支付验证提供了保障;机器学习技术一方面通过导入海量金融交易数据,从中分析信用卡数据,识别欺诈交易,并提前预测交易变化趋势,另一方面通过构建金融知识图谱将不同来源的结构化和非结构化的数据整合到一起,建立基于大数据的完整征信授信体系。

主要产品: 基于电话、网页在线、微信、短信及 APP等多模式多频次的金融信息及服务获取渠道,相对较为成熟并已经逐步推广的产品包括智能客服、金融搜索引擎和身份验证,通过构建知识图谱实现理解答复及信息关联体系、提

供远程开户和刷脸支付等便捷方式帮助金融机构节省人力成本。同时,随着用户消费及信贷能力的逐步提升,也涌现出一批征信和风险控制的产品,但受限于数据库的规模和数据源的相对难以获取,目前大部分集中在客观呈现款人、企业间、行业间的信息维度关联方面。此外,金融类或资产管理类公司为持续提供用户理财和升值的资产组合推出了智能投顾产品,可根据历史经验和新的市场信息来预测金融资产的价格波动趋势,以此创建符合风险收益的投资组合。

典型企业: 智能客服、身份验证和金融搜索引擎领域创新企业较多,着重于引流扩量。智齿科技、网易七鱼及美国DigitalGenius 均着重通过用户体验提升客户量,旷世科技、商汤科技及依图围绕着人脸识别的核心技术进入金融领域,融 360、好贷网、资信客聚焦垂直领域打造金融服务的入口。征信及风控领域企业以大数据为壁垒,逐步出现行业龙头。启信宝和美国 ZestFinance 不断扩容数据基础,形成“平台黑洞”优势,启信宝通过提取 100 多家官方网站数据产品侧重呈现客观数据整合, ZestFinance 则使用谷歌的大数据模型建立

信用评分体系。智能投顾多为金融机构专业人才或者投资顾问公司转型而来,美国 Wealthfront、弥财、财鲸等主要通过投资 ETF 组合以达到资产配置,理财魔方、钱景私人理财则专注基金产品的覆盖,雪球和金贝塔等以对量化策略、 投资名人的股票组合的跟投为内容展开资讯传递和信息交流。

6.3.3智能医疗

促使智能机器和设备代替医生完成部分工作,更多地触达用户,只是智能医疗功用的部分体现。运用人工智能技术对医疗案例和经验数据进行深度学习和决策判断,显著提高医疗机构和人员的工作效率并大幅降低医疗成本,才是智能医疗的核心目标。同时,通过人工智能的引导和约束,促使患者自觉自查、加强预防,更早发现和更好管理潜在疾病,也是智能医疗在未来的重要发展方向。

核心技术:医疗水平的提升和医疗设备的完善使得患者就诊过程会产生与日俱增的就诊数据,爆炸式信息增长让医生无法无差错的完成诊断和治疗,同时随着人们健康意识的加强,预防性和精准性治疗同时受到关注。图像识别、语音

语义识别、深度学习技术在医疗领域得到广泛应用。图像识别、语音语义识别技术可充分获取患者的饮食习惯、锻炼周期、服药习惯等个人生活习惯信息以对症下药,深度学习技术可通过计算机模拟预测药物活性、安全性和副作用,降低

药物研发周期,并辅助医生工作实现更精准诊断和治疗。

主要产品:期待健康长寿的意愿随着人们生活质量的提高持续增强,适用于生活化的身体管理的智能健康管理产品率先成为热点,以数据形式引导个人生活习惯以达到基于精准医学的健康管理。同时,医生为能进行更精准并且效率更

高的诊断和治疗,往往会围绕着医疗领域过往沉淀的大量病理案例,不断从预防的角度规避疾病或提前预测药物的可行性,智能影像、智能诊疗等智能医疗产品快速兴起,逐渐取代经验诊断,通过大量的影像数据和诊断数据模拟医疗专家

的思维、诊断推理和治疗过程,从而给出更可靠的诊断和治疗方案。

典型企业: 智能健康管理多面向消费端客户,创新企业大量涌现,大部分集中在美国。如 Next IT、 Sense.ly 和 AiCure均是从日常健康管理切入移动医疗, Welltok 则通过可穿戴设进行健康干预。智能诊疗领域取得显著进展, IBM Watson以肿瘤为重心,在慢病管理、精准医疗、体外检测等九大医疗领域中实现突破,美国 MedWhat、英国 Babylon Health 和中国拍医拍、康夫子正在聚焦智能诊疗的单个应用进入该领域。智能影像领域以创新企业为主,围绕影像数据源竞争激烈。美国 Butterfly Network 和中国推想科技着重打造影像设备,美国 Enlitic 则重点关注癌症监测,中国 Deepcare 围绕SaaS 模式为行业提供“算法+有效数据”服务。 

6.3.4智能安防

随着高清视频、智能分析、云计算和大数据等相关技术的发展,传统的被动防御安防系统正在升级成为主动判断和预警的智能安防系统。安防行业也从单一的安全领域向多行业应用、提升生产效率、提高生活智能化程度方向发展,为更多的行业和人群提供可视化、智能化解决方案。随着智慧城市、智能建筑、智慧交通等智能化产业的带动,智能安防也将保持高速增长,预计在2020年全球产业规模实现106亿美元,我国会达到20亿美元。

核心技术:随着平安城市建设的不断推进,监控点位越来越多,从最初的几千路到几万路甚至于到现在几十万路的规模,依托视频和卡口产生的海量数据,智能安防已经延展到事后追查、事中防范响应、事前预防的全生命周期。目标

检测、目标跟踪和目标属性提取等视频结构化技术,以及海量数据管理、大规模分布式计算和数据挖掘等大数据技术已经取代传统的人海战术,实时分析视频内容,探测异常信息,进行风险预测。视频结构化技术可以通过识别目标并持续跟

踪生成图片结果,提取目标属性归纳可视化特征;大数据技术则用于采集、存储人工智能应用所涉及的全方位数据资源,并基于时间轴进行数据累积,开展特征匹配和模型仿真,辅助安防部门更快、更准地找到有效的资源,进行风险预测

和评估。

主要产品: 为避免社会不稳定事件频频发生的影响,各国对治安和安防的需求都在不断上升,这对更高效、更精准、覆盖面更广的安防服务提出新的需求,公安、交通、楼宇这些代表性的行业都已开始积极利用基于人工智能的硬件及

定制化系统。智能公安管理系统汇总海量城市级信息,可对嫌疑人的信息进行实时分析,将犯罪嫌疑人的轨迹锁定由原来的几天缩短到几分钟,同时其强大的交互能力还能与办案民警进行自然语言方式的沟通,真正成为办案人员的专家助

手。智能交通管理系统实时掌握城市道路上通行车辆的轨迹信息、停车场的车辆信息以及小区的停车信息,预测交通流量变化和停车位数量变化,合理调配资源、疏导交通,提升整个城市的运行效率。智能楼宇管理系统综合控制着建筑的

安防、能耗,对于进出大厦的人、车、物实现实时的跟踪定位,监控大楼的能源消耗,使得大厦的运行效率最优。

典型企业:从提供的产品类型来看,智能安防领域的企业主要分为人工智能芯片、硬件和系统、软件算法三大类别。在芯片领域,跨国巨头企业占较高市场份额,如美国英伟达和英特尔。在硬件和系统领域,各国均以采购本国产品为主,

国内主要采购对象为海康威视、大华集团,海康具有深厚的技术积累和成规模的研发团队,大华持续构建广泛的营销网络;美国则有ADT、 DSC、 OPTEX等高端品牌占据了安防市场大部分份额。在软件算法领域,美国谷歌、 Facebook、微软开源代码并提供整体解决方案,中国旷视科技、 商汤科技、云从科技等企业也在专注于技术创新研发。

6.3.5智能驾驶

智能驾驶通过车上搭载传感器,感知周围环境,通过算法的模型识别和计算,辅助汽车电子控制单元或直接辅助驾驶员做出决策,从而让汽车行驶更加智能化,提升汽车驾驶的安全性和舒适性。根据智能化水平的不同, 同时参考SAE的评级标准, 可将智能驾驶由低到高分为五个级别,依次是驾驶支援、 部分自动化、有条件自动化、高度自动化、完全自动化。 在未来各国智能驾驶相关政策法规逐渐成型、行业内技术不断完善、智能驾驶企业积极推动应用落地的情况下,智能驾驶产业规模将保持持续扩大趋势,预计在2020年全球产业规模实现95亿美元,我国会达到12亿美元。

核心技术: 随着汽车产业的成熟和普及,各城市交通拥堵愈发严重,汽车尾气带来的环境污染也逐渐影响了人们的生活环境和空气质量,应用计算机视觉、深度学习和知识图谱技术的智能化环保型驾驶方式为解决经济问题和社会问题创造良机。 计算机视觉技术对周围的交通环境,如本车在哪里、其它车在哪里、道路多宽、限速多少、现在是红灯还是绿灯等进行识别;深度学习技术和知识图谱构建理解、规划、决策以及经验,比如红灯要停车、路口要减速、何时及

如何换道、当前加速还是减速等,同时按照时间顺序更好地统筹安排车辆使用提高车辆的使用效率,减少车辆消费总量,有效减少碳排放;机器学习操控汽车,如方向盘是否转到位、油门刹车档位如何协调等。

主要产品: 智能驾驶核心依靠感知探测一定范围内障碍物,并依据已设置好的路线规划实施驾驶行为,各式车载雷达、传感器、辅助驾驶系统和高精地图可以实现驾驶、车和路的交互与融合。车载雷达可探测路肩、车辆、行人等的方

位、距离及移动速度,视觉传感器用来识别车道线、停止线、交通信号灯、交通标志牌、行人及车辆等信息,定位传感器用来实时获取经纬度坐标、速度、加速度、航向角等高精度定位,车身传感器通过整车网络接口获取诸如车速、轮速、档位等车辆本身的信息,高级辅助驾驶系统(ADAS)实时收集车内外的环境数据以及时察觉潜在危险,高精度地图实现地图匹配、辅助环境感知、路径规划的作用。

典型企业:智能驾驶分为三层金字塔供应链格局,顶层包括整车及整体解决方案,中层是指高级辅助驾驶系统,底层是指零部件供应商。在整车及整体解决方案层级,科技型公司凭借在人工智能、人机交互方面的优势抢占市场份额。特斯拉通过成熟硬件和机器学习打造智能驾驶商用化车型,谷歌则重点完善智能驾驶方案并向整车制造能力延伸。在高级辅助驾驶系统层级,供应商基本由跨国巨头垄断。德国博世在传感器、自动驾驶、控制、软件等领域共计拥有约 450项专利,美国德尔福则通过资本手段布局全产业链,以色列Mobileye 在摄像头视觉系统领域占据国际领先地位。在底层零部件供应商层级,中国厂商比重日益增强,围绕某些部件实现技术突破,打造细分市场龙头,如四维图新的车载芯片、

拓普集团的智能刹车系统 IBS、索菱股份的车载智能系统CID、宁波高发的 CAN 总线控制系统、兴民智通的智能用车系统驾宝盒子、盛路通信的夜间驾驶辅助系统、车道偏移提醒系统、盲区检测系统及万安科技的电子制动产品等。

6.3.6智能搜索

智能搜索是结合了人工智能技术的新一代搜索,除了能提供传统的快速检索、 相关度排序等功能,还能提供用户角色登记、用户兴趣自动识别、内容的语义理解、智能信息化过滤和推送等功能,具有信息服务的智能化、人性化特征,允许采用自然语言进行信息的检索,为用户提供更方便、更确切的搜索服务。

核心技术:在信息爆炸时代,用户需要通过最短时间锁定最有价值信息。为匹配用户的请求,实现网络资源快速检索,搜索的方式和算法都有变化。 应用到搜索方式的主要技术有语音识别、图像识别和文本识别, 改善搜索算法的技术则包括启发式搜索算法、智能代理技术及自然语言查询。 语音识别、图像识别和文本识别可全方位识别搜索信息输入属性,提升搜索的便捷性和准确度。启发式搜索算法、智能代理技术及自然语言查询可根据相关度及用户兴趣的评价函

数选择最匹配信息链接,自动地将用户感兴趣的、对用户有用的信息提交给用户,并引入用户反馈来完善检索机制,实现自然语言的信息检索,为用户提供更方便、更确切的搜索服务。

主要产品:随着信息技术的迅速发展和互联网的广泛普及,网络上信息量成几何级数的增长,传统的搜索引擎技术在日益庞大的信息量面前逐渐显得力不从心,多样化的搜索方式和更精准的搜索算法产品应运而生。淘淘搜和百度搜图、听歌识曲、高德地图和百度地图、墨迹天气等产品,分别满足用户在图像搜索、语音搜索、定位搜索、天气搜索等场景的信息匹配和推送。出门问问、呱呱财经等产品则聚焦于垂直类智能搜索领域,实现用户对某具体领域单点信息需求的充分筛选。

典型企业: 在提供智能搜索方式的企业中,阿里巴巴、百度从文本搜索延伸至图像搜索,英国 Shazam、中国酷狗、网易、猎曲奇兵不断提升语音搜索的准确率,百度、高德均推出基于定位搜索的高精地图,墨迹风云科技公司专注天气搜索成为移动端用户量第一。在提供智能搜索算法的企业中,传统搜索引擎巨头升级为主,创新企业多聚焦垂直领域。科技巨头如美国谷歌、 Wolfram Alpha、中国百度、雅虎、搜狐等专注技术驱动,创新企业如齐聚科技则侧重服务驱动。

6.3.7智能教育

智能教育侧重启发与引导,关注学生个性化的教育和交互,学生能够获得实时反馈和自动化辅导,家长可以通过更为便捷和成本更低的方式看到孩子实时学习情况,老师能收获更丰富的教学资源、学生个性化学习数据来实现因材施教,学校也能提供高质量的教育,政府则将更容易为所有人提供可负担、更均衡的教育。自动化辅导优先通过搜题的应用取得爆发式增长,预计 2020 年全球智能教育产业规模可达 108 亿美元,我国将接近 10 亿美元。

核心技术: 智能教育建立在与学生充分的交互和数据获取的基础上,并在海量的教育数据中,匹配用户的学习需求,最终能够完成辅助教育和评估反馈,语音语义识别、图像识别、知识图谱和深度学习技术应用较多。语音语义识别、图像识别实现了规模化的自动批改和个性化反馈;知识图谱和深度学习技术搜集学生学习数据并完成自动化辅导和答疑,预测学生未来表现,智能化推荐最适合学生的内容,最终高效、显著地提升学习效果。

主要产品: 对教师人力资源的过度依赖是教育行业问题根本所在,能够辅助教育过程、提升教师效率,同时激发学生自主学习兴趣的产品,率先得到市场的认可,目前相对成熟的产品有自动化辅导、智能测评和个性化学习。自动化辅

导可在两秒内反馈出答案和解题思路,手写的题目的识别正确率也已达到 70%以上,大幅提升学生的学习效率。智能测评不仅可以对用户跟读进行语音测评和指导,同时还能通过手写文字识别、机器翻译、作文自动评阅技术实现规模化阅

卷的作业测评。个性化学习基于学习行为的数据分析,推荐适合学生水平的学习内容。

典型企业:从事自动化辅导和个性化学习的企业均聚焦单一产品功能和教育区间,目前主要通过融资方式持续补贴用户提升获客能力。美国的 Volley 和中国的猿题库、作业帮、学霸君和阿凡题聚焦 K12 教育的题库辅导和答疑,均推出拍照搜题完成题库答疑或老师答疑,中国郎播网、英语流利说和多邻国等侧重语言辅导,美国 Newsela、 LightSail 等建立阅读数据库个性化提供阅读材料。智能测评企业主要集中在英语科目,如中国科大讯飞以智能语音技术为核心推出智能阅卷系统,批改网和美国 LightSide 通过数据库匹配完成文本测评。

6.3.8智能人居

智能人居以家庭住宅为平台,基于物联网技术和云计算平台构建由智能家居生态圈,涵盖智能冰箱、智能电视、智能空调等智能家电,智能音箱、智能手表等智能硬件,智能窗帘、 智能衣柜、 智能卫浴等智能家居, 智能人居环境管理等诸多方面,可实现远程控制设备、设备间互联互通、设备自我学习等功能,并通过收集、分析用户行为数据,为用户提供个性化生活服务,使家居生活安全、舒适、节能、高效、便捷。

核心技术:随着移动互联网技术的大规模普及应用,为人们精细化掌控人居环境质量与模式提供了基础支撑,人工智能技术的持续发展,又进一步促使人居环境中的管理、辅助、通信、服务、信息获取等功能再次实现智能化的组合优

化,以达到借助科技手段管理生活方式的目的。在此背景下,传感器技术、无线及近场通讯设备、物联网技术、深度学习、大数据及云计算技术得到较多应用。传感器和通讯设备对人居环境进行监测形成的数据流,会通过云计算和深度学习建立相应模型,再依托家用物联网对室内的电器设备乃至整个建筑的实时控制,将模型对应的参数和状态优化方案反馈到人居环境中,为人居生活的计划、管理、服务、支付等方面提供支持。

主要产品: 随着技术的进步、人均收入的提升和对舒适生活环境的追求,人们需要的不仅是具备传统的居住功能的住宅,同时也需要兼备智能监测、环境控制、信息交互等全方位感知功能的智能居住环境。智能家居作为终端首先备受

市场关注,具有通信功能的家用智能硬件及设备在大数据和云计算技术的支持下,能够完成远程控制、网络通信、防盗报警等较为复杂的任务。智能人居管理系统是以搭载大量移动互联网应用为基础,实现人居环境智能化改造,如生成家庭装潢设计与家具摆放设计,通过天气数据、已有服装数据、所处场合的风格自动生成穿衣指南,或者通过人工助手借助语音识别、语义分析等技术,满足人类在生活中的一些日常即时需求。

典型企业: 具备智能人居解决方案提供能力的龙头企业众多,可大致分为传统家电厂商、智能硬件厂商、互联网电商及创新企业,各家布局方式互不相同。海尔、美的聚焦智能家居终端,小米侧重于面向众多开发者提供硬件开放式接

口,华为致力于提供软硬件一体化楼宇级解决方案,京东通过轻资产、互联网化的运营模式号召合作伙伴加入其线上平台和供应链,国安瑞通过数据挖掘提供覆盖操作终端硬件、系统智能云平台、建筑智能设备的闭环解决方案提升室内人

居感受。

结束语:目前深度学习、图像视频识别、语音识别和文本识别在智能领域应用范围非常广泛,市场潜力巨大,率先成为资本竞相追逐的对象。深度学习算法成为推动人工智能发展的焦点,相继在图片识别、机器翻译、语音识别、决策助手、生物特征识别等领域实现了创新突破。掌握上述技术的领先优势的企业,必然在未来人工智能领域占领一席之地。

推荐阅读更多精彩内容