冲量网络 | 可信计算与机器学习

随着互联网技术的普及,人工智能技术也得到了飞跃式发展,而其中最为重要的组成部分之一便是机器学习技术,当人们发现数据的统计和分析在目前的技术下已经不再是难事的时候,便把眼光放到了数据的挖掘和预测上,从信息化软件到现在的云计算和大数据,无论何时,都需要一个能帮助我们进行预测和深度挖掘数据的技术,机器学习便由此进入到人们的视野中。


简单来说,机器学习就是对计算机一部分数据进行学习,然后对另外一些数据进行预测与判断。机器学习的核心是使用算法解析数据并从中学习,然后对新数据做出决定或预测。也就是说计算机利用以获取的数据得出某一模型,然后利用此模型进行预测的一种方法,这个过程跟人的学习过程有些类似,比如人获取一定的经验,可以对新问题进行预测。其是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。


举例来说,逢年过节,各个软件开发商往往会发布各种AR扫描活动,例如扫描出某个字或者某个图片获得抽奖机会等,但由于数据量非常大,某个字的写法也千千万万种,不可能每次扫描都靠人工来识别,也无法完全依靠数据库的比对,因为拍摄者往往会因为光线、像素等原因导致简单的数据库比对的成功率大大降低,此时便需要机器学习技术,通过对某个字或者某张图的数据,通过算法模型机型训练,系统不断更新学习,机器自动识别这张照片上是否有规定的字段或者图片。



在机器学习中可以使用许多不同的模型,但它们通常被分为四种不同的学习类型:监督、无监督、半监督学习和强化学习。四者没有对错之分,在各自对应的应用场景往往会获得更好的体现。


监督学习

监督学习是机器学习最普遍的方法,在训练时,训练样本数据有对应的目标值。通过对数据样本因子和已知的结果建立联系,提取特征值和映射关系,通过已知的结果和数据样本不断的学习和训练,对新的数据进行结果的预测。其特点是在训练模型时明确标记每个数据点的正确结果,以便找出它们之间的关系,确保在引入未分配的数据点时,可以正确的做出预测或分类。


非监督学习

无监督学习跟监督学习的区别就是选取的样本数据无需有目标值,我们无需分析这些数据对某些结果的影响,只是分析这些数据内在的规律。该类学习的特征是算法在训练模型时期不对结果进行标记,而直接在数据点之间找有意义的关系,它的价值在于发现模式以及相关性。其被常常用来对用户画像进行绘制,可以排除许多的干扰因素并提高准确度。


半监督学习

半监督学习是监督学习和无监督学习相互结合的一种机器学习方法,使用频率相对于其他三种比较低,有时也不会被单独分类,其往往是某种学习模型的补充,例如在无输出的输入的帮助下训练有输出的输入,用以得到比非监督学习更全面的训练结果,因为实际情况往往不会那样极端,可能会有些零散在外的数据。


强化学习

强化学习比较复杂,其强调系统与外界不断的交互反馈,例如汽车自动驾驶、强人工智能等领域,常用于解决更复杂的问题。强化学习的其他应用在物流、日程安排和任务的战略规划中也很常见。我们平时说的深度学习也是强化学习的一种。


在大数据时代,人们从技术中获取便利的同时,也面临着隐私泄露的风险。因此对机器学习来说,隐私保护也尤为重要。但显而易见的是,数据保护和机器学习似乎有着天然的矛盾,因此,可信计算技术将成为重要的技术来保证整个系统的可信,利用可信执行环境,将在处理器或虚拟系统上开辟一个安全区域,保证在其中加载的数据和代码的机密性和完整性。


这块安全区域将保证机器学习在获取数据时也处于可信状态,只能按照算法输出结果,而结果获得者只能获得输出结果,无法得到具体的数据,例如在云端系统下,数据和可信程序只在云端加密存储,只有在加载到可信执行环境后才会解密,在进行机器学习处理,计算结果再加密存储到云端。整个过程中,开发商无法碰到任何个人数据。


人工智能的运用已经深入到各行各业中,机器学习则是训练计算机完成上述任务的技术和过程,是人工智能实现必不可少的一部分。相信在未来,机器学习能得到更多的关注,并且得到更广泛的应用和发展。


对冲量网络而言,其将结合可信计算技术与机器学习,使得可信协作变为可能,大幅度降低协作成本,在满足数据隐私、安全、公平、可追溯与合规的前提下,支持多机构的数据融合与建模,为风控和营销业务提供了更多的数据维度与标签。