• 项目
首页>>文章列表 >>行业研究
行业研究

金准产业研究 人工智能情感计算研究报告 2019-10-09 17:37:58

前言

40多年前,诺贝尔奖得主Herbert Simon在认知心理学方面强调,解决问题论要结合情感的影响。情感的识别和表达对于信息的交流和理解是必需的,也是人类最大的心理需求之一。人类的认知、行为等几乎都要受到情感的驱动,并影响着人际互动以及群体活动。在人与人的交往中,情感的交流还常被用来完成人的意图的传递。因此,在智能人机交互的研究中,拥有对情感的识别、分析、理解、表达的能力也应成为智能机器必不可少的一种功能。

一、什么是情感计算

让计算机具有情感能力的观点并不新鲜,它与“机器人”一词几乎同时出现。1985年,人工智能的奠基人之一Minsky就明确指出:“问题不在于智能机器能否有情感,而在于没有情感的机器能否实现智能”。但当时,赋予计算机或机器人以人类式的情感,主要还是科幻小说中的素材,在学术界罕有人关注。1995年情感计算的概念由Picard首次提出,并于1997年正式出版《Affective Computing(情感计算)》。在书中,她指出“情感计算就是针对人类的外在表现,能够进行测量和分析并能对情感施加影响的计算”,开辟了计算机科学的新领域,其思想是使计算机拥有情感,能够像人一样识别和表达情感,从而使人机交互更自然。简单来说,情感计算研究就是试图创建一种能感知、识别和理解人的情感,并能针对人的情感做出智能、灵敏、友好反应的计算系统。显然,情感计算是个复杂的过程,不仅受时间、地点、环境、人物对象和经历的影响,而且要考虑表情、语言、动作或身体的接触。在人机交互中,计算机需要捕捉关键信息,觉察人的情感变化,形成预期,进行调整,做出反应。例如通过对不同类型的用户建模(如操作方式、表情特点、态度喜好、认知风格、知识背景等),以识别用户的情感状态,利用有效的线索选择合适的用户模型,并以适合当前用户的方式呈现信息。在对当前的操作做出及时反馈的同时,还要对情感变化背后的意图形成新的预期,并激活相应的数据库,及时主动地提供用户需要的新信息。举例来说,麻省理工学院媒体实验室的情感计算小组研制的情感计算系统通过记录人面部表情的摄像机和连接在人身体上的生物传感器来收集数据,然后由一个“情感助理”来调节程序以识别人的情感。假设你对电视讲座的一段内容表现出困惑,情感助理会重放该片段或者给予解释。而目前国内情感计算的研究重点在于通过各种传感器获取有人的情感所引起的生理及行为特征信号,确定情感类别的关键特征,建立“情感模型”,从而创建个人情感计算系统。情感计算是一个高度综合化的研究和技术领域。通过计算科学与心理科学、认知科学的结合,研究人与人交互、人与计算机交互过程中的情感特点,设计具有情感反馈的人与计算机的交互环境,将有可能实现人与计算机的情感交互。情感计算研究将不断加深对人的情感状态和机制的理解,并提高人与计算机界面的和谐性,即提高计算机感知情境,理解人的情感意图,做出适当反应的能力,其主要研究内容如下图所示:

 

情感计算的研究内容

情感计算是一个多学科交叉的崭新的研究领域,它涵盖了传感器技术、计算机科学、认知科学、心理学、行为学、生理学、哲学、社会学等方面。情感计算的最终目标是赋予计算机类似于人的情感能力。要达到这个目标,许多技术问题有待解决。这些技术问题的突破对各学科的发展都产生巨大的推动作用。以下分别从情感计算的传统研究方法和新兴研究方法对技术发展进行探讨。

1.1传统的研究

传统的情感计算方法是按照不同的情感表现形式分类的,分别是:文本情感分析、语音情感分析、视觉情感分析。

1.1.1文本情感计算

20世纪90年代末,国外的文本情感分析已经开始。早期,Riloff和Shepherd在文本数据的基础上进行了构建语义词典的相关研究。McKeown发现连词对大规模的文本数据集中形容词的语义表达的制约作用,进而对英文的形容词与连词做情感倾向研究。自此之后,越来越多的研究开始考虑特征词与情感词的关联关系。Turney等使用点互信息的方法扩展了正负面情感词典,在分析文本情感时使用了极性语义算法,处理通用的语料数据时准确率达到了74%。在近些年的研究中,Narayanan等结合各种特征及其相关联信息,提出了基于分句、整句、结果句的分类方案,获得了很好的效果。Pang等以积极情感和消极情感为维度,对电影评论进行了情感分类。他分别采用了支持向量机、最大熵、朴素贝叶斯算法进行分类实验,发现支持向量机的精确度达到了80%。随着研究的不断深入,学者在对情感分析算法进行改进的同时,也将其应用到不同的行业中进行了实践。

文本情感计算的过程可以由3部分组成:文本信息采集、情感特征提取和情感信息分类。文本信息采集模块通过文本抓取工具(如网页爬虫工具)获得情感评论文本,并传递到下一个情感特征提取模块,然后对文本中自然语言文本转化成计算机能够识别和处理的形式,并通过情感信息分类模块得到计算结果。文本情感计算侧重研究情感状态与文本信息之间的对应关系,提供人类情感状态的线索。具体地,需要找到计算机能提取出来的特征,并采用能用于情感分类的模型。因此,关于文本情感计算过程的讨论,主要集中在文本情感特征标注(信息采集)、情感特征提取和情感信息分类这三个方面。

1、文本情感特征标注:情感特征标注是对情感语义特征进行标注,通常是将词或者语义块作为特征项。情感特征标注首先对情感语义特征的属性进行设计,如褒义词、贬义词、加强语气、一般语气、悲伤、高兴等等;然后通过机器自动标注或者人工标注的方法对情感语义特征进行标注,形成情感特征集合。情感词典是典型的情感特征集合,也是情感计算的基础。在大多数研究中,有关情感计算的研究通常是将情感词典直接引入自定义词典中。运用情感词典计算出文本情感值是一种简单迅速的方法,但准确率有待提高。在实际的情感计算中,会因为具体的语言应用环境而有所不同。例如,“轻薄”一词通常认为是否定词,但是在电脑、手机却被视为肯定词汇。同时,文本中常会出现否定前置、双重否定以及文本口语化和表情使用等,这些都将会对文本情感特征的提取和判断产生较大的影响。因此在进行文本情感提取时,需要对文本及其对应的上下文关系、环境关系等进行分析。

2、情感特征提取:文本包含的情感信息是错综复杂的,在赋予计算机以识别文本情感能力的研究中,从文本信号中抽取特征模式至关重要。在对文本预处理后,初始提取情感语义特征项。特征提取的基本思想是根据得到的文本数据,决定哪些特征能够给出最好的情感辨识。通常算法是对已有的情绪特征词打分,接着以得分高低为序,超过一定阈值的特征组成特征子集。特征词集的质量直接影响最后结果,为了提高计算的准确性,文本的特征提取算法研究将继续受到关注。长远看来,自动生成文本特征技术将进一步提高,特征提取的研究重点也更多地从对词频的特征分析转移到文本结构和情感词上。

3、情感信息分类:文本情感分类技术中,主要采用两种技术路线:基于规则的方法和基于统计的方法。在20世纪80年代,基于规则的方法占据主流位置,通过语言学家的语言经验和知识获取句法规则,以此作为文本分类依据。但是,获取规则的过程复杂且成本巨大,也对系统的性能有负面影响,且很难找到有效的途径来提高开发规则的效率。20世纪90年代之后,人们更倾向于使用统计的方法,通过训练样本进行特征选择和参数训练,根据选择的特征对待分类的输入样本进行形式化,然后输入到分类器进行类别判定,最终得到输入样本的类别。

1.1.2语音情感计算

最早的真正意义上的语音情感识别相关研究出现在20世纪80年代中期,它们开创了使用声学统计特征进行情感分类的先河。紧接着,随着1985年Minsky教授“让计算机具有情感能力”观点的提出,以及人工智能领域的研究者们对情感智能重要性认识的日益加深,越来越多的科研机构开始了语音情感识别研究的探索。在20世纪80年代末至90年代初期,麻省理工学院多媒体实验室构造了一个“情感编辑器”对外界各种情感信号进行采集,综合使用人体的生理信号、面部表情信号、语音信号来初步识别各种情感,并让机器对各种情感做出适当的简单反应;1999年,Moriyama提出语音和情感之间的线性关联模型,并据此在电子商务系统中建造出能够识别用户情感的图像采集系统语音界面,实现了语音情感在电子商务中的初步应用。

整体而言,语音情感识别研究在该时期仍旧处于初级阶段,主要侧重于情感的声学特征分析这一方面,作为研究对象的情感语音样本也多表现为规模小、自然度低、语义简单等特点,虽然有相当数量的有价值的研究成果相继发表,但是并没有形成一套被广泛认可的、系统的理论和研究方法。进入21世纪以来,随着计算机多媒体信息处理技术等研究领域的出现以及人工智能领域的快速发展,语音情感识别研究被赋予了更多的迫切要求,发展步伐逐步加快。2000年,在爱尔兰召开的ISCA Work shop on Speech and Emotion国际会议首次把致力于情感和语音研究的学者聚集在一起。近10余年来,语音情感识别研究工作在情感描述模型的引入、情感语音库的构建、情感特征分析等领域的各个方面都得到了发展。下面将从语音情感数据库的采集、语音情感标注以及情感声学特征分析方面介绍语音情感计算。

语音情感数据库的采集:语音情感识别研究的开展离不开情感语音数据库的支撑。情感语音库的质量高低,直接决定了由它训练得到的情感识别系统的性能好坏。评价一个语音情感数据库好坏的一个重要标准是数据库中语音情感是否具备真实的表露性和自发性。目前,依据语音情感激发类型的不同,语音情感数据库可分为表演型、诱发型和自发型三种。

具体来说,表演型情感数据库通过专业演员的表演,把不同情感表达出来。在语音情感识别研究初期,这一采集标准被认为是研究语音情感识别比较可靠的数据来源,因为专业演员在表达情感时,可以通过专业表达获得人所共知的情感特征。比如,愤怒情感的语音一般会具有很大的幅值和强度,而悲伤情感的语音则反之。由于这一类型的数据库具有表演的性质,情感的表达会比真实情感夸大一点,因此情感不具有自发的特点。依据该类型数据库来学习的语音情感识别算法,不一定能有效应用于真实生活场景中。第二种称之为诱发型情感数据库。被试者处于某一特定的环境,如实验室中,通过观看电影或进行计算机游戏等方式,诱发被试者的某种情感。目前大部分的情感数据库都是基于诱发的方式建立的。诱发型情感数据库产生的情感方式相较于表演型情感数据库,其情感特征更具有真实性。最后一种类型属于完全自发的语音情感数据库,其语料采集于电话会议、电影或者电话的视频片段,或者广播中的新闻片段等等。由于这种类型的语音情感数据最具有完全的真实性和自发性,应该说最适合用于实用的语音情感识别。但是,由于这些语音数据涉及道德和版权因素,妨碍了它在实际语音情感识别中的应用。

2、语音情感数据库的标注:对于采集好的语音情感库,为了进行语音情感识别算法研究,还需要对情感语料进行标注。标注方法有两种类型:

离散型情感标注法指的是标注为如生气、高兴、悲伤、害怕、惊奇、讨厌和中性等,这种标注的依据是心理学的基本情感理论。基本情感论认为,人复杂的情感是由若干种有限的基本情感构成的,就像我们自古就有“喜、怒、哀、乐,恐、悲、惊”七情的说法。不同的心理学家对基本情感有不同的定义,由此可见,在心理学领域对基本情感类别的定义还没有一个统一的结论,因此不同的语音情感数据库包含的情感类别也不尽相同。金准产业研究团队认为,这不利于在不同的语音情感数据库上,对同一语音情感识别算法的性能进行评价。此外,众所周知,实际生活中情感的类别远远不止有限几类。基于离散型情感标注法的语音情感识别容易满足多数场合的需要,但无法处理人类情感表达具有连续性和动态变化性的情况。在实际生活中,普遍存在着情感变化的语音,比如前半句包含了某一种情感,而后半句却包含了另外一种情感,甚至可能相反。例如,某人说话时刚开始很高兴,突然受到外界刺激,一下子就生气了。对于这种在情感表达上具有连续和动态变化的语音,采用离散型情感标注法来进行语音情感识别就不合适了。因为此时语音的情感,己不再完全属于某一种具体的情感。

维度情感空间论基于离散型情感标注法的缺陷,心理学家们又提出了维度情感空间论,即对情感的变化用连续的数值进行表示。不同研究者所定义的情感维度空间数目有所不同,如二维、三维甚至四维模型。针对语音情感,最广为接受和得到较多应用的为二维连续情感空间模型,即“激活维-效价维”(Arousal-Valence)的维度模型。“激活维”反映的是说话者生理上的激励程度或者采取某种行动所作的准备,是主动的还是被动的;“效价维”反映的是说话者对某一事物正面的或负面的评价。随着多模态情感识别算法的研究,为了更细致的地描述情感的变化,研究者在“激活维-效价维”(Arousal-Valence)二维连续情感空间模型的基础上,引入“控制维”,即在“激活维-效价维-控制维(Arousal-Valence/Pleasure-Power/Dominance)”三维连续情感空间模型上对语音情感进行标注和情感计算。需要强调的是,离散型和连续型情感标注之间,它们并不是孤立的,而是可以通过一定映射进行相互转换。

情感声学特征分析:情感声学特征分析主要包括声学特征提取和声学特征选择、声学特征降维。采用何种有效的语音情感特征参数用于情感识别,是语音情感识别研究最关键的问题之一,因为所用的情感特征参数的优劣直接决定情感最终识别结果的好坏。

声学特征提取。目前经常提取的语音情感声学特征参数主要有三种:韵律特征、音质特征以及谱特征。在早期的语音情感识别研究文献中,针对情感识别所首选的声学特征参数是韵律特征,如基音频率、振幅、发音持续时间、语速等。这些韵律特征能够体现说话人的部分情感信息,较大程度上能区分不同的情感。因此,韵律特征已成为当前语音情感识别中使用最广泛并且必不可少的一种声学特征参数除了韵律特征,另外一种常用的声学特征参数是与发音方式相关的音质特征参数。三维情感空间模型中的“激发维”上比较接近的情感类型,如生气和高兴,仅使用韵律特征来识别是不够的。

音质特征包括共振峰、频谱能量分布、谐波噪声比等,不仅能够很好地表达三维中的“效价维”信息,而且也能够部分反映三维中的“控制维”信息。因此,为了更好地识别情感,同时提取韵律特征和音质特征两方面的参数用于情感识别,已成为语音情感识别领域声学特征提取的一个主要方向。谱特征参数是一种能够反映语音信号的短时功率谱特性的声学特征参数,Mel频率倒谱系数(Mel-scale Frequency Cepstral Coefficients,MFCC)是最具代表性的谱特征参数,被广泛应用于语音情感识别。由于谱特征参数及其导数,仅反映语音信号的短时特性,忽略了对情感识别有用的语音信号的全局动态信息。近年来,为了克服谱特征参数的这种不足之处,研究者提出了一些改进的谱特征参数,如类层次的谱特征、调制的谱特征和基于共振峰位置的加权谱特征等。

声学特征选择。为了尽量保留对情感识别有意义的信息,研究者通常都提取了较多的与情感表达相关的不同类型的特征参数,如韵律特征、音质特征、谱特征等。任意类型特征都有各自的侧重点和适用范围,不同的特征之间也具有一定的互补性、相关性。此外,这些大量提取的特征参数直接构成了一个高维空间的特征向量。这种高维性质的特征空间,不仅包含冗余的特征信息,导致用于情感识别的分类器训练和测试需要付出高昂的计算代价,而且情感识别的性能也不尽如人意。因此,非常有必要对声学特征参数进行特征选择或特征降维处理,以便获取最佳的特征子集,降低分类系统的复杂性和提高情感识别的性能。

特征选择是指从一组给定的特征集中,按照某一准则选择出一组具有良好区分特性的特征子集。特征选择方法主要有两种类型:封装式(Wrapper)和过滤式(Filter)。Wrapper算法是将后续采用的分类算法的结果作为特征子集评价准则的一部分,根据算法生成规则的分类精度选择特征子集。Filter算法是将特征选择作为一个预处理过程,直接利用数据的内在特性对选取的特征子集进行评价,独立于分类算法。

声学特征降维。特征降维是指通过映射或变换方式将高维特征空间映射到低维特征空间,已达到降维的目的。特征降维算法分为线性和非线性两种。最具代表性的两种线性降维算法,如主成分分析PCA(Principal Component Analysis)和线性判别分析LDA(Linear Discriminant Analysis),已经被广泛用于对语音情感特征参数的线性降维处理。也就是,PCA和LDA方法被用来对提取的高维情感声学特征数据进行嵌入到一个低维特征子空间,然后在这降维后的低维子空间实现情感识别,提高情感识别性能。

近年来,新发展起来的基于人类认知机理的流形学习方法比传统的线性PCA和LDA方法更能体现事物的本质,更适合于处理呈非线性流形结构的语音情感特征数据。但这些原始的流形学习方法直接应用于语音情感识别中的特征降维,所取得的性能并不令人满意。主要原因是他们都属于非监督式学习方法,没有考虑对分类有帮助的已经样本数据的类别信息。尽管流形学习方法能够较好地处理非线性流形结构的语音特征数据,但是流形学习方法的性能容易受到其参数如邻域数的影响,而如何确定其最佳的邻域数,至今还缺乏理论指导,一般都是根据样本数据的多次试验结果来粗略地确定。因此,对于流形学习方法的使用,如何确定其最佳参数,还有待深入研究。

1.1.3视觉情感计算

表情作为人类情感表达的主要方式,其中蕴含了大量有关内心情感变化的信息,通过面部表情可以推断内心微妙的情感状态。但是让计算机读懂人类面部表情并非简单的事情。人脸表情识别是人类视觉最杰出的能力之一。而计算机进行自动人脸表情识别所利用的主要也是视觉数据。无论在识别准确性、速度、可靠性还是稳健性方面,人类自身的人脸表情识别能力都远远高于基于计算机的自动人脸表情识别。因此,自动人脸表情识别研究的进展一方面依赖计算机视觉、模式识别、人工智能等学科的发展,另一方面还依赖对人类本身识别系统的认识程度,特别是对人的视觉系统的认识程度。

早在20世纪70年代,关于人脸表情识别的研究就已经展开,但是早期主要集中在心理学和生物学方面。随着计算机技术的发展,人脸表情识别技术逐渐发展起来,至上世纪90年代,该领域的研究已经非常活跃。大量文献显示表情识别与情感分析已从原来的二维图像走向了三维数据研究,从静态图像识别研究专项实时视频跟踪。下面将从视觉情感信号获取、情感信号识别以及情感理解与表达方面介绍视觉情感计算。

视觉情感信号获取:表情参数的获取,多以二维静态或序列图像为对象,对微笑的表情变化难以判断,导致情感表达的表现力难以提高,同时无法体现人的个性化特征,这也是表情识别中的一大难点。以目前的技术,在不同的光照条件和不同头部姿态下,也不能取得满意的参数提取效果。由于三维图像比二维图像包含更多的信息量,可以提供鲁棒性更强,与光照条件和人的头部姿态无关的信息,用于人脸表情识别的特征提取工作更容易进行。因此,目前最新的研究大多利用多元图像数据来进行细微表情参数的捕获。该方法综合利用三维深度图像和二维彩色图像,通过对特征区深度特征和纹理彩色特征的分析和融合,提取细微表情特征,并建立人脸的三维模型,以及细微表情变化的描述机制。

视觉情感信号识别:视觉情感信号的识别和分析主要分为面部表情的识别和手势识别两类:

对于面部表情的识别,要求计算机具有类似于第三方观察者一样的情感识别能力。由于面部表情是最容易控制的一种,所以识别出来的并不一定是真正的情感,但是,也正由于它是可视的,所以它非常重要,并能通过观察它来了解一个人试图表达的东西。到目前为止,面部表情识别模型都是将情感视为离散的,即将面部表情分成为数不多的类别,例如“高兴”、“悲伤”、“愤怒”等。1971年,Ekman和Friesen研究了6种基本表情(高兴、悲伤、惊讶、恐惧、愤怒和厌恶),并系统地建立了上千幅不同的人脸表情图像库。六种基本表情的具体面部表现如下表所示。1978年,他们研究了情感类别之间的内在关系,开发了面部动作编码系统(FACS)。系统描述了基本情感以及对应的产生这种情感的肌肉移动的动作单元。他们根据人脸的解剖学特点,将其划分成大约46个既相互独立又相互联系的运动单元(AU),并分析了这些运动单元的运动特征及其所控制的主要区域以及与之相关的表情,给出了大量的照片说明。面部识别器一般要花五分钟来处理一种面部表情,准确率达到98%。

马里兰大学的Yeser Yacoob和Larry Davis提出了另一种面部表情识别模型,它也是基于动作能量模版,但是将模版、子模版(例如嘴部区域)和一些规则结合起来表达情感。例如,愤怒的表情在从眼睛区域提取的子模版中,特别是眉毛内敛、下垂,在嘴巴区域子模版中,特别是嘴巴紧闭,两个子模板结合起来,就很好表达了愤怒这一情感。后续的研究总体上结合生物识别方法及计算机视觉进行,依据人脸特定的生物特征,将各种表情同脸部运动细节(几何网格的变化)联系起来,收集样本,提取特征,构建分类器。但是目前公开的用于表情识别研究的人脸图像数据库多是采集志愿者刻意表现出的各种表情的图像,与真实情形有出入。

 

脸部表情运动特征具体表现

对于手势识别来说,一个完整的手势识别系统包括三个部分和三个过程。三个部分分别是:采集部分、分类部分和识别部分;三个过程分别是:分割过程、跟踪过程和识别过程。采集部分包括了摄像头、采集卡和内存部分。在多目的手势识别中,摄像头以一定的关系分布在用户前方。在单目的情况下,摄像头所在的平面应该和用户的手部运动所在的平面基本水平。分类部分包括了要处理的分类器和结果反馈回来的接收比较器。用来对之前的识别结果进行校正。识别部分包括了语法对应单位和相应的跟踪机制,通过分类得到的手部形状通过这里一一对应确定的语义和控制命令。分割过程包括了对得到的实时视频图像进行逐帧的手部分割,首先得到需要关注的区域,其次在对得到的区域进行细致分割,直到得到所需要的手指和手掌的形状。跟踪过程包括对手部的不断定位和跟踪,并估计下一帧手的位置。识别过程通过对之前的知识确定手势的意义,并做出相应的反应,例如显示出对应的手势或者做出相应的动作,并对不能识别的手势进行处理,或者报警或者记录下特征后在交互情况下得到用户的指导。手势识别的基本框架如下图所示:

 

手势识别的基本框架

1.2新兴的研究

1.2.1网络海量数据的情感计算

随着时代的发展,网络赋予情感计算新的、更大的数据平台,打开了情感计算的新局面。网络系统由于沟通了人类的现实世界和虚拟世界,可以持续不断地对数量庞大的样本进行情感跟踪,每天这些映射到网络上的情绪不计其数,利用好这些数据反过来就可以验证心理学结论,甚至反哺心理学。由于大数据的分布范围极其广泛,样本数量非常庞大,采用单一的大数据处理方法往往得不到有效的情感要素,统计效果较差。但是,如果将大数据和心理学结合起来,局面就会大不一样:心理学中,不同情感可以采用维度标定,如冷暖或软硬,同时各种心理效应影响人类对事物的情感判断,如连觉效应、视觉显著性、视觉平衡等,在大数据中引入心理学效应和维度,对有效数据进行心理学情感标准划分,使得数据具有情感维度,这样就会让计算机模拟人类情感的准确性大大提升。网络海量数据的情感主要有以下几个社会属性:

情感随群体的变化:在社交网络,如论坛、网络社区等群体聚集的平台上流露出群体的情感,通过这些情感展现可以达到影响其他个人的行为。

情感随图片的变化:在社交媒体出现大量的图片,这些图片的颜色、光度、图片内容等各不相同。图片的特征直接影响到了观看者的情感。

情感随朋友的变化:在社交平台上,朋友发表的微博、微信状态等容易展现个人的情感。朋友间的关系比陌生人间的关系更加深入,所以朋友的情感更容易引起情感变化,在海量数据中,个人情感容易优先受朋友情感的影响。

情感随社会角色的变化:在社交网络中,个人在不同的群体所处的角色也不一样,个人情感流露时也会跟着所处的角色不一样而展现不同的情感。

情感随时间的演变:人的情绪是变化无常的,所处的环境不一样,则表现出来的情感也将不一样。即使是同一件事,不同的情景下展现的情感也会不一样。另外,事件的发展是个动态的过程,随着事件的演变,人的情感也会跟着变化。

1.2.2多模态计算

虽然人脸、姿态和语音等均能独立地表示一定的情感,但人的相互交流却总是通过信息的综合表现来进行。所以,只有实现多通道的人机界面,才是人与计算机最为自然的交互方式,它集自然语言、语音、手语、人脸、唇读、头势、体势等多种交流通道为一体,并对这些通道信息进行编码、压缩、集成和融合,集中处理图像、音频、视频、文本等多媒体信息。多模态计算是目前情感计算发展的主流方向。每个模块所传达的人类情感的信息量大小和维度不同。在人机交互中,不同的维度还存在缺失和不完善的问题。因此,人机交互中情感分析应尽可能从多个维度入手,将单一不完善的情感通道补上,最后通过多结果拟合来判断情感倾向。

在多模态情感计算研究中,一个很重要的分支就是情感机器人和情感虚拟人的研究。美国麻省理工学院、日本东京科技大学、美国卡内基·梅隆大学均在此领域做出了较好的演示系统。目前中科院自动化所模式识别国家重点实验室已将情感处理融入到了他们已有的语音和人脸的多模态交互平台中,使其结合情感语音合成、人脸建模、视位模型等一系列前沿技术,构筑了栩栩如生的情感虚拟头像,并积极转向嵌入式平台和游戏平台等实际应用。

目前,情感识别和理解的方法上运用了模式识别、人工智能、语音和图像技术的大量研究成果。例如:在情感语音声学分析的基础上,运用线性统计方法和神经网络模型,实现了基于语音的情感识别原型;通过对面部运动区域进行编码,采用HMM等不同模型,建立了面部情感特征的识别方法;通过对人姿态和运动的分析,探索肢体运动的情感类别等等。不过,受到情感信息捕获技术的影响,以及缺乏大规模的情感数据资源,有关多特征融合的情感理解模型研究还有待深入。金准产业研究团队预测,随着未来的技术进展,还将提出更有效的机器学习机制。

二、人才

2.1全球学者概况

学者分布地图对于进行学者调查、分析各地区竞争力现况尤为重要,下图为情感计算领域全球顶尖学者分布状况。其中,颜色越趋近于红色,表示学者越集中;颜色越趋近于绿色,表示学者越稀少。从地区角度来看,北美洲、欧洲是情感计算领域学者分布最为集中的地区,亚洲东部地区次之,南美洲和非洲学者极为匮乏。从国家角度来看,情感计算领域的人才在美国最多,中国次之,意大利、法国等洲国家也有较多的学者数量,整体上讲其它国家与美国的差距较大。

 

情感计算专家国家数量分布

情感计算领域学者的h-index分布如下图所示,分布情况整体呈阶梯状,大部分学者的hindex分布在中低区域,其中h-index在<10的区间人数最多,有524人,占比43.4%,50-60区间人数最少,有46人,占比3.8%。

 

情感计算领域学者h-index分布

各国情感计算TOP学者的流失和引进是相对比较均衡的,其中美国是情感计算领域人才流动大国,人才输入和输出幅度领先于其他国家,且从数据来看人才流出大于人才流入。英国、加拿大和印度等国人才迁徙流量小于美国;中国人才流入略高于人才流出。人才的频繁流入流出,使得该领域的学术交流活动增加,带动了人才质量提升的同时,也促进了领域理论及技术的更新迭代,逐渐形成一种良性循环的过程。

2.2国内学者概况

AMiner选取情感计算领域国内专家学者绘制了学者国内分布地图,如下图所示。通过下图我们可以发现,京津地区在情感计算领域的人才数量最多,东部及南部沿海地区的也有较多的人才分布,相比之下,内陆地区信情感计算领域人才较为匮乏,这也从一定程度上说明了情感计算领域的发展与该地区的地理位置和经济水平都是息息相关的。同时,通过观察中国周边国家的学者数量情况,特别是与日本、东南亚等亚洲国家相比,中国在情感计算领域顶尖学者数量方面具有较为明显的优势。图8是我国情感计算领域顶尖学者最多的10个省份。

 

情感计算学者分布国内省份TOP10

 

三、情感计算应用

近年来,Picard领导的美国麻省理工学院多媒体实验室相继提出了近50种情感计算应用项目。例如,将情感计算应用于医疗康复,协助自闭症者,识别其情感变化,理解患者的行为;在教育中应用情感计算,实现对学习状态的采集及分析,指导教学内容的选择及教学进度进行;还可以将情感计算应用于生活中,计算机能够感知用户对音乐的喜好,根据对情感反应的理解判断,为用户提供更感兴趣的音乐播放等。

3.1课堂教学

在美国,公立学校的预算限制引发大规模的教师裁员和教室拥挤不堪。教师工作时间紧张,还要考虑和满足每个学生的需求。结果就是,那些课业困难的孩子容易受到忽视。因为只要孩子不提出问题,老师就不会关注到他。在过去三年里,有企业把面部识别技术应用到了第一线教学当中。在Sensor Star实验室,他们用相机捕捉学生上课反应,并且输入到计算机里面,运用算法来确定学生注意力是否转移。通过面部识别软件Engage Sense,计算机能够测量微笑、皱眉和声音来测定学生课堂参与度。孩子们的眼睛是专注于老师的吗?他们是在思考还是发呆?他们是微笑还是皱着眉头?或者他们只是觉得困惑?还是无聊?测量之后,老师将会收到一份反馈报告,基于面部分析,报告会告诉老师他们的学生学习兴趣何时最高、何时最低。这样,老师能够对自己的教学方案做出调整,满足更多学生的需求。此外,比尔和梅林达盖茨基金会资助了传感器手镯(sensor bracelets)的开发,这可以用来追踪学生的参与水平。腕部设备能够发送小电流,通过在神经系统响应刺激时测量电荷的细微变化便可以得知学生的课程兴奋程度。心理学家Paul Ekman将面部识别技术研究提升到了一个新的层次。他对5000多种面部运动进行了分类,以帮助识别人类情绪。他的研究为Emotient Inc、Affectiva Inc和Eyeris等公司提供了帮助,这些公司将心理学和数据挖掘相结合,检测人的细微表情,并对人的反应进行分类。目前为止,面部识别技术的重点是协助联邦执法和市场调研。不过,圣地亚哥市的研究人员也在医疗行业试用这项技术,测定孩子接受外科手术之后的疼痛程度。

3.2机器学习定制学生课堂学习内容

Tech Crunch公司的员工设计了在线教育平台,来提供一对一指导和精熟学习(mastery learning)。这是应用创新型思维,通过实时的评估和定制化的学习方式,有效地解决本杰明提出的著名的“Sigma2Problem”。深度学习系统将学生学习效果数据进行分类,并且在此基础上制定相关的教学内容。该系统还可以推荐附加练习,并且根据学生个人能力和教学要求,实时推荐课程内容,调整教学速度。北卡罗来纳州州立大学研究员开发了一种软件,通过摄像头捕捉和分析学生面部表情,以此改变在线课程。目前,大多数情感计算技术还仅仅停留在学术研究领域。但也已经有公司开始应用这项技术,并能成功地分辨学生表情,并根据他们的学习能力和方式,来自动调整适合的学习内容和环境。英特尔公司正是这其中的一员。有了这些学生表情数据,可以让“Emoshape”这样的情感计算智能系统,自动分析情感,并做出适当回复。这些系统具备了解决个体问题的能力,也使老师能够提供高度个性化的内容来激发学生的学习兴趣。金准产业研究团队认为,人工智能和大数据已经促成了大部分行业的技术革新,从电子商务到交通、金融、医疗。人工智能和大数据已经在教育方面取得进展。尽管有些反对的声音,比如说如何保护学生隐私、如何提高教学效率等,但需要指出的是,这些技术的应用并不是要代替老师,而是扮演辅助老师的角色,识别学生的个体需求,以制定更加智能的教学方案。

3.3情绪监测

为了深度挖掘人类情感的奥秘,美国麻省理工学院计算机科学与人工智能实验室打造了用无线信号监测情绪的EQ-Radio。在没有身体感应器和面部识别软件辅助的情况下,EQ-Radio通过测量呼吸和心跳的微小变化,利用无线信号捕捉到一些肉眼不一定能察觉的人类行为,判断一个人到底处于以下四种情绪中的哪一种:激动、开心、生气或者忧伤,正确率高达87%。美国麻省理工学院教授和该项目的负责人Dina Katabi预测,这个系统会被运用于娱乐、消费者行为和健康护理等方面:电影工作室和广告公司也可以用这个系统来测试观众实时的反应;而在智能家居的环境中,该系统可以通过捕捉与人的心情有关的信息,调节室内温度,或者建议你应该呼吸一些新鲜空气。现有的情绪监控方法大多依赖于视听设备或者是安装在人身上的感应器,这两种技术都有缺点:面部表情并不一定符合内心状态,而安装在身上的感应器(比如胸带和心电监护仪)会造成各种不便,而且一旦它们的位置稍微移动,监测到的数据就不精确了。EQ-Radio会发送能监测生理信息的无线信号,该信号最终会反馈给设备本身。其中的算法可以分析心跳之间的微小变化,从而判断人们的情绪。消极情绪会被判定为“忧伤”,而正面且高涨的情绪会被判定为“激动”。尽管这样的测量会因人而异,但其中还是有内在统一性。通过了解人们处于不同的情绪状态下,他们的心跳会如何变化,我们就可以对他所处的情绪状态进行有效的判断。在他们设计的实验中,参与实验者选择他们记忆中最能代表激动、开心、生气、忧伤以及毫无情感的一段视频或音乐。在掌握了这段时长两分钟的视频里的五种情绪设置后,EQ-Radio可以精确地通过一个人的行为判断他处于这四种情绪中的哪一种。与微软研发的基于视觉和面部表情的Emotion API相比,EQ-Radio在识别喜悦、忧伤和愤怒这三个情绪上精确度更高。同时,这两种系统在判断中性情绪时的精准度差不多,因为毫无情绪的脸总是更容易被识别。目前,对美国麻省理工学院计算机科学与人工智能实验室而言,最艰巨的任务就是摆脱不相关数据的干扰。比如,为了分析心率,他们要抑制呼吸可能带来的影响,因为呼吸时,人的肺部起伏比他心跳时的心脏起伏要大。

3.4医疗康复

近年来,情感计算运用于自闭症治疗得到越来越多的关注。例如,美国麻省理工学院情感计算团队正在开发世界上第一个可穿戴的情感计算技术设备:一个具有社交智能的假肢,用来实时检测自闭症儿童的情感,帮助机器人使用自闭症儿童独有的数据,来评估这些互动过程中每个孩子的参与度和兴趣。这个装置用一个小型照相机,分析孩子的面部表情和头部运动来推断他们的认知情感状态。还有一种叫“galvactivator”的工具,通过测量穿戴者的皮肤电流数据,推断孩子的兴奋程度。这个像手套一样的设备可以利用发光二极管描绘出人体生理机能亢奋程度的图谱。这种可视化的展现方式,能够清晰地展示出人的认知情感水平。NAO机器人和个性化的机器学习在治疗自闭症患者上也表现出很大的优越性:人类治疗师会向孩子展示一张照片或者闪存卡片,用来表示不同的情绪,以教会他们如何识别恐惧、悲伤或喜悦的表情。治疗师随后对机器人进行编程,向孩子们展示这些相同的情绪,并且在孩子与机器人交往时观察孩子。孩子们的行为提供了宝贵的反馈信息,机器人和治疗师可以根据反馈信息继续学习。研究人员在这项研究中使用了Soft Bank Robotics NAO类人机器人。NAO将近2英尺高,类似于装甲超级英雄,通过改变眼睛的颜色、肢体的运动以及声音的音调来表达不同的情绪。参加这项研究的35名自闭症儿童中,有17人来自日本,18人来自塞尔维亚,年龄从3岁到13岁不等。他们在35分钟的会议中以各种方式对机器人做出反应,从看起来无聊和困倦,到在房间里兴奋地跳来跳去,拍手,大笑或触摸机器人。研究中的大多数孩子对机器人的看法是,它不仅仅是一个玩具,应该尊重NAO,因为它是一个真实的人。另外,人类用许多不同的方式改变自己的表情,但机器人则通过同样的方式来改变表情,这对孩子来说更加有利,因为孩子可以通过非常有条理的方式学习如何表达表情。麻省理工学院的研究小组意识到,具有深度学习能力的治疗机器人能够更好感知儿童的行为的。深度学习系统使用分层的多层数据处理来处理其任务,每一个连续的层都是对原始数据抽象的表示。尽管自20世纪80年代以来深度学习的概念已经出现,但直到最近才有足够的计算能力来实现这种人工智能。深度学习已被用于自动语音和对象识别程序中,这种应用非常适合解决面部、身体和声音等多重特征的问题,从而更好地理解抽象的概念,如儿童的参与感。对于治疗机器人,研究者构建了一个个性化框架,可以从收集的每个孩子的数据中学习。研究人员拍摄了每个孩子的脸部表情、头部和身体动作、姿势和手势,记录了儿童手腕上显示器的心率、体温和皮肤汗液反应作为数据。这些机器人的个性化深度学习网络是根据这些视频、音频和生理数据的层次,针对孩子的自闭症诊断和能力、文化和性别的信息构建的。研究人员将机器人对儿童行为的估计与五位人类专家的估计数字进行了比较,这些专家连续对孩子的录像和录音进行编码,以确定孩子在会议期间高兴或不安程度,是否感兴趣以及孩子的表现。比较发现,机器人对儿童行为的估计要比专家更加具体清晰。

3.5舆情监控

网络调查法、统计规则法和文本内容挖掘是三种经常被使用的网络舆情分析方法。金准产业研究团队分析认为,大数据时代的来临使传统的舆情分析方式发生改变,大数据时代数据量突增、数据产生的速度极快、冗余信息占比高的特性不仅给舆情分析带来新的发展机遇,也带来了新的难度和挑战。基于简单调查和统计的舆情分析方法将无法适用于大数据环境下的网络社区文本。当前国内外对舆情分析技术的研究也大多以大数据环境为背景,与传统舆情分析技术相比,大数据时代网络社区的舆情分析技术更多地集中于对数据的获取,并采取文本数据分析、数据挖掘、语义分析等技术获取舆情信息。当前国内外的舆情分析技术研究主要集中于话题识别与话题跟踪、意见领袖识别以及情感倾向判别这三个方面。话题识别与话题跟踪首先在文本中识别出新话题,接下来在一段时间内检测并实时跟踪话题,实现该话题的再现,研究其随时间发展的演化过程。聚类方法常用于进行话题识别。在国外研究中,话题检测与跟踪(TDT)是了解社交媒体热点话题及其演变过程的重要手段。意见领袖的发现和识别重点在于评价指标的制定以及模型的构建。例如,曹玖新等将网络社区用户看作一个个节点,根据节点之间信息的交互和传播过滤,从用户结构、行为和情感三个特征维度挖掘意见领袖。情感倾向判别在舆情研究中最为常见,首先收集web金融领域的文本数据属性,接下来构建金融领域的情感词典,最后结合语义分析,将语义规则应用到情感及情感强度识别当中,提升了分类器的准确率M。王永等人将倾向分析应用到客户评论信息挖掘当中,结合情感词之间的依存关系计算面向产品特征的情感倾向得分,从网络评论中获取有价值的商业信息。国外针对Twitter的情感倾向分析研究居多,用以获取有价值的信息和舆论导向,例如,结合语言规则特征可以分别获取正面和负面的Twitter文章,反应公众的舆情态度。

 

四、趋势

4.1论文研究发展趋势

Trend analysis(http://trend.aminer.cn)基于AMiner的2亿篇论文数据进行深入挖掘,包括对技术来源、热度、发展趋势进行研究,进而预测未来的技术前景。技术趋势分析描述了技术的出现、变迁和消亡的全过程,可以帮助研究人员理解领域的研究历史和现状,快速识别研究的前沿热点问题。下图是当前情感计算领域的热点技术趋势分析,通过Trend analysis分析挖掘可以发现当前该领域的热点研究话题Top10是Affective Computing、Social Robot、Emotion Recognition、Human Computer Interaction、Feature Extraction、Support Vector Machine、Facial Expression、Human Robot Interaction、Behavioural Sciences Computing、Face Recognition。

金准产业研究团队发现,该领域当前最热门的话题是Affective Computing,从全局热度来看,Affective Computing的话题热度虽然有所起伏,但从20世纪90年代开始,热度迅速上升,甚至在五年内超过了此前的话题Top1EmotionRecognition,并且至今其话题热度始终保持在Top1,论文的发表数量也较多;Social Robot的研究热度跟随Affective Computing同期上升,近几年话题热度更是超越Emotion Recognition成为Top2话题;另外,前期比较热门的Feature Extraction经过了一段时间的低迷期后,也回到了Top3的位置。

4.2情感计算技术预见

研究者根据情感计算领域近十年的相关论文,利用大数据分析、机器学习、人工智能等技术手段,建立算法模型及研发demo系统,分析挖掘出该领域的技术发展热点。技术预见图中点的大小表示该技术的热点(主要由相关论文数量的多少决定,相关论文越多,热度越高,点越大),各技术之间的连线表示2个技术关键词同时在N篇论文中出现过(当前N的取值为5)。

金准产业研究团队分析,情感计算领域相关度最高的技术有3项,分别为:feature extraction、human computer interaction和emotion recognition。按照技术前沿度,可以列出相关的主要技术关键词,以及该技术历年的变化趋势(论文发表数量变化趋势),及重要代表性成果。具体如下图所示:

15中我们可以看出,情感计算领域预测前沿度比较高的前四热词有:autism spectrum disorder(前沿度为1428)、support vector machine(前沿度为1096)、deep learning(前沿度为1058)和semantic web(前沿度为1031)。

结语

金准产业研究团队认为,如果说目前的传统计算机(包括应用现有智能计算方法的计算机)只包含了反映理性思维(Thinking)的“脑(Brain)”,那么,情感计算将为该机器增添了具有感性思维(Feeling)的“心(Heart)”(这是应用文学方式对机器进行拟人化比喻。按认知科学讲,感性思维仍源于脑活动)。可以认为,情感计算是在人工智能理论框架下的一个质的进步。因为从广度上讲它扩展并包容了情感智能,从深度上讲情感智能在人类智能思维与反应中体现了一种更高层次的智能。情感计算必将为计算机的未来应用展现一种全新的方向。

金准产业研究 全球人工智能发展白皮书(下) 2019-10-08 17:41:02

三、中国在全球AI地位

本次人工智能浪潮以从实验室走向商业化为特征,其发展驱动力主要来自计算力的显着提升、多方位的政策支持、大规模多频次的投资以及逐渐清晰的用户需求。尽管中国人工智能产业发展迅速,2019年人工智能企业数量超过4,000家,位列全球第二,在数据以及应用层拥有较大的优势,然而在基础研究、芯片、人才方面的多项指标上仍与全球领先地区有一定的差距。

 

中国人工智能技术与全球领先地区的对比

3.1中国拥有更为庞大的数据规模以及更丰富数据使用环境

人工智能技术的进步以海量数据为基础,移动互联网时代已经全面到来,移动端数据的重要性已经远超PC网络。在数据量方面,中国网民规模居全球第一,2018年底整体网民规模已经达到8.29亿,渗透率达59.6%,其中手机网民占比为98.6%,首次超过8亿人21。巨大的网民规模数量意味着中国企业拥有的数据数量将是更加复杂的,多维度的,这为人工智能技术的算法升级以及应用场景的扩展提供了良好的基础。除了数据本身,政府对隐私数据的规定也将极大影响企业利用数据的可能性。欧洲政府已经出台了全球最为严格的用户隐私保护政策《通用数据保护条例》(GDPR),赋予用户对个人数据的主张权利,用户有权获取并修改个人数据,并决定谁可以使用22。中国也已经出台了《信息安全技术个人信息安全规范》,但其严格程度低于GDPR,例如欧盟对“身份”的界定除了工作单位等还包括生理状态、心理状态、经济状态、社会状态等。

 

中国手机网民规模及占比

3.2中国是全球芯片需求量最大的市场,但高端芯片依赖进口

人工智能框架大致可分为三个层面。基础设施层面包括核心的人工智能芯片和大数据,这是技术层面的传感和认知计算能力的基础。应用层面处于最顶层,提供无人驾驶、智能机器人、智慧安防和虚拟助手等服务。人工智能芯片是人工智能技术链条的核心,对人工智能算法处理尤其是深度神经网络至关重要。据金准产业研究团队统计,目前,中国从美国进口的集成电路芯片的价值超过2,000亿美元,远超原油进口额。在东亚地区,日本在半导体研发和材料行业一直处于领先地位,拥有包括东芝、索尼和瑞萨电子等在内的半导体巨头。韩国和中国台湾分别在存储器和晶圆代工方面具有较强优势。韩国在动态随机存取存储器和NAND闪存方面领先,拥有三星、SK海力士等许多顶尖半导体企业,这很大程度上得益于政府支持。且NAND内存市场核心技术能力积累的要求,使新市场参与者日益难以参与竞争。中国台湾已经成为全球领先的半导体晶圆代工产地。该地区半导体晶圆代工行业由台积电和联华电子两大合约制造商主导。半导体晶圆代工是信息技术产业的重要支柱。中国半导体行业正以两位数的增长率蓬勃发展。人工智能芯片融资活动一直非常活跃,相关并购活动也日益增多。其中一个典型的案例是国际巨头赛灵思对在机器学习、深度压缩、网络剪枝和神经网络系统级优化领域拥有领先技术的初创企业深鉴科技的收购。以阿里巴巴、百度和华为为首的领先科技公司也逐步进入这一竞争领域。值得注意的是,华为已经掀起了智能手机领域的人工智能芯片竞争。同时中国大陆正在蚕食台湾的半导体市场份额。不但如此,日益扩大的中国大陆市场还将成为集成电路设计行业的商业渠道,中国大陆企业将继续投资于台湾的半导体产业。然而,尽管近年来中国半导体厂商的竞争力得到显著提升,但关键零部件仍需大量从西方国家进口,自给率不足20%。中国政府十分关注这一问题,制定了多项有利政策支持半导体行业的发展。

3.3中国机器人企业快速成长核心零部件技术国产化加速

机器人研发与应用已经成为衡量一国科技发展水平的重要因素,未来经济的增长在很大程度上与机器人行业的发展息息相关。机器人作为先进制造业建设的重要组成部分,无论是工业领域进行生产活动的工业机器人,还是参与人类日常生活的服务机器人,对寻找新的经济增长点都有重要意义。在资金与政策的大力支持下,中国机器人产业快速发展,增速保持全球第一,2018年市场规模超过87.4亿美元,2013-2018年的平均增长率达到29.7%。机器人的关键零部件在较大程度上仍旧依赖进口,包括精密减速机、控制器、伺服电机等,其中全球精密减速器市场大半被日本企业占据。软件方面,控制算法、二次开发等,中国企业已经掌握了一定的技术,但在稳定性、响应速度、易用性等方面和国外还有差距。此外,从机器人应用场景来看:工业机器人方面,沈阳新松、埃夫特、广州数控、哈博实、新时达、埃斯顿和巨一等一批本土机器人企业得到快速成长。过去几年国内机器人行业公司纷纷开展对外并购获取海外先进技术的同时开拓海外市场,埃斯顿、埃夫特、万丰科技均并购欧美企业。在机器人三大核心零件中,控制器和伺服器国产化脚步加速,但减速器仍需要进口,国内生产的减速器虽然设计原理一致,但产品性能和精度仍有巨大差距。全球服务机器人处于新兴阶段,中国虽然起步较晚,但在技术方面与全球先进水平差距较小,甚至某些关键技术已经处于全球先进行列。BATJ等互联网巨头凭借强大的技术支持切入市场,传统家电企业例如海尔积极布局家庭服务机器人,此外以哈工大为代表的科研机构也通过与企业合作的方式转化研究成果。特种机器人市场处于萌芽状态,主要分布于消防等垂直领域,已经拥有一定的自主性,在高精度定位导航和避障等核心技术方面已经取得了突破。

3.4美国人工智能底层技术实力更为雄厚,中国则在语音识别技术上更优

自然语言处理(NLP):中国仍有差距自然语言处理技术能够改变人类与机器的互动方式,在商业数据领域隐藏着许多无法被目前技术手段进行利用的暗数据,包括短信息、文件、邮件、视频、语音、图片等非结构化数据,自然语言处理技术将在商业方面发挥重要作用。中国在自然语言处理方面,与美国仍有较大的差距。从企业数量来看,中国拥有92家,美国则是中国近2.7倍,达到252家。中国从事NLP工作的员工仅有6,600名,而美国则达到了20,200名。语音识别:中国技术更胜一筹语音识别技术能够被广泛的应用于电视、手机、呼叫中心、智能家居等场景。在语音识别技术方面,百度、科大讯飞、搜狗等主流平台识别准确率均在97%以上。阿里巴巴的语音AI技术超越谷歌,入选MIT2019年全球十大突破性技术,并且该技术已经渗透入生活的多个场景,包括快递、客服、火车站购票等。2018年双十一,“阿里小蜜”承担了全平台98%客服咨询量,相当于70万人工客服一天的工作量。机器视觉:基础算法方面差距较大机器视觉一直以来都是人工智能技术领域的热点之一。公众的日常生活已经被大楼门禁、交通摄像头、银行安保摄像头等包围,无处不在的摄像头连接上人脸识别技术,原有的安防效果将被迅速放大,每个人的行为都能被监控。从应用层面来看,中美几乎没有差距,甚至在人脸识别技术上有望超过美国。但是在基础算法方面,中美差距较大。中国目前约有146家企业,大部分属于应用领域,包括海康威视等,美国则有约190家。从业人员数量方面,中国拥有1,510名,而美国则超过4,000人。

3.5中国在AI应用上呈现追击态势

无人驾驶:美国凭借深厚的技术沉淀领先中国。无人驾驶涉及到的技术包括汽车传感器技术、AI软硬件、V2X以及无人驾驶测试四个方面。在传感器技术以及AI软硬件方面,美国借助政府力量以及长久以来的技术沉淀拉开了与中国的技术差距。但是中国也依靠科技巨头与科研院校在上述两个方面加速追赶。在互联技术以及无人驾驶测试两个方面,中国的水平已经与美国相接近。华为的5G技术将为互联技术V2X提供全球一流的通信支持,此外,华为已经与国内外车厂进行了合作与测试。在无人驾驶测试方面,北京、上海、深圳、重庆等城市已经对百度等科技巨头颁发无人驾驶测试牌照并提供测试场地,科技巨头与北汽、比亚迪等国内车企开展了合作。

 

中国无人驾驶领域技术水平

人工智能教育:国外的发展更为完善,中国虽然处于起步阶段,但发展前景更为广阔。人工智能技术在教育行业的应用在国外的发展更早,早在二十世纪九十年代已经出现了智适应技术。人工智能教育产品在欧美国家的渗透程度更深,通过近十年的发展,覆盖了各年龄段的用户,涵盖了早教、小学、初中、高中以及职业教育中的多个学科,应用的场景也相对更为广泛,以ToB为主,包括考试机构、学校、企业。代表企业主要可以分为三类,包括向智适应教育转型的在线教育平台,例如Coursera,Khan Academy;教育集团智适应事业部,例如培生提供以GMAT为代表的计算机智适应测评考试;此外还包括试图囊括学习五大环节的智适应教学平台,已经出现了Knewton、Aleks等明星公司。Knewton是一家智适应学习平台企业,前期主要客户是出版商与教育公司,通过将各类课程进行数字化进而提供智适应学习方案,在2016年后开始与学校合作提供课程产品。截止2019年,Knewton总融资规模已经超过1.8亿美元。各项研究已经验证了人工智能技术在教育方面对提升学习成绩的显著效果。人工智能技术在中国的应用则是近几年刚起步,以ToC为主。虽然仍然处于发展的初期,然而市场发展节奏极快,2018年松鼠AI营收超过5亿元,英语流利说超过6亿元。由于中国人口基数大,教育资源紧缺,对教育的重视程度等有利因素将推动智适应学习系统的快速发展,各类教育相关企业纷纷布局人工智能技术。这其中主要包括了以新东方、好未来为代表的教育集团通过投资以及自建的方式入局智适应教育。此外,还有三大类企业,一类是以上海教育企业松鼠AI为代表的智适应平台,另外两类是转型智适应教育的在线教育企业,以及涉足智适应教育的人工智能企业。智适应学习以其能够贯穿学习全过程的独特优势成为人工智能在学习各环节应用最为广泛的技术。

 

人工智能教育企业对比

四、人工智能重塑各行业

人工智能技术在过去5-10年快速发展,随着时间推移,技术渐渐为大众所知,摩尔定律的节奏逐渐放慢,人工智能商业化应用成为关注焦点。金准产业研究团队分析,科技巨头纷纷布局垂直行业应用,创业企业需要找准切入点,深耕行业解决方案以打造护城河。各行业面临的痛点有所不同,例如金融行业面临成本压力、产品服务单一、交易欺诈等,医疗与教育行业均面临资源分配不均等。虽然问题不同,但通过数据收集、处理与分析能够有效解决上述多样的问题,而人工智能通过数据驱动能够改变产业。

 

人工智能技术推动产业升级

在金融领域,人工智能技术迅速改变了传统金融行业的各主要领域。围绕消费者行为和需求的不断变化,传统的金融服务行业参与者正面临着各领域各环节的重构。随着消费者行为和偏好的不断变化,以技术驱动的精准营销和推送使消费者获得定制化的产品和服务,通过技术增强客户粘性,并使小商户融入更大范围的生态圈;人工智能机器人在一些服务领域逐渐取代人工客服,为客户提供咨询服务。在医疗领域,在人口老龄化、慢性病患者群体增加、优质医疗资源紧缺、公共医疗费用攀升的社会环境下,医疗人工智能的应用为当下的医疗领域带来了新的发展方向和动力。随着人工智能技术在医疗领域的持续发展和应用落地,这个行业将极大简化当前繁琐的看病流程,并在优化医疗资源、改善医疗技术等多个方面为人类提供更好的解决方案。医疗人工智能技术已基本覆盖医疗、医药、医保、医院这四大医疗产业链环节。近几年,教育行业持续通过数据重构,呈现出空前的革命性。不同于传统教育方式,智能化教育方式以学生学习“教、学、练、评、测”五大环节所产生的数据为基础,利用智适应学习,图像识别,语音识别,人机对话,多模态行为分析,知识生成和表达,模拟智能体等功能,产生适合每个学生的个性化的解决方案和有效反馈意见。大幅度提高学习效率,改变教育模式。针对上述行业在行业应用度以及市场机会两个维度的表现,可以落入四个象限。过渡期表示人工智能技术在该行业具有较高的应用程度,但目前来说市场机会有限,未来有望进一步拓展市场规模;萌芽期表示行业应用度以及市场机会都尚未成熟,尽管人工智能技术发挥了一些功能但总体来讲尚且处于起步阶段;成长期表示虽然行业的应用度不足,但未来应用广泛,拥有较高的市场机会;发展期表示人工智能技术已经在这些领域产生了较为深刻的影响,行业应用度较高,同时市场机会也高。

 

人工智能技术在各行业的应用

4.1金融:人工智能提升金融企业商业效能并变革企业内部经营

金融是人工智能重要的应用场景,人工智能在金融行业的应用改变了金融服务行业的规则。传统金融机构与科技公司共同参与,构建起更大范围的高性能动态生态系统,参与者需要与外部各方广泛互动,获取各自所需要的资源,因此在金融科技生态系统中,金融机构与科技公司之间将形成一种深层次的信任与合作关系,提升金融公司的商业效能。这种效能的提升主要表现在三个方面:第一,传统金融模式下,往往存在信息不对称、金融风险大、借贷成本高等问题,创新技术应用于传统金融业务,使整个金融行业的基础服务架构得到改善,从而降低业务成本,提升服务效率;第二,出现多种形态的创新金融科技公司,以创新技术为基础,根据客户需求提供定制化产品和服务,覆盖更多被传统金融服务“拒之门外”的长尾客户,使更多个体或者中小企业享受到更加便捷、高效的金融服务,覆盖更多、更广泛的客户。第三,吸引更广泛、更多元化的参与者融入生态圈,通过收集消费者大量消费、信贷数据对消费者信用进行评估,降低坏账等金融风险。上述三种效能的提升主要体现在智慧投顾、智慧客服以及智慧风控三个领域,这也是人工智能技术应用较为深入的领域。智能客服提升服务效率智能客服是指能够与用户机型简单问题答复,通过人机交互解决用户关于产品或服务的问题。自然语言处理技术成熟度在各类人工智能技术中成熟度较低,但在客服领域中能够发挥较高的价值。人工客服存在培训成本高、服务效果难以统一以及流动性大的问题。以大数据、云计算特别是人工智能技术为基础智能客服加速企业客服智能化,依靠知识图谱回答简答重复性问题,减少人工客服使用,提升客服效率及效果。客服机器人已替代40%-50%的人工客服工作,预计到2020年,85%的客服工作将依靠人工智能完成。智能客服在金融行业的应用主要在银行、保险、互联网金融等细分领域。银行、保险等传统金融机构更加倾向于向IT服务企业购买本地解决方案,以确保数据信息安全性,规避潜在的泄露风险。由于传统金融机构存在多样化的需求,因而IT服务企业提供的定制化的解决方案。互联网金融领域的智能客服主要以SaaS模式为主,使用企业以大型互联网金融公司为主。目前以人工智能技术为基础的智能金融应用已经在多地尝试落地。我国现有139家智慧金融公司,其中44%的公司获得B轮及以上的投资。这些获得投融资的业具体应用领域主要有智能风控、智能投顾、智慧客服、智能投研、智能营销等,其中智能风控和智能投顾领域的企业占比超过一半,成为最受资本欢迎的方向。

4.2教育:人工智能技术应用覆盖教学全流程

人工智能技术正在推动教育信息化的快速发展,人工智能教育是人工智能技术对教育产业的赋能,通过人工智能技术在教育领域的运用,来实现其辅助甚至是替代作用。未来人工智能教育应用的发展将由数据驱动、应用深化、融合创新优化服务等方式来持续推动。从行业发展阶段来看,目前人工智能教育行业仍处在发展阶段,尚未成熟。人工智能的概念虽火热,但人工智能在教育行业的具体赋能却并非是一蹴而就的。纵观人工智能教育行业的应用发展历程,起步阶段主要集中在对人工智能教育的规划和初步探索中,20世纪50年代,卡耐基梅隆大学教授艾伦•纽厄尔和赫伯特•西蒙作为人工智能的奠基人,结合数学、工程和经济学促进了人工智能的发展。20世纪70年代,JaimeCarbonell创建智能教学系统,开始利用计算机辅助教学;1993年英国爱丁堡举行第一届人工智能教育(AiED)国际会议。随着时间发展,人工智能教育也开始正式走向发展阶段,21世纪初,美国CognitiveTutor、Knewton、RealizeIt等智适应教育企业纷纷成立,人工智能技术开始被逐渐赋能到教育产业中。智适应学习技术是模拟老师对学生一对一教学的过程,赋予学习系统个性化教学的能力的人工智能教育技术。2010年后,中国智适应教育企业开始兴起,如新东方、好未来、乂学教育—松鼠AI等公司。2016年前后,国内的众多知名教育机构如好未来、新东方等以及资本也纷纷投入人工智能教育领域。

 

中国教育行业智慧化趋势

人工智能将重构教育行业生态。人工智能是基于大数据采集和多维度识别系统,对海量数据进行智能处理,并通过互动接口与应用场景与人产生信息交互的一项技术。以该技术为基础向用户提供人工智能教育内容、工具以及相关服务,通过接受用户数据,并进行分析和回馈,应用于学习过程中的“教、学、评、测、练”五大环节,产生适合学习者的个性化的解决方案和有效回馈意见。教育智能化趋势下,智适应学习以其能够贯穿学习全过程的独特优势成为人工智能在学习各环节应用最为广泛的技术,并逐步成为主流。此外,人工智能技术在教育领域的应用还包括图像识别产品与语音识别产品。

 

人工智能在学习五大环节中的应用

智适应学习系统。智适应学习系统能够针对学生的具体学习情况提供实时个性化学习解决方案,包括知识状态诊断、能力水平评测以及学习内容推荐等。例如在“教”与“学”这两个环节,个体学习者的学习情况、学习能力不同,智适应课程系统利用人工智能技术,将知识点提炼、学习方法归纳等教学重难点利用大数据和算法形成一套高效、标准化的系统课程,说明不同程度学习者适应不同类别课程。计算力提升、海量数据以及贝叶斯网络算法的应用推动智适应学习系统在2010年之后得到快速发展,并取得显着成效。Knewton的数学自我调整辅助课程在亚利桑那大学帮助学生大幅提升通过率,课程退课率降低了56%。智适应学习技术与产品在国内与国外各有发展特点。在美国与欧洲发展更为完善,主要面向ToB端客户,拥有以Knewton、ALEKS、RealizeIt、Dream Box等代表性企业。中国目前处于初步发展的阶段,面向ToC端用户,代表企业包括学教育-松鼠AI,智适应学习在中国发展更为迅速,有望后来者居上。

4.3数字政务:政策利好加速政府智能化变革

与众多领域一样,政府也已经意识到人工智能在降本增效方面的突出成果,加速推进政府智慧化变革。中国在城镇化战略的大力推动下,已经成为全球城市化率增长最高的国家,2018年我国城市化水平达60%,城市人口约为7.3亿,预计2050年城市化率将超过80%,城市人口规模也将进一步扩大。如此大的城市人口数量将产生大量的政府事务,通过机器人流程自动化(RPA)、人工智能技术的应用,能够将行政人员从固定、重复的工作中解放,提升政务效率,专
注于提升城市质量、优化居民生活环境中。人工智能赋能一切背景下,人脸识别、自然语言处理等技术应用能够增强政府服务能级,提升办公效率,为企业、居民提供便捷、快速的服务,为智能决策提供助力。数字政务的建立依靠自上而下进行推动。在构建服务型政府的目标下,2015年各地政府开始强调政府电子化,随着人工智能、大数据、云计算等新技术的商用,进一步发展为政府数字化、智慧化。预计2019年,中国数字政务市场规模将突破3,400亿元,年复合增长率达到15%。

4.4医疗:人工智能应用日趋成熟

在人口老龄化、慢性病患者群体增加、优质医疗资源紧缺、公共医疗费用攀升的社会环境下,医疗人工智能的应用为当下的医疗领域带来了新的发展方向和
动力。随着人工智能技术在医疗领域的持续发展和应用落地,这个行业将极大简化当前繁琐的看病流程,并在优化医疗资源、改善医疗技术等多个方面为人类提供更好的解决方案。在国务院印发的《新一代人工智能发展规划》中,中国明确了2020年人工智能核心产业规模超过1500亿元的目标。据预测,医疗人工智能行业将占人工智能
总体市场规模的五分之一。2016年中国医疗人工智能的市场规模达到96.61亿元,增长37.9%,数据显示,2017年中国人工智能医疗市场规模超过130亿元人民币,增长40.7%。预测2019年可达到310亿元人民币。从市场需求来看,由于中国医疗资源的短缺和分配不均,更加开放和高效的医疗解决方案成为了市场急迫的要求。在技术发展上,随着中国在与医疗健康相关的计算机视觉、自然语言理解和数据挖掘等方面的长足进步,医疗人工智能在应用落地上有了更多的技术支持。政策方面,互联网、人工智能下的医疗健康行业发展一直是中国国家政策重点扶持和关注的领域。2018年4月,在印发的《关于促进“互联网+医疗健康”发展的意见》中,国务院明确指出支持研发医疗健康相关的人工智能技术。以上均为医疗人工智能行业的发展传递了积极的政策信号。国内医疗人工智能公司虽起步较晚,但增长迅速。近几年该领域的新创公司数量持续增长,且吸引了大量资本的注入。目前我国共有144家智慧医疗公司,已初步形成北京、广州、长三角的智慧医疗聚集群。这些广泛分布于疾病筛查和预测、医学影像诊断、病历与文献信息分析、新药发现等细分领域,其中2018年获融资企业最多的领域为疾病筛查和预测。在资金来源方面,大型国资企业纷纷入股,百度、阿里、腾讯、科大讯飞等互联网巨头也根据自身优势积极布局。医疗领域的人工智能在快速发展的同时也受到了来自传统观念、技术、人才、监管方面的挑战。在传统观念方面,传统的“望闻问切”的诊疗模式已经根深蒂固,作为人工智能的医疗应用受众的医生和病患对于新技术的接受程度是考验智慧医疗从业者的一个问题。从技术来看,智能医疗需要海量的数据和复杂的训练框架,同时拥有这两个技术实力的企业并不多,在对复杂学科的联合诊断等算法上存在技术瓶颈,此外智能医疗行业技术和产品同质化明显。人才的短缺也是医疗人工智能市场的制约因素,在中国,既懂医疗,又懂技术的复合型、战略型人才尤其短缺。在监管方面,由于医疗行业是关乎人类生命安全的领域,涉及病患的医疗数据应该保证绝对的隐私和安全,并需要严谨的法律法规进行监管和保护。

 

智慧医疗产业链

4.5无人驾驶:主导汽车产业革新

人工智能时代,与汽车相关的智能出行生态的价值正在被重新定义,出行的三大元素“人”、“车”、“路”被赋予类人的决策、行为,整个出行生态也也会发生巨大的改变。强大的计算力与海量的高价值数据是构成多维度协同出行生态的核心力量。随着人工智能技术在交通领域的应用朝着智能化、电动化和共享化的方向发展,以无人驾驶为核心的智能交通产业链将逐步形成。目前无人驾驶仍处于测试阶段,但是在未来将具有巨大市场。由于当前技术和现有法律的限制,无人驾驶汽车还无法实现大面积推广,整个行业内通过第一阶段封闭路测的车企较多,包括上汽、蔚来、滴滴、百度、北汽、宝马等多家传统车企和互联网背景的车企,而完全通过第二阶段开放道路测试的企业并不多。因此短期内无人驾驶汽车市场不会有太大变化。业内预计中国可在2020年左右实现无人驾驶,届时国内无人驾驶汽车的销量可达6万辆,并在此后迅猛增长,于2035年达到400万辆。由于无人驾驶的发展对工业基础以及技术支持有较高的要求,因此国内自动驾驶企业分布较为集中。北京、广东、江浙沪这些地区的自动驾驶企业占据了行业的绝大份额。产业集群效应将随着自动驾驶的发展愈发显着,长三角地区和珠三角地区依旧会是行业的发展中心。除此之外,地方政策也对无人驾驶的行业分布有重要影响,目前北京、上海、福州、重庆、长沙、长春、杭州、广州、深圳已开发自动驾驶测试道路,率先成为无人驾驶的试点城市。

 

国内自动驾驶企业地域分布

 

无人驾驶产业链

4.6零售:人工智能驱动行业走向聚合

受益于零售行业的数字化转型,人工智能已渗透到零售各个价值链环节。随着各大零售企业加入,电商巨头和科技企业加紧布局,人工智能在零售行业的应用从个别走向聚合,深度学习和计算机视觉成为支撑智慧零售的两大技术深度学习主要被应用于数据的分析与建模,以实现产业链的优化;计算机视觉技术则可应用于消费行为分析与商品识别,目前计算机视觉辅助下的货品检测、自助结算等已实现商业化。人工智能零售行业应用落地在全球高速增长。据Gartner预测,到2020年,85%的消费者互动将通过人工智能实现自动化管理。Global Market Insights数据显示,2018—2024年间全球人工智能在零售领域应用年均复合增长率(CAGR)超过40%,应用市场规模在2024年达到80亿美元,其中亚太市场CAGR超过45%,主要由中国和印度市场带动。从技术领域来看,视觉识别/搜索技术相关应用CAGR45%,机器学习相关应用CAGR超过42%。在此背景下,零售行业拉开利用人工智能转型的大幕。国内各大线下主流零售商顺应科技发展趋势,不断增加在人工智能领域的投入,2018年各类零售商在人工智能的建设投入约9亿元,占总投入的3.15%,预计到2022年这个数字可以突破178亿,占总投入的25%。各电商巨头也借着人工智能的东风,加速线上与线下业务的整合。

4.7制造业:智能制造应用潜力巨大

人工智能与相关技术结合,可优化制造业各流程环节的效率,通过工业物联网采集各种生产资料,再借助深度学习算法处理后提供建议甚至自主优化。然而,相较于金融、商业、医疗行业,人工智能在制造业领域应用潜力被明显低估。SAP通过对中国2015~2018年最大的300项人工智能投资项目进行分析,结果显示,23.4%的投资是在商业及零售领域,18.3%在自动驾驶,而制造业相关的人工智能投入不到1%13。而制造业恰恰是人工智能应用场景最具潜力的区域。金准产业研究团队发现,人工智能的使用可降低制造商最高20%的加工成本,而这种减少最高有70%源自于更高的劳动生产率。到2030年,因人工智能的推动,全球将新增15.7万亿美元的GDP,中国就占7万亿美元;到2035年人工智能将推动劳动生产力提升27%,拉动制造业的GDP高达27万亿美元。在国家政策指引下,我国制造业正加速智能化进程。2015年国家正式颁布《中国制造2025》,将智能制造工程作为政府引导的五个工程之一。2017年我国智能制造试点示范专项加速落地,与此同时国家对于智能制造专项的补助金额也在加速增长。2018年我国新增99个智能制造试点示范项目,其中18个位于长三角地区,10个位于京津冀地区。制造业将成为人工智能应用蓝海。全球人工智能及相关场景在制造业应用市场在2016年约为1.2千亿美元,这个数字在2025年有望超过7.2千亿美元,复合年均增长率预计可超过25%。

 

智能制造产业链

结语

金准产业研究团队认为,目前AI技术已在金融、医疗、安防等多个领域实现技术落地,且应用场景也愈来愈丰富。人工智能的商业化在加速企业数字化、改善产业链结构、提高信息利用效率等方面起到了积极作用。每一次人工智能的发展都伴随着研究方法的突破,深度学习是近年机器学习技术突破的重要代表之一。随着人工人工智能研究和应用领域的不断延伸,未来人工智能将迎来更多种技术的结合应用。随着投资界和企业界对人工智能的了解逐步加深,人工智能投融资市场更加理性。人工智能投融资频次有所下降,但投资金额继续增加。特别是经过行业的一轮优胜劣汰后,底层技术创业公司以及落地性强的领域如医疗、教育、无人驾驶等创业项目继续受到人工智能领先机构的青睐。

 

金准产业研究 全球人工智能发展白皮书(上) 2019-10-08 17:39:13

前言

目前AI已在金融、医疗、安防等多个领域实现技术落地,且应用场景也愈来愈丰富,正在实现全方位的商业化,引发了各个行业的深刻变革,这对加速企业数字化、改善产业链结构、提高信息利用效率等方面都起到了积极作用。与此同时,AI也已全面进入机器学习时代,未来AI的发展将是关键技术与产业的结合。然而随着投资界和企业界对AI的了解逐步加深,AI投融资市场更加理性,投资金额虽然继续增加,但投融资频次有所下降。特别是经过行业的一轮优胜劣汰后,底层技术创业公司以及落地性强的领域如医疗、教育、无人驾驶等创业项目继续受到人工智能领先机构的青睐。

一、AI创新融合新趋势

1.1人工智能正全方位商业化

当前人工智能技术已步入全方位商业化阶段,并对传统行业各参与方产生不同程度的影响,改变了各行业的生态。这种变革主要体现在三个层次。第一层是企业变革:人工智能技术参与企业管理流程与生产流程,企业数字化趋势日益明显,部分企业已实现了较为成熟的智慧化应用。这类企业已能够通过各类技术手段对多维度用户信息进行收集与利用,并向消费者提供具有针对性的产品与服务,同时通过对数据进行优化洞察发展趋势,满足消费者潜在需求。第二层是行业变革:人工智能技术带来的变革造成传统产业链上下游关系的根本性改变。人工智能的参与导致上游产品提供者类型增加,同时用户也会可能因为产品属性的变化而发生改变,由个人消费者转变为企业消费者,或者二者兼而有之。第三层是人力变革。人工智能等新技术的应用将提升信息利用效率,减少企业员工数量。此外,机器人的广泛应用将取代从事流程化工作的劳动力,导致技术与管理人员占比上升,企业人力结构发生变化。

人工智能技术带来的全方位变革

1.2 AI全面进入机器学习时代

随着技术的进步和发展,人类学习知识的途径逐渐从进化、经验和传承演化为了借助计算机和互联网进行传播和储存。由于计算机的出现,人类获取知识的途径开始变得更加高效和便捷。金准产业研究团队预测,在不久的将来,绝大多数的知识将被机器提取和储存。强大的计算机算法将逐渐获得类人的能力,包括视觉、说话的能力和方向感等。在人工智能众多的分支领域中,“机器学习”(Machine Learning)是人工智能的核心研究领域之一。包括89%的人工智能专利申请和40%人工智能范围内的相关专利均为机器学习范畴。最初的研究动机是为了让计算机系统具有人的学习能力以便实现人工智能。机器在现有的知识找到空缺,接着机器效仿人脑并模拟进化,系统化地减少不确定性,识别新旧知识的相同点,并完成学习。

人工智能各层级图示

人工智能核心是算法。作为人工智能的底层逻辑,算法是产生人工智能的直接工具。从历史的进程来看,人工智能自1956年提出以来,经历了三个阶段,这三个阶段同时也是算法和研究方法更迭的过程:第一个阶段是20世纪60~70年代,人工智能迎来了黄金时期,以逻辑学为主导的研究方法成为主流。人工智能通过计算机来实现机器化的逻辑推理证明,但最终难以实现。第二个阶段是20世纪70~90年代,其中,1974到1980年间,人工智能技术的不成熟和过誉的声望使其进入“人工智能寒冬”,人工智能研究和投资大量减少。1980年到1987年,专家系统研究方法成为人工智能研究热门,资本和研究热情再次燃起;1987年到1993年,计算机能力比之前几十年已有了长足的进步,这时试图通过建立基于计算机的专家系统来解决问题,但是由于数据较少并且太局限于经验知识和规则,难以构筑有效的系统,资本和政府支持再次撤出,人工智能迎来第二次“寒冬”。第三个阶段是20世纪90年代以后,1993年到2011年,随着计算力和数据量的大幅度提升,人工智能技术获得进一步优化;至今,数据量、计算力的大幅度提升,帮助人工智能在机器学习,特别是神经网络主导的深度学习领域得到了极大的突破。基于深度神经网络技术的发展,才逐渐步入快速发展期。

人工智能技术发展历史

此外,数据是人工智能底层逻辑中不可或缺的支撑要素,没有数据针对人工智能的数据处理将无法进行。有了数据挖掘对数据的清晰、集成、归约等预处理手段,人工智能才能拥有足够的数据进行学习。随着人工智能技术的迭代更新,从数据生产、采集、储存、计算、传播到应用都将被机器所替代。

数据处理的发展阶段

1.3市场对投资回归理性

从科研和学术的范畴到技术创业,人工智能仅用了几年的时间。这样的转变不仅得益于人们希望新技术解放生产力的要求和政策的扶持,还离不开资本市场对人工智能的助推。随着资本市场对人工智能认知的不断深入,投资市场对人工智能的投资也日趋成熟和理性。金准产业研究团队统计,在过去5年间,中国人工智能领域投资出现快速增长。人工智能的元年2015年,投资总额达到了450亿元,并在2016年和2017年持续增加频次。2019年上半年中国人工智能领域共获融资超过478亿元,获得了不俗的成绩。

中国人工智能投融资变化情况

分析人工智能的投资趋势,主要分为以下几点:易落地人工智能应用场景受投资人追捧。近年投融数据显示,企业服务、机器人、医疗健康、行业解决方案、基础组件、金融领域在投资频次和融资金额上均高于其他行业。从公司层面来看,全球顶级团队、资金实力和科技基因更易受到二级市场投资者的青睐。从行业方面来看,容易落地的新零售,无人驾驶,医疗和智适应教育预示着更多的机会,因此以上领域的公司拥有更多获得投资的机会。

中国人工智能各行业投融资频次分布

投资市场开始青睐底层技术创业公司。有别于前期对应用型人工智能公司的投资偏好,投资市场开始逐渐关注人工智能底层技术的创业公司。做底层技术更易受追捧,由于天花板高,这类公司在市场上更加具有竞争力。由于人工智能底层技术在中国的发展仍落后于美国的,而底层技术是人工智能发展的重要支持,随着人工智能在中国的进一步发展,底层技术的投资的热度将持续增长。获投A及B轮公司占比仍然最高,战略投资开始逐渐增多。目前全国有超过1,300家人工智能企业获得风险投资投资。其中A轮以前的获投频次占比开始逐渐缩小,投资人对A轮仍然保持着较高的热情,目前是获得投资频次最高的轮次。战略投资在2017年开始爆发。随着人工智能市场板块的逐渐成熟,以互联网巨头为主的领军企业将目光投向了寻求长期合作发展的战略投资。这也预示着人工智能行业与产业在资本层面的战略合作开始增多。

2013-2019年上半年人工智能投资轮次

巨头投资人工智能布局在业务关联产业上下游。在人工智能发展的热潮中,嗅觉敏锐的互联网巨头也开始了自己的战略布局。以科技部、中科院国科控股、地方财政局和经信委等机构扶持的科技投资基金以及阿里巴巴、腾讯、百度、京东为首的互联网巨头已经将投资渗透到人工智能的各个板块。从领域来看,各投资机构选择投资的项目均处于其未来产业战略布局的上下游,而这些获投项目也推动着国家人工智能发展战略的落地。例如阿里巴巴投资重点主要在安防和基础组件,获投的代表性公司包括商汤、旷视和寒武纪科技等。腾讯投资的重点主要集中在智慧健康、教育、智慧汽车等领域,代表性的公司包括蔚来汽车、碳云智慧等企业。百度投资的重点主要在汽车、零售和智慧家居等领域。京东投资重点聚集在汽车、金融和智慧家居等领域。而依托中科院体系的国科系则在与芯片、医疗、教育等人工智能技术和应用领域均有涉足。金准产业研究团队认为,随着数字化在各行业中的转型和融合,人工智能在无人驾驶、医疗健康、教育、金融、智能制造等多个领域都将成为巨头的必争之地。

AI领先企业主要投资领域

作为未来的新型行业,人工智能企业呈现出高增长的特征。我们根据不完全的公开信息,以及德勤高科技高成长500强榜单内的人工智能企业进行增长率梳理,筛选出了50家高增长企业。

1.4城市逐渐成为AI创新融合应用主战场

城市是承载AI技术创新融合应用的综合性载体,也是人类与AI技术产生全面感知的集中体验地。过去几年,全球各地的主要城市都在AI技术的发展中发挥了差异化作用,构建了各自的生态体系,并在赋能产业应用、助力区域经济发展方面实现初步效果,掀起了人类对新一轮产业革命的思考、认知和行动。随着AI应用纷纷落地于城市层面,城市逐渐成为AI创新融合应用的主战场。虽然全球各地AI技术的关键成功要素各有差异,但总体而言都构建了有利于技术与城市融合的生态发展体系。我们对超过50个AI技术细分应用行业、100多个AI技术相关的大学及研究机构、200多家头部企业、500多个投资机构、7,000家AI企业、10万名AI领域核心人才的持续跟踪观察,总结了以城市为主体的AI技术及产业生态体系的特点、框架及发展路径。经过综合考虑,金准产业研究团队认为一个城市AI技术创新融合应用程度可主要通过考察以下五大方面:顶层设计:即AI产业扶持政策、特殊立法、数据开放政策及开放程度等;算法突破:即AI芯片等人工智能核心软硬件的研发核心环节等;要素质量:即AI领军人物、资本支持力度、科学家薪酬水平、行业会议影响力等;融合质量:即前沿学科连结性(AI:+Cloud、+Block chain、+IoT、+5G、+Quantum Computing等前沿技术)、创新主体多元性(头部企业、学术机构等)、文化多样性等;应用质量:即金融、教育、医疗、数字政务、医疗、无人驾驶、零售、制造、综合载体发展等。根据全球城市在上述五项指标中的评估表现,德勤评选出最具代表性的三大类共计20个全球AI创新融合应用城市:

2019年20个全球AI创新融合应用城市

1.5 AI支持体系不断发力

作为推动人工智能技术进步的“三驾马车”,算法、数据和计算力在过去的5-10年间不断创新。在算法方面,人类在机器学习的算法上实现了突破,特别是在视觉和语音技术方面的成就尤为突出。在数据方面,移动互联网时代的到来使数据量迎来了爆炸式增长。人工智能算法模型经过长期发展,目前已覆盖多个研究子领域。以机器学习为例,其核心算法包括最小二乘法、K近邻算法、K均值算法、PCA分析法核心
模型包括线性回归、逻辑回归、判定树、聚类、支持向量机等。主流算法模型库使得常见算法模型得到了高效实现:Caffe框架、CNTK框架等分别针对不同算法模型进行收集整合,在算法的开发利用中有很高的实用性。随着大数据技术的不断提升,人工智能赖以学习的标记数据获得成本下降,同时对数据的处理速度大幅提升。宽带的效率提升。物联网和电信技术的持续迭代为人工智能技术的发展提供了基础设施。2020年,接入物联网的设备将增加至500亿台。金准产业研究团队认为,代表电信发展里程的5G的发展将为人工智能的发展提供最快1Gbps的信息传输速度。在计算力上,得益于芯片处理能力提升、硬件价格下降的并行使得计算力大幅提升。截至目前,全球人工智能的计算力主要是以GPU芯片为主。但随着技术的不断迭代,如ASIC、FPGA在内的计算单元类别将成为支撑人工智能技术发展的底层技术。

中国人工智能芯片市场规模与增速预测(2016-2020)

1.6顶层政策倾斜力度持续增加

人工智能对社会和经济影响的日益凸显,各国政府也先后出台了对人工智能发展的政策,并将其上升到国家战略的高度。截至目前,包括美国、中国和欧盟在内的多国和地区颁布了国家层面的人工智能发展政策。

各国针对人工智能出台的政策

时至2019年,中国政府继续通过多种形式支持人工智能的发展。此前,中国形成了科学技术部、国家发改委、中央网信办、工信部、中国工程院等多个部门参与的人工智能联合推进机制。从2015年开始先后发布多则支持人工智能发展的政策,为人工智能技术发展s和落地提供大量的项目发展基金,并且对人工智能人才的引入和企业创新提供支持。这些政策给行业发展提供坚实的政策导向的同时,也向资本市场和行业利益相关者发出了积极信号。在推动市场应用方面,中国政府身体力行,直接采购国内人工智能技术应用的相关产品,先后落地多个智慧城市、智慧政务等项目。从战略层面来看,《新一代人工智能发展规划》是中国在人工智能领域进行的第一个系统部署文件,具体对2030年中国新人工智能发展的总体思路、战略目标和任务、保障措施进行系统的规划和部署。规划根据中国人工智能市场目前的发展现状分别对基础层、技术层和应用层的发展提出了要求,并且确立中国人工智能在2020、2025以及2030年的“三步走”发展目标。

1.7全球AI市场超6万亿美元

人工智能将提升社会劳动生产率,特别是在有效降低劳动成本、优化产品和服务、创造新市场和就业等方面为人类的生产和生活带来革命性的转变。全球范围内越来越多的政府和企业组织逐渐认识到人工智能在经济和战略上的重要性,并从国家战略和商业活动上涉足人工智能。全球人工智能市场将在未来几年经历现象级的增长。金准产业研究团队预测未来2025年世界人工智能市场将超过6万亿美元,2017-2025年复合增长率达30%。

全球人工智能市场规模

从行业来看,传统市场规模较大的领域将继续领跑,2030年制造业,通信、传媒及服务,自然资源与材料将分别以16%,16%,14%占据前三名。其中,庞大的制造业企业已经开始加速数字化转型,推动智能管理、智能工厂、智能物流等全方位智能化,因而制造业也是其中增速最快的领域。同时,在新领域中,教育领域人工智能技术的应用也开始向学习全过程渗透,增长速度也是不容忽视。

人工智能市场规模(按行业分类)

我国的人工智能核心产业规模目前已超过1,000亿元,金准产业研究团队预计到2020年将增长至1,600亿元,带动相关产业规模超一万亿元。其中北京、上海、浙江、江苏、广东的人工智能相关产业规模位于所有省份和直辖市前列,预计2020年分别可达到1,400亿、1,300亿、2,700亿、1,000亿和2,800亿。以上海为例,上海自推出《关于本市推动新一代人工智能发展的实施意见》以来,人工智能产业发展加速,2019年相关产业规模可达到1200亿元。依托长三角的区位优势,上海人工智能企业在人才、资本方面都能获取到充足且优质的资源,企业集群带来的效益提升显著,有利于公司和行业规模的持续扩大。

1.8京津冀、长三角、珠三角AI企业云集

人工智能技术进入商业应用阶段后,已经逐步在众多行业得到应用,其发展前景受到政府、企业等社会各方的普遍认可,毫无疑问已经成为影响经济发展的重要力量。各地政府为推动产业升级,实现经济新旧动能转换,纷纷颁布与人工智能产业相关的产业规划指导意见,提供税收优惠、资金补贴、人才引入、优化政务流程等措施优化营商环境,吸引有实力的企业入驻,同时培育本地人工智能企业。

中国人工智能企业分布情况

在政策与资本双重力量的推动下,人工智能企业数量快速上升,据不完全统计,中国各地人工智能企业超过4,000家,京津冀、珠三角、长三角是人工智能企业最为密集的地区。同时,由于有大量的传统制造业需要利用人工智能技术进行智能化升级,再加上政府政策的支持,西部川渝地区也成为人工智能企业的聚集区域。从城市层面来看,北京、上海、深圳、杭州市是聚集人工智能企业数量最多的城市,均超过了600家,处于第一梯队。投融资金额:北京、上海人工智能初创企业融资金额最多。活跃的资本环境将对支持人工智能初创企业提升技术、获取用户、拓展市场有积极影响,促进人工智能产业链上下游企业形成规模效应,从而提升城市人工智能产业实力。

各城市人工智能初创企业融资金额(2015年-2019年上半年)

初创企业在新技术的研发与商用方面承担开拓者的作用,初创企业获得的融资金额在一定程度上代表了该地区在新技术的发展前景。人工智能技术已经步入商用阶段,其应用范围已经拓展至金融、交通、医疗、生产制造等多方面,初创企业获得更多的融资金额意味着更多的资金将推动人工智能渗透更多行业。在初创企业获得的融资金额方面,自2015年以来,北京、上海人工智能初创企业融资金额均超过500亿元,分别为1,599亿元与582亿元。这是因为北京、上海聚集中国大部分的人工智能初创企业,企业技术实力雄厚,同时客户对新技术的接受度更高,因而拥有更为广阔的应用市场。科研院校与机构实力差异明显:北京实力雄厚,上海依靠高校,深圳依靠企业,杭州相对单一。科研院校与机构是人工智能技术研发的重要场所。中国人工智能论文数量自2014年超过美国,并且远超其他国家,这与人工智能科研院校与机构的快速发展密不可分,同时,科研院校与机构也是人工智能专利申请的主要力量。因而,分析各城市人工智能科研院校与机构能够帮助了解该城市的技术力量。

各城市人工智能科研院校与机构特点

人工智能人才:集聚经济发达地区。人工智能竞争归根结底是人才的竞争。中国人工智能人才分布不均,主要集中于京津冀、长三角以及珠三角地区,此外中西部也已经形成一定的人才聚集,主要分布在长江沿岸。从各城市人工智能人才占比来看,北京最具优势,占比近28%,是第二名上海(12.1%)的两倍。深圳、杭州占比均低于10%,位居第二梯队。

各城市人工智能人才数量占比

各高校发表人工智能国际论文数占比

城市智能化管理:受政策影响较大,深圳、上海、杭州先行。智慧城市框架下实现城市管理效率的提升主要通过利用信息技术实现政务系统的信息化,进而推动各领域数据交汇,从而为智能城市管理提供数据支持。深圳、上海和杭州的智能城市管理得分更高。这些城市政府信息化起步较早,数字鸿沟大大缩小,普遍实现部门资源共享、协同办公和网上审批。北京由于特殊地位,政府在实施智能城市管理时需要有更多的考量,因而排名较为靠后。

二、人工智能技术发展腾飞

2.1人工智能关键技术日趋成熟

人工智能在最近十年的进展迅速,包括机器学习,自然语言处理,计算机视觉、智适应技术等领域都得到了长足的发展。据清华大学数据显示,计算机视觉,语音,自然语言处理是中国市场规模最大的三个应用方向,分别占比34.9%,24.8%和21%。

人工智能应用技术热点排名

快速成熟的计算机视觉技术:计算机视觉是计算机代替人眼对目标进行识别、跟踪和测量的机器视觉。计算机视觉的应用场景广泛,在智能家居、语音视觉交互、增强现实技术、虚拟现实技术、电商搜图购物、标签分类检索、美颜特效、智能安防、直播监管、视频平台营销、三维分析等方面都拥有长足的进步。在该领域科技巨头和独角兽聚集,代表性的企业和科研机构包括百度、腾讯、海康威视、清华大学、中科院等。百度开发了人脸检测深度学习算法Pyramid Box;海康威视团队提出了以预测人体中轴线来代替预测人体标注框的方式,来解决弱小目标在行人检测中的问题。腾讯优图和香港中文大学团队在CVPR2018提出了PANet,在MaskR-CNN的基础上进一步聚合底层和高层特征,对于ROIAlign在多个特征层次上采样候选区域对应的特征网格,通过智适应特征池化做融合操作便于后续预测。此外,上海云从科技、深兰科技、七牛在内的计算机视觉的创新企业在计算机视觉方面都拥有领先技术。巨头必争的语音识别技术:语音识别通过信号处理和识别技术让机器自动识别和理解人类的语言,并转换成文本和命令。其应用场景涉及智能电视、智能车载、电话呼叫中心、语音助手、智能移动终端安、智能家电等。在语音识别技术方面,百度、科大讯飞、搜狗等主流平台识别准确率均在97%以上。与此同时,包括上海云知声在内的新兴创业企业在语音识别行业占有一席之地。科大讯飞拥有深度全序列卷积神经网络语音识别框架,输入法的识别准确率达到了98%。搜狗语音识别支持最快400字每秒的听写。阿里巴巴人工智能实验室通过语音识别技术开发了声纹购物功能的人工智能产品。自主无人系统技术落地在望:由于AI和机器学习的不断进步,无人车,无人机以及医疗机器人的技术都得到了显著的发展,其根本原因归功于自主无人系统算法的支撑。深度学习已经证明具有出色的能够处理复杂任务的能力。现代计算设备,比如图形处理单元(GPUs)和计算框架如Caffe,Theano和Tensor Flow有助于设计者和工程师建立具有创新性的无人自主系统。阿里巴巴人工智能实验室开发单车智能系统,实现了全场景、全天候的厘米级定位。百度的无人驾驶技术包含障碍物感知、决策规划、云端仿真、高精地图服分、销到端的深度学习(End-to-End)等五大核心能力。地平线推出了针对自动驾驶的深度学习处理器IP及其重点面向自动驾驶领域的平台。在产业应用方面,上海西井科技已经在无人货运方面进行了探索。人工智能自适应学习技术日趋成熟:作为教育领域最具突破的技术,人工智能自适应学习(Intelligent Adaptive Learning)技术(以下简称智适应学习),模拟了老师对学生一对一教学的过程,赋予了学习系统个性化教学的能力。和传统千人一面的教学方式相比,智适应学习系统带给了学生个性化学习体验,提升了学生学习投入度、提高了学生学习效率。智适应学习技术在美国和欧洲使用时间超过十年,各年龄段都有大量用户使用,累积用户超过一亿。产品和技术方面都打磨的比较完善。相对来说,智适应学习技术在国内积累的数据量稍有落后,处在初步发展阶段。优势在于,中国人口基数大、发展速度快,未来有望后来者居上。在国内,以松鼠AI为代表的智适应教学企业在遗传算法、神经网络技术、机器学习、图论、概率图模型、逻辑斯蒂回归模型、知识空间理论、信息论、贝叶斯理论、知识追踪理论、教育数据挖掘、学习分析技术等都实现了技术积累。

2.2人工智能开放平台建设稳步推进

广阔的产业及解决方案市场是中国人工智能发展的一大优势。金准产业研究团队认为,以上优势的形成除了得益于大量的搜索数据、丰富的产品线以及广泛的行业提供的市场优势,还因为各大国内外的科技巨头对开源科技社区的推动,帮助人工智能应用层面的创业者突破技术的壁垒,将人工智能技术直接应用于终端产品层面的研发。从行业来看,人工智能已经在医疗,健康,金融,教育,安防等多个垂直领域得到应用。随着人工智能技术的商用加快,包括科技巨头和新兴人工智能创业公司形成了自己的技术优势。为更大程度的利用技术优势扩大自身的商业优势,以及扶持人工智能行业的发展,技术领先的人工智能企业开始构建自己的人工智能开放平台。人工智能平台是提供构建人工智能应用的工具。这些工具结合了智能、决策类算法和数据,使开发者可通过平台创建自己的商业解决方案。一些人工智能平台提供预设的算法和简易的框架,人工智能平台具备“平台即服务”(PaaS)的功能,可提供基础的应用开发;一些则需要开发者自行开发和编程。这些算法可以功能性的支持图片识别、自然语言处理、语音识别、推荐系统和预测分析等一系列的机器学习的相关技术。人工智能开放平台的搭建旨在打造从源头技术创新到产业技术创新的人工智能产业链。开放的平台连接的产业链的两端。一方面它可以连接了开发者和一些研究机构。另一方面可以连接许多下游的企业,比如一个以图像识别为主的人工智能开放平台,可以将相关技术能力开放给希望在图像识别领域开辟业务的创业团队。

国内外技术及应用开放平台

2017年,科技部等部门经充分调研和论证,确定了首批国家新一代人工智能开放创新平台:分别依托百度、阿里云、腾讯、科大讯飞公司,建设自动驾驶、城市大脑、医疗影像、智能语音4家国家新一代人工智能开放创新平台。2018年9月,科技部依托商汤建设智能视觉国家新一代人工智能开放创新平台。从目前的技术成熟度来看,教育、零售政务等多个领域已经拥有了以核心技术为驱动的应用开放平台:

2.2.1自动驾驶国家开放平台

“自动驾驶国家开放平台”主要基于百度Apollo平台,是一个以百度技术为依托,对外提供开放、完整、安全的软硬件和服务平台,帮助开发者搭建完整的自动驾驶系统。2019年8月百度Apollo无人车通过长沙测试,完成了全国首例L3、L4等级别车型的高速场景自动驾驶车路协同演示。至此,百度L4级别自动驾驶城市道路测试里程已经正式突破200万公里,百度的阿波罗开放平台合作方超过120余家,覆盖产业链各个环节,包括整车厂,零部件厂商、出行服务商、初创企业、通信企业、高校和地方政府等。厦门金龙、宝马、戴姆勒均与Apollo平台进行了合作,“阿波罗”已在北京雄安、深圳、福建平潭、湖北武汉、日本京都等地开展商业化运营。

2.2.2城市大脑开放创新平台

依托阿里云建设的城市大脑国家人工智能开放创新平台,以城市大脑系统为蓝本,为城市安治理、城市公共服务及其他各行业的智能应用构建起开放、多元的生态体系,为新一代人工智能技术在智能社会各个域中的创新应用提供支撑服务。算法系统平台可优化大规模视觉计算平台,全时全域交通自动巡逻报警系统能够对城市里面的交通事件、事故进行全方位的实时感知,识别准确率达到95%以上;车流人流预测系统,通过区域内的历史和实时视频数据,实时准确地预测全区域未的车流、人流的清空。开发平台的应用部署主要在交通方面:城市统一数据融合引擎、车流人流预测系统、大规模数据融合控制引擎、城市整体交通态势检测系统等构建。目前,项目平台己累计向杭州、衢州、上海、嘉兴以及澳门、吉隆坡等政府客户提供了上千台专有云服务器的计算资源,支持对海量多路视频数据实时分析处理。城市大脑算法团队向公安、交通与市政相关客户提供输出了图像检测、识别、分割等多种算法服务。以杭州城市大脑为例,银江科技与浙大中控合作,实时计算视频、线圈、微波、互联网的全景数据,让交警的交通管控经验与城市大脑的红绿灯配时策略优势叠加,在杭州市城区、萧山区、余杭区的实践中效果显著。

2.2.3医疗影像开放创新平台

腾讯觅影”AI影像已实现了单一病种到多病种的应用扩张,从早期食管癌筛查拓展至肺癌、糖尿病视网膜病变、乳腺癌、结直肠癌、宫颈癌等疾病筛查。AI轴诊平台能够辅助医生诊断、预测700多种疾病,涵盖了医院门诊90%的高频诊断。腾讯公司构建了由医疗机构、科研团体、器械厂商、AI创业公司、信息化厂商、高等院校、公益组织等多方参与的医疗影像放创新平台。平台连接了创新创业、全产业链合作、学术科研、惠普公益四个维度核心参与方,旨在推动国家人工智能战略在医疗领域的落地。目前,基于“腾讯觅影”的医疗影响开放平台己与国内一百多家医院达成合作,累计为医院读片1.06亿张,累计服务95万患者,提示高风险病变13万例,累计分析门诊病历614万份。

2.2.4智能语音开放创新平台

国家智能语音人工智能开放创新平台主要是基于科大讯飞公司的语音平台技术建立。新建了人工智能研究中心以及数据中心。截至2018年10月底,平台开发者团队数量已超过86万家,围绕平台入驻企业已超过200家,已形成了覆盖技术研发、基础平台、物联网、智能硬件等完整人工智能产业链。目前,主导和参与6项智能语音相关国家标准获批正式发布,构建了智能语音技术与应用领域自主知识产权和标准体系,形成可持续的产学研系统创新机制。科大讯飞的智能语音核心技术领域包括:语音合成技术、语音识别技术、机器翻译技术、语音评测技术、认知智能技术。在开源方面,平台开放核心技术开发接口和云端在线服务能力,截至2018年10月底,平台开发者团队数量已超过86万家。其产业链服务平台汇聚了方案商、工业设计资源、销售渠道、生产供应链资源等。在开发者服务社区基础上,结合地方政府支持,目前已在合肥、长春、洛阳、西安、重庆、天津、苏州建设了七个线下专业化众创孵化空间,总面积超过十万平来,引进落地的智能语音及人工智能领域开发者团队和公司五百余家。

2.2.5智能视觉开放创新平台

国家智能视觉开放创新平台主要是基于商汤科技视觉平台技术上的优势建立。商汤科技的智能视觉开放创新平台主要在智能视觉工具链核心基础研发、实现智能视觉底层关键技术突破、建立人工智能国际化人才体系,旨在推动国家人工智能在视觉领域的发展。商汤科技的核心技术包括人脸检测跟踪、人脸关键点定位、人脸身份验证、场景识别等。目前,商汤的平台包括:视频内容审核平台、城市级视觉分析平台、驾驶员监控系统以及增强现实平台等一系列平台。在安防、商业、金融等多种场景均提供了解决方案。比如在安防领域,公安系统通过视图情报研判系统对于可疑人员的身份进行查询。在商业领域,通过与大型零售商合作,利用人脸识别功能实现无人购物、支付验证等方面的应用:在金融领域,通过使用身份验证技术可以有效降低金融风险,提升客户的使用体验。

2.2.6智适应教育开放平台

国务院《中国教育现代化2035》提出“建设智能化校园,统筹建设一体化智能化教学、管理与服务平台。利用现代技术加快推动人才培养模式改革,实现规模化教育与个性化培养的有机结合”。目前,作为人工智能应用领域中技术成熟度较高的教育行业已经在技术、内容和数据上积累了大量且分散的资源,为了推动行业的快速发展以及国家人工智能发展的目标,人工智能教育企业开始探索教育开放平台。其中,以松鼠AI为代表的人工智能教育公司正在成为国内智适应教育平台的先行者。如上述五大国家人工智能开放平台,智适应开放平台的搭建旨在连接产业链的上中下游。具体到教育行业,即智适应教育提供的是一套个性化教学解决方案,可以为平台提供更多的数据和更加丰富的学生画像,有助于平台智适应能力的迭代与进化。众包合作者通过对内容,教学逻辑,产品体验的优化与创新能为平台提供更坚实的内容基础与更丰富多样的个性化能力。智适应能力的接入合作者可以帮助平台从智适应算法引擎核心上优化,提升并扩展为更通用更高效的智适应引擎。

2.3人机大战谁更能更胜一筹?

人工智能是使用机器代替人类实现认知、识别、分析、决策等功能,是研究使计算机来模拟人的某些思维过程和智能行为的学科,主要包括研究计算机实现智能的原理、制造类似于人脑智能的计算机,使计算机能实现更高层次的应用。人工智能涉及到计算机科学、心理学、哲学和语言学等多门学科。人工智能技术发展的重要评判标准很大程度上评判的是他的能力是否能够达到或超过人类的能力。若将人工智能的水平与人类相比,大致可以分为:弱人类级,强人类级,超越人类级。人工智能在不同领域的发展水平各不相同,而以上因素成为了影响人工智能技术发展状态的关键因素:规则和评价方法的明确程度:简单明确可被计算机量化评估的领域,如棋牌、游戏等。特殊情况频率出现高低:在典型场景下的处理和在包含各种特殊异常情况下处理。如人脸识别和自动驾驶。从“不确定性”的角度来说,机器也有优势。训练数据的规模:现实领域里,很多训练数据的积累工作才刚刚开始。如,监督式学习所需要的“标记数据”往往需要大量的人工参与,成本很高,大大制约了人工智能在相关领域里水平的提升。外部环境因素:另外,受到政策因素的限制,例如医疗数据,或者有些数据被部分行业企业垄断,这些都导致数据难以流通,人工智能的水平提升也就比较缓慢。

全球人工智能应用技术专利占比(截至2018年上半年)

2.3.1阶段一:近期,超越人类的人工智能技术

IBMDeep Blue到Open AI Five,小到棋牌、辩论、电子竞技,大到医疗、教育领域,“人机大战”兼具验证企业技术实力和推动人工智能科普引发更多受众关注的双重任务,正成为各领域验证人工智能技术成熟与否的重要形式。在2015年,微软和谷歌研发出超过人类技能的图像识别技术。百度研发出超过人类能力的语音识别技术。据世界知识产权统计,人工智能应用技术中,计算机视觉(computer vision)以49%的占比和24%的增速成为2013年至2016年申请专利注册中最热门的技术。依次分别为占比14%的自然语言处理(NLP)和占比13%的语音处理(speech processing)。在计算机视觉的细分类别中,生物识别(biome trics)和场景理解(scene understanding)分别以年均31%和28%的增速排名前列。语音处理的细分领域中,语音识别(speech recognition)和声纹识别(speaker recognition)的增速均达到12%。在教育领域,与人类老师相比,如今的智适应教育技术在教学效果、用户体验和测试分数等多个方面已经比肩甚至超过人类。目前包括Knewton、松鼠AI、Realizeit、ALEKS在内的国内外智适应教育企业以均通过“人机大战”形式对人工智能教育技术与人类教授的做出了实验型的对比。计算机视觉。计算机视觉是眼和脑的结合,包含成像、感知与理解。计算机视觉的能力现今已经超越了人类。特别是在人脸识别、图像分类等众多任务中,计算机视觉能比人类视觉完成的更优秀。在感知上,机器已比人眼更加敏锐,能取得比人眼更多的信息,如图像准确的深度信息,图像识别率比人类更高;此外,机器在理解层面,某种意义上也能模仿人类作出一些有创造性的活动。从2016年ILSVRC的图像识别错误率已经达到约2.9%,远远超越人类的5.1%,其挑战项目包括物体检测(识别)、物体定位、视频中目标物体检测三大部分。从训练数据来看,计算机视觉依托了大量的数据且不受人类限制。由深度学习驱动的计算机视觉现已超越人类,主要在于深度学习是由纯数据驱动,不再受限于人类的意志。机器视觉在某种意义上进行的是基于数据的区别于人的理解活动。语音识别。语音识别技术在20世纪50年代诞生于贝尔实验室。在20世纪80年代末,卡耐基梅隆大学推出了第一个高性能的非特定人、大词汇量连续语音识别系统值得一提的是,汉语语音识别先英语一步超越人类平均水平。2015年,百度表示百度汉语语音识别技术词错率低于人类平均水平。2018年12月,依图短语音听写的字错率(CER)仅为3.71%,大幅提升了语音识别技术的准确率。随着时间的推移,目前语音识别技术的准确率仍在不断提升。语音识别技术这种“机器感知”类的技术目前已经相对成熟,制约语音交互发展的更多原因在语义理解这种“机器认知”的部分,这一部分受限于训练方式、样本标记数据量、计算量等多个方面。

语音和视觉技术成熟度

人工智能教育。与围棋、游戏等规则明确、数据完整的系统相比,教学系统的复杂程度远高于他们,其涉及到的学科包括了教育学、心理学、认知学等复杂的过程。智适应学习(adaptive learning)是一种结合人工智能、数据挖掘、认知科学、教育学、心理学、行为科学和计算机科学的技术,其最终目的是让智适应学习系统在一定程度上能够模拟人类教师的角色,根据学习者的学习目标、学习行为、偏好和学习状态,利用特殊的教学策略动态地调整学习内容,以达到个性化教学的目的。通过AI技术模拟了优秀特级教师的知识经验和教学方法,针对学生的特性给予个性化辅导,最大化学习效率。利用机器学习的技术实时动态调整学生接下来的学习内容和路径,而非传统教育需要大纲进度或老师的安排进行统一的学习。人工智能在教育领域的发展可能进一步解决当下关于教育资源分配不均引发的多个的社会问题。另外,由于人工智能技术在教育行业的应用和落地技术的成熟只是先决条件,要促成真正的人工智能教育的普及,还需要企业对于优质教育资源的整合能力和信息库建立,算法优势,样本数量,与政府、学校和教师的协调使智适应技术获得市场的认可。

2.3.2阶段二:210+年,有希望突破人类平均水平的技术

人工智能在如语音识别和视觉识别等单独技术的能力正在急速提升,并快速应用到多个商用领域。然而随着人工智能在商业领域的快速发展,涉及的领域和范围日渐复杂,单独的技术方案无法满足行业的应用需求。如无人驾驶、智能医疗等应用技术均涉及到了多个人工智能应用技术的领域。从学术研究、专利申请再到产业应用,人工智能技术的商业化应用会经历漫长的过程。其中,专利应用的初衷是实现产业化应用的技术方案,而通常专利用会比科学论文的发表滞后余约10年的时间。据世界专利组织统计,科学文章到专利发表的比例正在下降,这也预示着行业对人工智能技术的实际应用更感兴趣。从2006到2019年间,交通出行行业成为人工智能技术应用最迅速的行业。2006年交通行业的人工智能应用仅占专利应用总数的20%,而截至2019年,人工智能三分之一应用到了交通出行行业。2019年,无人驾驶和医疗是当前两个热门的人工智能技术,因其实现将但极大的改善社会资源配置和改变人类的生活方式。由于技术的壁垒,仍然处在试用和并未完全商用阶段的技术。实现完全无人驾驶仍待时日。无人驾驶最终的目标是实现真正自主,使得乘坐者除了注意路况外,还可以做其他活动。需要在硬件和软件两方面都取得进步。在硬件方面,激光雷达可能花费数万美元,这使得大规模部署成本太高;在软件方面,工程师需要找到一种方法来使AI具备归纳、区分不同物体的能力。自动驾驶汽车依靠人工智能、视觉计算、雷达、监控装置和全球定位系统协同合作。

无人驾驶技术分布

依据规则和评价方法的明确程度、特殊情况频率出现高低以及训练数据的规模三个评判标准来衡量,无人驾驶技术尚未像图像识别和语音处理一样达到或者超过人类的能力范围。而无人驾驶技术尚未能够达到人类的判断力。“完全的无人驾驶汽车(L4-L5级)市场成熟前,业界首先必须做到以下三点,第一是汽车必须有360度全方位感知能力,包括LiDAR、光学传感器和毫米波雷达等;第二是汽车必须配备高精度数字地图,定位精度必须做到10cm以内;第三是市场必须建立一个车辆、行人都认知并接受的交通规则或避让准则,而且,车辆必须拥有类似人类的感知推理决策能力,因为人类很可能会不遵守交通规则或表现得犹豫不决、或进或退。”与此同时,无人驾驶的发展并不是单纯的技术发展,它还需要法律法规,意识甚至是包括保险和政府的基础设施建设等外围的整体配套支撑。”因此,无人车替代其他汽车的过程是漫长的循序渐进的,在这个过程中必须优先考虑无人车与人类司机共存的情况。人工智能医疗应用欠缺可行的规则和标准。依据规则和评价方法的明确程度、特殊情况频率出现高低以及训练数据的规模三个评判标准来衡量,人工智能医疗在仍然处于发展中期,要实现完全替代医生的能力,还需要很长一段路要走。以智能诊断为例,人工智能帮助进行辅助诊断在医疗责任认定方面也存在问题和挑战。用户在使用医疗虚拟助手表达主诉时,可能会漏掉甚至错误地进行描述,导致虚拟助手提供的建议是不符合用户原本的疾病情况的。

人工智能医疗涉及的技术

从规则和评判方法来衡量,医疗信息标准的缺失也造成了人工智能在医疗方面应用的难题。人工智能是强数理、强逻辑的工具,对于内容的精准度和标准化要求很高。如对于医疗图像的病灶标注,即使是同一个科室的医生也可能有不同的标注方式,还有就是病历,患者的电子病历数据很难保证完全准确同步,不同的医生对于各个病种的名称叫法都会存在地域差异。由于医疗病症繁杂且特殊情况的频率高,且关乎民生一旦出现任何差错可能危及生命,因此各国对于新技术的准入机制管控十分严格。目前监管部门禁止虚拟助手软件提供任何疾病的诊断建议,只允许提供用户健康轻问诊咨询服务。我国监管部门对于利用人工智能技术提供诊断功能是审核要求非常严格。在2017年CFDA发布的新版《医疗器械分类目录》中的分类规定,若诊断软件通过算法提供诊断建议,仅有辅助诊断功能不直接给出诊断结论,则按照二类医疗器械申报认证;如果对病变部位进行自动识别并提供明确诊断提示,则必须按照第三类医疗器械进行临床试验认证管理。从训练数据的规模来衡量,医疗数据仍然存在诸多问题。虽然中国的医疗数据整体量很大,但是具体到某一类医疗问题时还存在数据量不够大的问题。同时数据的质量也不够高,例如医疗影像,必须要有临床经验丰富的医生对数据进行标注后才能拿给机器学习,这种高质量的、标注过的数据资源相对有限。目前,三甲医院拥有绝大多数影像数据和经验丰富的医生,最有能力帮助人工智能企业做出好的模型。

2.3.3阶段三:2099年,强人工智能的时代?

强人工智能是指在各方面都能和人类比肩的人工智能,因此强人工智能不是仅限于某一领域,而是让机器人全方位实现类人的能力。强人工智能能够进行思考、计划、解决问题、抽象思维、理解复杂理念、快速学习和从经验中学习。目前有一种认为是,如果能够模拟出人脑,并把其中的神经元、神经突触等全部同规模地仿制出来,那么强人工智能就会自然产生。当前我们正处于弱人工智能阶段。弱人工智能的产生减轻了人类智力劳动,类似于高级仿生学。无论是阿尔法狗,还是能够撰写新闻稿和小说的机器人,目前仍然还只属于弱人工智能范围,它们的能力仅在某些方面超过了人类。数据和算力在弱人工智能时代不言而喻,其推动了人工智能的商业化发展,在强人工智能时代以上两个因素仍然是最重要的因素。与此同时,以谷歌和IBM为代表的科技巨头在量子计算上的研究也为人类进入强人工智能时代提供了强大助力。

强人工智能代表公司及研究概况

据《智能架构》书中描述,当今AI理领域的商业和研究专家,Deep Mind首席执行官Demis Hassabis,谷歌AI首席执行官Jeff Dean和斯坦福人工智能负责人李飞飞等预测的平均值,强人工智能时代可能需要到2099年实现。虽然以上的预测只是简单的猜测,但从这些预测中的各种偏差中,我们可以看出强人工智能的实现仍然需时日。然而,为了实现强人工智能。许多来自大型科技公司和各类小公司的研究团队正在为构建强人工智能做出贡献。如谷歌Deep Mind和谷歌研究都采取了具体的措施来实现强人工智能,如Path Net(训练大型通用神经网络的方案)和evolutionary architect research AutoML(图像分类寻找良好神经网络结构的方法)。此外,包括特斯拉创始人埃隆·马斯克创立、亚马逊Web Services部分支柱的OpenAI也在以强人工智能为目标进行大量研究,OpenAI还创建了两个特殊的任务:“体育馆”和“宇宙”,以测试正在开发的强人工智能的技能。


金准产业研究 英特尔存储黑科技升级数据中心分析报告 2019-09-30 10:30:11

前言

随着云计算、AI、物联网等新兴技术的普及,越来越多的企业通过海量数据分析改进运营能力和服务质量,最终提升自身竞争力。金准产业研究团队认为,面对爆发式增长的数据,更大、更快、更经济且具有数据持久性的存储日益成为数据中心的刚需。传统的数据存储层次结构已经维持了许多年,而随着数据爆发式增长,动态随机存取存储器(DRAM)和固态盘(SSD)在成本和速度上的固有差距,都变得越来越令企业头疼。DRAM一断电就会丢数据,容量小、扩展成本高;固态盘容量大、便宜但访问速度慢。两者间的传输带来巨大的延迟带宽损失,数据中心亟待能填补短板的创新技术。在这一背景下,集二者之所长的黑科技——持久内存应运而生。昔日DRAM霸主英特尔,正是首批将这一黑科技推向市场的主力军。凭借媲美存储器的高吞吐量与耐用性,以及接近内存的低延迟和超快速度,英特尔傲腾数据中心级持久内存(傲腾DC持久内存)正成为谷歌云、BAT、思科、戴尔、联想等国内外各大数据中心经济高效的存储“新宠”。

一、存储在英特尔中的战略地位

作为英特尔的六大支柱之一,内存和存储自英特尔诞生起就扮演着至关重要的角色。尽管英特尔因CPU而闻名,但它刚创立时最早推出的产品是1.024bit的动态RAM 1103。终结磁芯存储器时代的同样是英特尔。当今市面上最常见的系统内存DRAM尽管是由IBM研究人员于1966年发明,但四年后,首先实现量产并将DRAM每bit存储降到1美分的是英特尔。四十余年过去后,英特尔又携全新存储品类归来,欲以革命性的新技术,将统治数据中心多年的传统数据存储层级结构重新定义。

 

英特尔的六大技术支柱之内存&存储

内存原分三级,CPU/GPU中的缓存最快,其次是直接被CPU访问的内存DRAM,最慢的是存储。三级间的速度差可达百倍至千倍,会严重牵制大数据存储和访问。对此,英特尔在原有三级结构中加入几级新的存储技术。缓存和DRAM间插入封装内存,DRAM与存储之间则新增三级,包括傲腾DC持久内存、傲腾固态盘(3D XPoint)和QLC 3D NAND固态盘。新增层级后,每一层的速度差仅有10倍,存储结构变得更为平滑,填补了原有层级间的空白,在数据中心存储领域形成合力。其中,傲腾DC持久内存将更多工作负载迁移到离CPU更近的地方保存,能提供比DRAM快16倍的低延迟和高10倍的容量,在内存带宽不是关键瓶颈的应用中,对实现真正的大内存高性能数据中心存储至关重要。英特尔副总裁兼英特尔至强产品与数据中心营销总经理Lisa Spelman认为,傲腾DC持久内存将改变从云、数据库、高性能计算,到内存分析和内容分发网络等关键数据工作负载。

二、突破存储瓶颈的两种工作模式

大容量、高并发性、经济性是衡量存储性能的关键指标,同样也是英特尔傲腾DC持久内存主攻的三座高山。傲腾DC持久内存介乎内存和固态盘之间,同样兼具两者的优势,提供128GB、256GB和512GB三种容量,容量上优于上限为128GB的DRAM,单位容量价格也比DRAM更低。

采用傲腾DC持久内存部分替代DRAM内存,能最大程度降低从新系统内存获取数据的高延迟,加快数据中心内存数据库的读取速度。傲腾DC持久内存可无缝插入DDR4内存插槽,并根据数据中心的不同需求,提供两种工作模式。

2.1 App Direct模式:持久性、更耐用

App Direct模式的一大特点即是持久性。基于其一致的缓存,这一模式下的傲腾DC持久内存能提供更大容量、更高耐用性和更高带宽,可灵活适应不同的内存工作负载。傲腾DC持久内存可直接与软件、应用通信,从而降低堆栈复杂性。其子集Storage over App Direct可使用传统存储API,能像固态盘一样运行并启动操作系统。应用和操作系统可以指示哪类数据读写适用于哪类内存。比如,需要低延迟、不需要数据持久性的数据存储操作可以放在DRAM执行,而需要大容量、持久性的数据存储操作则放在傲腾DC持久内存上执行。

2.2内存模式:易失性、经济实惠

内存模式下的傲腾DC持久内存近似于一个大容量DRAM内存池,和DRAM一样具有易失性。金准产业研究团队分析,当从内存请求数据时,内存控制器会先检查DRAM高速缓存,如果数据不在DRAM中,则从傲腾DC持久存储读取数据的延时稍长。以这样的方式,可无缝为传统应用提供低成本的大容量内存。虚拟化数据库部署和大数据分析应用程序是内存模式的理想选择。有利于虚拟化内存数据库,内容交付网络和分析等功能。随着内容容量增加,无需重写软件即可有效提升虚拟机、容器和应用的密度。除了以上两种模式外,傲腾DC持久内存也可在双重模式下运行,通过预配置,让部分傲腾DC持久内存处于内存模式,其余部分处于App Direct模式,充分利用高性能存储。另外,为满足当今数据中心的安全需求,它支持AES-256硬件加密技术。在内存模式下,加密密钥在断电时被删除,下次引导时再重新生成。基于不同工作模式,傲腾DC持久内存既可以作为高性能存储池,也可以选择应用托管内存,能为云和虚拟化用户提供更大容量和更大内存池。

三、解构痛点

3.1解构痛点一:数据恢复耗费时间

数据库是最易受系统内存限制的应用之一,如果访问的数据不在内存里,需花费更多时间和功耗来搬运数据。在对性能要求极高的环境中,内存数据库通常把全部数据访问控制都放在内存中进行,以保证足够高的读写速度。DRAM的数据易失性是数据库存储的常见问题,一旦系统断电重启,数据恢复往往要花费几分钟到几小时。比如NoSQL关键值数据库Aerospike企业版的索引通常就存储在DRAM中,系统一重启DRAM索引就会被擦除,重建过程可能要花数小时。这种情况下,傲腾DC持久内存App Direct模式的大容量和持久性就凸显出价值。据英特尔数据中心内存和存储营销总监Kristie Mann介绍,傲腾DC持久内存可以为数据中心提供高达3倍(36TB)的系统内存容量,系统重启从几分钟缩至几秒,每个节点虚拟机增加36%,而广泛使用的开源分布式通用集群计算框架Apache Spark性能提升可高达8倍。经过长期研发和调整,英特尔傲腾DC持久内存通过显著增加可用协同内存的容量,将更多“热数据”存储在离CPU更近的位置,可将I/O密集型查询速度提升8倍,能提供更长的系统运行时间,并加快重启后的恢复速度。改将索引存储在傲腾DC持久内存的Aerospike企业版4.5,可在每个节点存储更多数据存储更多数据,降低横向扩展需求。另据Aerospike联合创始人兼CEO Brian Bulkowski评价说,对索引使用持久层时,无需重建主索引就能完全重启Aerospike。

 

Aerospike企业版4.5重启时间最终系统重启时间比纯使用DRAM的冷启动缩短135倍,由数小时缩至数秒。这意味着数据库可以进行更频繁的软件和安全更新,同时无需担心中断。

3.2解构痛点二:数据搬运影响延时

时间就是金钱,随着各企业数据分析对实时性的需求愈发迫切,数据中心急需快速且高效地访问并存储数据。金准产业研究团队认为,对于搜索、电信、工业、金融等存在密集数据集访问的业务来说,数据处理量巨大,考虑到经济实惠的内存容量有限,无法将大量数据都存储在更靠近CPU的地方,导致查询耗时长。而能节省数据搬运就意味着在更短时间处理更多数据,对于提升服务质量和降低成本将大有裨益。为了向用户提供更个性化的搜索结果,百度正在其高级内存数据库Feed-Cube中部署英特尔傲腾DC持久内存,搭配英特尔第二代至强可扩展处理器,以确保数据库的高并发性、大容量和高性能,并降低总拥有成本(TCO)。百度采用傲腾DC持久内存和DRAM,面向2000万并发访问,可将平均访问时间提高约24%,同时CPU利用率仅上升7%,并将服务器DRAM使用降低一半以上,大大节省了Feed-Cube的PB级存储容量成本。百度推荐技术架构部主任架构师汪瑫表示,经由这一方案,“百度能够节省成本效率,扩展内存容量,并始终能够帮助我们的信息流服务发展。”

英特尔在2019年百度云智能峰会上宣布百度正为其信息流服务搭建内存数据库,以充分利用傲腾DC持久内存电信、工业分析等业务的数据查询速度同样面临内存限制带来的I/O瓶颈。金准产业研究团队分析,使用傲腾DC持久内存App Direct模式,中国规模最大的业务支持系统(BSS)提供商之一亚信在内存中能存更多数据,减少对磁盘的频繁访问,将延迟缩至不到原来的1/3;工业大数据平台宝信xInsight则借助傲腾DC持久内存将每秒并行运行的任务数提升39%。

 

亚信Telco BSS业务支持系统查询相应时间为金融服务行业构建的时序数据库KDB+,用于处理全球前21家银行中20家所使用的历史数据,这意味着DRAM难以容纳的庞大数据集,而横向扩展会导致硬件占用空间增大。这时,傲腾DC持久内存的更高内存容量就起到关键作用,将查询速度加快3.7倍。

3.3解构痛点三:支持更多虚拟机实例

内存模式下的傲腾DC持久内存则将使虚拟化、私有云、混合云的硬件利用率明显著提高。傲腾DC持久内存将云和数据库中的关键数据工作负载转化为内存分析和内容分发网络(CDN),使得每台服务器能支持更多服务器实例,提高服务可扩展性,并降低TCO。可实例化虚拟机的数量同样受内存和I/O限制,使用英特尔Optane DC持久内存,能以更高的密度添加系统内存,在同一硬件上运行3倍多的虚拟机,或者运行4倍多的数据库容器虚拟机。华为发布的Fusion Sphere即存在上述限制,但不存在CPU限制,通过使用更高容量的傲腾DC持久内存,其支持的虚拟机实例数增长43%,硬件利用率更高。

 

华为Fusion Sphere虚拟机实例数除了华为外,谷歌、百度、腾讯等云计算服务提供商都已启用傲腾DC持久内存,以向其虚拟机提供比仅配置DRAM更高的存储容量。这种支持更多任务并行运行的能力同样惠及生物识别方案。生物识别公司海鑫科金为外交事务和公共安全提供指纹验证云服务,要进行多实例处理,需将数据库拆分成多个数据集,借助更多指纹数据集存储到内存中,能并行运行更多任务,从而将每秒处理指纹数提升26%。

 

海鑫科金每秒处理指纹数应对成千上万地理分布式传感器数据,电力公司南瑞集团处理的处理方案是以串行方式压缩各数据表,再解压缩,这对性能有一定限制。傲腾DC持久内存可以降低南瑞用电量分析的内存表压缩比,让大量数据保持在未压缩状态,缓解压缩和解压缩过程造成的时间和性能压力。

 

南瑞集团用电量分析系统每秒查询率(TPS)

四、前景:降低应用门槛,探索创新型应用

在提供傲腾DC持久内存服务方面,英特尔长期以来的王牌——生态再度发挥关键作用。为了实现傲腾DC持久内存有效快速的部署,英特尔与ISV、OSV、虚拟化、OEM提供商等生态合作伙伴通力合作,针对当前数据中心基础架构设计优化工作流程,精选方案都经过英特尔架构的性能验证。英特尔还与许多公司合作设计相应软件接口,创建统一的编程模型,提供管理路径、存储路径和内存映射路径,并提供能简化编程的开发工具包,进一步降低用户操作门槛。

结语

随着大数据爆发,存储和处理器间的距离已成影响性能提升的关键瓶颈,内存和存储结构的游戏规则正在被改变,持久内存日渐成为数据中心存储领域的新秀。正如Redis联合创始人兼CEO Yiftach Shoolman所言:“我们相信下一代服务器架构将是所有持久性内存,这将改变整个数据库市场。”率先入局的英特尔傲腾DC持久内存,以其高容量、高耐性、低成本和数据持久性,可作为部分替代DRAM内存的高效经济选择,还能改变企业运行任务关键型高性能应用程序或运行虚拟化IT的方式。除了英特尔,发布或计划发布持久内存的厂商还包括三星、东芝美国存储器、SK海力士。金准产业研究团队预测,随着持久内存在数据中心日益普及,更多大中小企业将加快获取洞察力和竞争力的速度。

金准产业研究 互联网财税服务行业研究报告 2019-09-29 09:16:40

前言

随着"营改增"和"金税三期"的全面覆盖,财税行业何去何从,未来如何发展,成为一个大家普遍关心的话题,会不会真的如大家所说,走向互联网财税呢?金准产业研究团队认为,从互联网的硬件来看,已经非常成熟了,互联网财税的落地实施只是迟早的问题

对于小微企业来讲,财税服务是刚需,但无法把控代理记账公司服务质量。对于代理记账公司来说,人工成本不断上升,行业恶性竞争严重,从业人员水平参差不齐,时常出现记账与报税错误等一系列问题,标准化自动化作业、规范化运营将是代账行业未来的发展方向。

一、代账行业市场情况

传统代账行业基于外部环境、信息化水平、获客渠道等诸多方面的限制,分布分散。全国目前从事代账业务的公司不少于10万家,平均每家服务客户的数量在100多家。

根据金准产业研究团队研究数据,2018年,全国法人企业增至3474.2万个,全国个体工商户增至7329万个,市场主体实有户数首次破亿。以平均客单价3500计算,整体代账市场的规模约为1000亿,随着SaaS形态的应用和服务渗透率的提升带来的代记账效率大幅提高,以及信息化水平提高带来的获客渠道不断增加,市场将逐步走向集中,优秀的代记账服务商将抢占更多的市场份额。

小微企业和个体工商户数量占比超过90%,小微企业在财税及融资等方面的需求迫切性远高于大中型企业。金准产业研究团队指出,当前财税及金融服务对小微企业的覆盖远远不够,市场潜力巨大。

市场主体数量持续增长,为企业财税服务提供广阔发展空间,金准产业研究团队认为,我国庞大的小微企业基数为B端财税及金融服务提供较好的市场空间。

金准产业研究团队指出,在互联网财税服务领域,慧算账在融资规模、服务能力、服务覆盖面、市场占有率等多个方面均居于行业第一,连续多年领跑全行业。同时,凭借精细化、标准化运营管理的核心优势,慧算账持续改善用户体验,实现服务品质行业领先,树立财税服务行业标杆。

 

随着市场主体数量的不断扩大,企业代理记账的需求不断激增。金准产业研究团队研究显示,2018年代理记账市场潜在规模达1365.6亿,实际的代理记账市场规模245.1亿,市场激活率仅为17.9%,代理记账行业的潜在市场空间巨大。相比传统代记账服务模式,智能化、云端化的互联网财税服务创新对激活市场潜能的作用力已经开始显现。

互联网财税服务市场经过几年的发展,相比传统代账企业优势明显。一是品牌价值和影响力开始得到挖掘,二是获客能力大幅提升,三是服务的广度和深度加强,四是智能化水平提升。未来财税服务产业的良性发展,需要通过标准化运营和精细化管理,全面提升服务品质、服务规模和运营能力,从而打造整个行业的规模效应。


 

通过代表性的互联网财税服务企业的对比可以看出,慧算账在品牌影响力、客户规模、融资规模、创新能力、获客能力等方面都领先于其他互联网财税服务品牌。传统代账模式发展受限,而以慧算账为代表的互联网+财税服务企业迅速崛起,其品牌影响力和创新能力有望成为推动市场变革的核心力量。

二、智能财税企业对比分析

按照QuickBooks票财税一体化应用,金准产业研究团队选取大账房、慧算账、云帐房三家国内行业领先的创业企业就其产品进行应用分析。三家公司均宣传为智能财税,根据公开资料及使用分析如下:

2.1慧算账

慧算账面向中小企业提供记账、报税、金融一体化服务平台。从"简单财税"的角度出发,按用户提供的单据进行标准化、专业化的账务处理和纳税申报,通过财务服务数据即时发现企业经营漏洞、管理漏洞,实现风险预案即时交互。为每个企业提供定制化的财税处理方案,大幅提升服务体验。把财务数据以更加简单的方式提供给用户,让用户对公司财务状况一目了然,更简单掌握公司财务状况。

票据方面:提供了出口退税、销项发票获取等直接自动化发票处理的流程。发票开具未见,有银行对账单导入功能,目前慧算账正在加强票据自动化以提升账务处理效率。

财务核算:各种业务单据录入或导入后能自动形成总账凭证,库存、资产、工资、摊销以及总账等核心功能均具备,部分细化功能扩展中。

纳税申报:具备出口退税功能;自动风控、自动生成税表、一键申报功能暂时欠缺。

2.2云帐房

云帐房通过互联网技术、人工智能和财税行业经验,为企业提供智能化,自动化的财税解决方案,能够降低企业财税成本,提升效率,用科技重新塑造财税行业,云帐房将继续引领财税行业向互联网变革,构建智能的财税服务生态产业链。

票据方面:自动获取增值税发票、银行电子对账单、费用单据等原始财务数据,减轻财务人员的录入工作和专业性要求,能够有效获取银行对账单进行账务处理。未见发票识别和发票自动获取方面上线,暂不具备发票开具能力。

财务核算:根据最新的会计准则,自动生成符合财务规范的记账凭证,无需专业财税人员介入,使传统繁杂的财务工作变得轻松自如。产品上财务税务融合,从税的角度进行了产品设计。

税务申报:系统能够根据各地最新的税务法律法规及税局要求,自动生成符合各地税务规范的税务申报表,取代部分税表制作工作。模拟了几个地区纳税申报,批量申报方面提供了软硬件一体的解决方案,支持财税风险自动预警。

2.3大账房

大账房智能财税平台融合自动发票、自动凭证、智能账务、自动税表、自动申报,形成智能财税流水线,致力于"智能财税、引领未来",用一流产品共筑行业生态,引领行业发展,是京东、腾讯、蚂蚁金服等主要平台财税合作伙伴。

票据方面:在智能财税领域少有具备发票开具能力的公司,实现了发票数据自动化,上线了微票通、发票查验、进项管理、出口退(免)税、账房小白盒等产品,在票据自动识别、二维码解析方面进行了突破,为大账房在线会计自动入账提供高效自动工具,实现发票信息自动化、认证自动化、银行单据自动化、记账自动化、申报自动化。

财务核算:产品设计上融合票据、财务和税务,降低从业人员门槛,产品经历数十万小微企业打磨,日臻完善,具有自动凭证、自动报表、个性化老板报表、企业财务控风控提示等功能。

税务申报:大账房纳税申报表根据账务信息自动生成,有效解决了会计账到税务表必须人为干预这一难题;并内置税务风控指标体系自动风控,已经实现了北京、江苏、重庆、山东等地税务自动申报。

三、慧算账领先行业发展

3.1专业化、智能化、增值化助力慧算账服务品质行业领先

慧算账创新研发了基于云计算和移动互联网的一体化智能SaaS平台,以业务标准化、作业流程化、IT 智能化为准则,凭借技术驱动、服务创新、精细化运营管理的核心优势,打造了财税服务领域SaaS交付服务模式的最佳路径,通过财税服务专业化、智能化、增值化,从而实现服务品质的不断提升。根据2018-2019年客户满意度调查中,随机回访6000份抽样样本,慧算账的客户满意率高达95.3%。

 

在专业化方面,慧算账将原本一人作业的场景切割为多节点的流程化作业,创新推出“团队对一”的服务模式,设置财税顾问、总账会计、会计助理等不同的岗位角色,通过细化分工,打造小组高效协作的标准化服务模式,作业过程透明可管控。同时,慧算账专属财税顾问7*24小时实时解答客户问题,及时响应客户需求,极大提升客户服务体验与客户满意度。

在智能化方面,围绕中小微企业关注的真实需求,慧算账通过技术创新与流程优化,将线下业务线上化,线上业务智能化,实现了从前端数据采集到自动记账算税,再到后端纳税申报的一体化智能财税作业,安全度大幅提升,差错率持续降低,有效提升服务品质,实现了AI智能化财税作业。与此同时,通过慧算账企业版APP和PC端,可以让小微企业主随时随地“管控”财税业务进度,实时查看各项企业财税报表。

在增值化方面,慧算账平台持续深入挖掘企业需求,除基础代理记账服务外,还提供税务审计、出口退税、金融服务等多元化综合服务,解决中小微企业全生命周期的企业需求服务。随着互联网+财税服务布局逐渐清晰,慧算账加强与上下游产业链合作,搭建资源共享平台,不断完善业务体系,提升服务能力,实现企业服务产业链的深度布局。

3.2慧算账多项数据持续领跑行业,站稳业界领先者地位

慧算账以互联网创新理念引领行业,致力于中小企业客户服务体验的持续提升。成立4年来,慧算账通过“IT智能化+精细化运营”管理模式,对产品、服务、业务流程持续打磨,成为国内最具影响力的互联网财税平台。金准产业研究团队研究报告指出,在互联网财税服务领域,慧算账在融资规模、服务能力、服务覆盖面、市场占有率等多个方面的数据均居于行业第一,并连续多年持续领跑全行业。

 

在融资规模方面,慧算账获得高成资本、小米、IDG资本、清控银杏等多轮投资,累计融资金额数十亿元,融资规模稳居行业第一,成为顶级资本标杆案例。

在服务专业性方面,慧算账领导团队由财税、技术、金融等方面的丰富从业经验人员构成,会计服务团队均由超过5年经验的专业人员构成。此外,基于企业财税大数据分析的AI系统——慧算账大脑,AI月均处理凭证数超500万,以科技驱动客户体验不断升级,服务能力领跑整个行业。

在服务覆盖方面,基于企业客户的认可与信赖,截止2019年6月,慧算账已在全国设立33家分公司,服务网络范围覆盖全国400余座城市,拥有500余家区域服务机构,服务覆盖面在行业内首屈一指。

在市场占有率方面,慧算账2018年全年销售额突破10亿元,同比增长150%,服务企业用户数量超50万,远高于其他互联网财税服务企业。相比2016年年初,2018年慧算账获客成本下降约50%,服务成本下降近30%,财税服务效率和运营能力的提升,助推企业运营成本结构性下降。

借助大数据、云计算、人工智能等新技术,慧算账打造的“SaaS+落地服务”模式在保障服务效能的基础上,满足各行各业中小微企业的多元化需求。同时,慧算账通过SaaS平台构建“云+端”服务模式,以“IT支撑+体系化运营”助力服务门店运营管理效率提升,并为其精细化运营提供保障,引领行业转型升级。

未来,慧算账将持续践行领先者的使命,不断以技术创新驱动服务升级,基于大数据的分析应用,纵向垂直深入,输出行业解决方案;横向多元化服务布局,高效匹配供需,改善企业财税服务业态,引领行业创新升级,成为中小微企业信用体系建设的强有力基石,全面赋能中小微企业发展。

结语

总的来说,金准产业研究认为,营改增带来了智能财税的机会,QuickBooks智能化、自动化、一体化实现自动化票据、自动账务、自动税表、自动申报的流畅应用模式在北美以及全球其他区域的巨大成功,必然成为国内智能财税初创公司竞相模仿的标杆。

金准产业研究 2019年中国教育信息化行业研究报告 2019-09-27 16:11:53

前言

教育信息化2.0时代,教育相关政府/学校以更开放的姿态对待社会各类业态的进入,共建共享优质教育资源,提升教育公平与教育质量。同时2.0时代希望将1.0时代买来的设备用起来,收集并实现各类数据的连通,以数据为驱动来提升教学效率和体验。

金准产业研究团队预测,2019年中国教育信息化市场规模预计突破4300亿元,其中财政性教育经费大约贡献了70%-80%的份额,国家拨款是市场发展的重要推动力。

教育信息化市场产业链上各服务环节的界限趋于模糊,但上中下游市场特点明显:上游重资产,中游重渠道,下游重效率和体验。

整个教育信息化市场呈现出市场体量大、市场高度分散、地域性强的特点,垄断型企业尚未出现意味着市场可供攫取的空间非常大,各领域企业伸出触手开始圈地。

现阶段教育信息化行业处于缓慢平稳增长期,企业间竞争加剧的同时合作也不断深入。金准产业研究团队认为,新技术带来的产品和服务升级、C端用户付费市场的拓展等都是刺激行业快速增长的机会点。

一、宏观环境:坐享天时地利人和

1.1教育信息化行业研究的必要性

B端到C端研究的转变:

教育行业toC市场重点在于满足C端用户对“效果”的满意度,而toB市场则更加强调帮助企业客户提高管理和运营效率、降低运营成本。作为与toC截然不同的市场,教育信息化行业有其独特的发展特征与发展逻辑,对其开展系统性的研究也极具必要性。

市场成型且进入发声期:

我国教育信息化市场已经明确成型且处于日益激烈的市场竞争阶段,各类玩家纷纷通过投资、并购、战略合作等形式整合并最大化输出自身资源,进而为学校、政府、教育机构提供更加完善的服务,占领更大的市场。因此针对教育信息化市场的研究需更加关注企业的服务链路及其周边潜在机会,分析业内重点企业的布局和运营思路,帮助市场玩家或待进入的企业了解行业重点竞争领域、洞悉行业发展动态,促进行业健康良性发展。

市场空间大,潜在机会多:

从需求端看,50.7万余所学校(含学前教育)、2.6亿余在校生(含在园人数)和1600余万在校老师,对信息化的需求庞大且持续。

从供给端机会看:1)硬件产品会随着技术升级而进行产品迭代;2)软件及服务产品随着服务场景的深化、数据分析技术优化、与AI技术的深度融合而有更多可供挖掘的个性化的、定制化的服务类型;3)内容方面,新增科目知识体系的合作开发、原有科目知识图谱的建立与抽象等都是潜在机会;4)B端提供服务后,潜在的C端流量入口已经占据,对C端付费市场的挖掘仍充满想象空间。

1.2主要服务类型

软件/技术服务和内容服务是目前最为活跃的两种服务类型。

现阶段教育信息化企业主要有四种服务类型:1)硬件提供商;2)教务管理软件/技术平台提供商;3)教学管理软件或教学内容提供商;4)补充性的课程解决方案提供商。第一种和第二种侧重于教学、教务线上化,得益于政策自上而下的推动,市场发展快且相对成熟,行业主流玩家多具有成立时间长、具有政府背景或母公司支持的企业。第三种和第四中则是将服务场景拓展至教学过程中,多为创业公司在不断摸索,向学校(B端)或学生/家长(C端)收费是其主要业务展开逻辑。第三、四种模式主要有三个问题:其一,服务对象涉及老师、学生甚至家长,不同用户在需求、使用习惯、使用目的等方面有所不同,但市场同质化竞争激烈,企业需要考虑开发成本、开发周期和差异化竞争等因素;其二,受政策影响大,企业的业务逻辑可能因为政策不向好而停滞,甚至终止;其三,如何为C端提供有价值的服务并收费需要不断摸索和验证。

 

1.3教育信息化行业政策环境与技术环境

政策环境:教育信息化2.0做创收。“用”为出发,以数据为驱动,以提升效率和体验为根本,加快实现教育现代化。

 

技术环境:教育+科技的不断试探。成熟技术向教育领域“蔓延”,一定程度上提升学习效率。

技术在教育的应用滞后性强,即技术成熟了,与教育的适配性或融合度不一定高。整体来看,现阶段中国的教育+技术主要有三点特征:其一,体制内学校受教育部门监管严格,改革难以推进,其受技术影响的速度和程度都比体制外培训机构慢;其二,高学龄阶段受众成熟度和自控力比较高,教育+技术的应用程度更深;其三,技术多应用在教学活动的外围层次(即“练-测-评”),相关的学习数据结构化程度高,分析和反馈机制好;与思考和规划相关的核心环节“教”现阶段尚处于初级阶段,产生的数据也是非结构化的,数据资源无法有效利用。但即便如此,师生的教学效率已在一定程度上得到提升,未来技术与教育的深度融合将为教学效率的提升带来更广阔的想象空间。

 

二、市场空间:四千亿市场等待被分割

2.1教育信息化整体市场规模

2019年教育信息化市场规模预计突破4300亿元。金准产业研究团队统计及核算数据显示,2019年中国教育信息化整体市场规模预计突破4300亿元,未来两年持续增长但增速趋于稳定。教育信息化1.0时代的快速增长得益于硬件设备自上而下的推广和购买。十九大之后,硬件普及基本完成,教育信息化2.0时代刚进入以客户为导向的软件和服务市场,市场处于赛道抢占期。金准产业研究团队预测,未来,随着5G、AI、VR/AR等技术在教育领域的应用,新的硬件升级、覆盖于整个教学活动的软件服务以及C端用户的付费场景增加等,整个教育信息化市场将迎来一波新的高速增长机会点。

 

2.2产业链条:要产品要服务更要有渠道

现阶段教育信息化产业链结构,上游企业市场集中度高,中游市场极度离散,中游企业对下游市场的拓展受渠道关系影响大。

 

中游端:重渠道、重合作赛道。技术+合作是硬件产商迎接一下增长红利的关键。

现阶段,教育信息化硬件设备供应商优劣势明显。其中优势主要有三点:其一,采购政策自上而下推行,市场盈利模式清晰(即直接向政府/学校收费);其二,受技术推动,硬件产品的品类和覆盖范围不断扩大;其三,经过教育信息化1.0的建设期,厂商已积累了一定的客户资源和渠道。反观不足,也有三点:首先,硬件设备未真正用起来,用户对产品依赖性差;其次,现阶段硬件普及基本完成,预算申请难度大,市场增量空间有限,未来市场红利可能出现在与技术升级相关的硬件设备升级或迭代方面;最后,市场渠道依赖性强,很难全国性扩张。就未来而言,硬件设备产商一方面需要把握新技术(如5G)的节点,加速产品升级或迭代,另一方面,更需要与软件产商、集成商深度结合,互利互惠。

 

 

中游端:重渠道、重体验赛道(1)

教育信息化软件服务市场重视用户体验,易垂直细分、易聚集流量、易规模经济,但也易沦为标准化产品

 

中游端:重渠道、重体验赛道(2)

综合类服务供应商本身具有很强的渠道优势和客户资源,对内可提供整套服务,对外拓展可成为系统集成商的角色。

 

2.3市场特征:多方混战,各显神通

特征一:市场极度分散(1)

A股上市企业教育业务占教育信息化市场的比重不足4%。

教育信息化覆盖的服务场景广,服务对象涉及从学校到政府、从校长到教职工、从学生到家长等各个类型,服务内容囊括了政府管理、学校运转、教师教学、学生学习、家校沟通等方方面面。从市场主流玩家来看,包含传统教育信息化企业、新兴创业型教育信息化企业、大的互联网企业、传统教育企业以及其他或转型或布局的企业五大类,市场参与者众多,但又高度离散。据金准产业研究团队不完全统计,2018年部分A股上市的教育信息化企业中教育营收大致150亿左右,占整个教育信息化市场规模的比重在3.7%左右,市场极度分散。

 

 

特征二:市场极度分散(2)

部分A股教育信息化企业的服务内容和营收情况。

从部分A股教育信息化企业的服务内容来看,单一服务类别的企业较少,大部分都有两种或两种以上的服务。这与他们进入市场较早,积累了足够的渠道资源、客户资源等息息相关,同时这些资源的积累为他们向系统集成商的角色过渡提供了重要的支撑作用。现阶段A股上市的教育信息化企业营收高,但教育业务占比低,教育市场服务竞争激烈。

 

三、发展启示:搜索新一轮市场增长点

3.1启示一:部分玩家向集成商发展

系统集成商的数量和类型增加,市场扁平化程度高

据金准产业研究团队不完全统计,A股上市的教育信息化企业中有超过50%的企业提供系统集成服务,新三板中有25%的企业同时发展系统集成服务,整个市场玩家中系统集成商仍有较大空间可供攫取,市场扁平化程度有望增加。渠道、客户资源、口碑、管理、服务、技术和整合能力等是系统集成商的核心要素,对于渠道依赖性强、产品同质化程度高的教育信息化行业而言,很多厂商都可以结合自身优势资源而向系统集成商发展,通过拓展服务类别和服务范围,既可以夯实已经建立的客户资源,又可以丰富/构建产品体系,提升抗风险能力和竞争力。当然提供集成服务时尽量做到服务体系轻量化、操作/管理简易化。

 

3.2启示二:马斯洛需求的适用性

欠发达地区的教育信息化市场空间大,拓展相对容易。

不同地区的教育信息化程度受当地的经济、政策等影响而不同。对于发达地区而言,经济水平高,高精尖产业多,其教育信息化程度高且对教育信息化的要求更加具象,如将什么知识通过什么方式点引爆后,可以促进学生的独立思考能力、针对性的学习路径设计和学习内容推送等。贫困地区属于市场空白区,他们的诉求比较集中,即获得优质教育资源,满足师生教学需求。相比较而言,欠发达地区无论是教育部门还是学生对教育信息化都有一定认知,并且希望通过信息化助力当地教育质量提升、教育公平普及,故当地对教育信息化企业接纳度高。能够带来优质教育资源、丰富教学方式、提升教学沉浸感的企业将优先获得当地市场“入场券”。

 

3.3启示三:C端增值服务市场值得拓展

如何将C端流量转化为付费用户是关键。

目前教育信息化市场比较成熟且经过市场验证的服务模式是直接向教育部门/学校/教育机构售卖自上而下的硬件产品、软件、平台,对于将教育部门/学校/教育机构作为通道打开C端流量入口进而向C端收费的模式(即2B2C模式)一直处于探索阶段,虽然有成功的案例(如口语100向学生收取人工智能老师的服务费用),但就整个市场而言,2B2C模式的服务价值需要不断挖掘和放大,以满足C端市场的付费意愿和期许。整体来看,企业想要针对C端用户收费,首先需要了解用户不同阶段的需求,其次要结合自身资源制定满足用户需求的方案,最后要衡量提供的服务是否能够打破用户付费意愿与需求程度之间的落差。在提供C端服务的过程中,企业需要注意两点,即投入产出比和实时把握政策风向。

 

结语

从需求满足看,短期内重点满足定制化需求,长期看需要关注行业标准化走势;从客户拓展看,离客户越近的渠道,其投资价值越高。

大企业打造生态布局,小企业提升服务价值

对于上游产商:

明确自身业务体系构建的方向和全局性,针对性的寻找下游合作伙伴,打造企业全产业的生态布局。

对于中游硬件提供商:

1)5G风口下VR/AR市场、直播教学市场值得重点关注。

2)大的硬件提供商可以利用自身渠道、客户等优势直接向系统集成商过渡。

3)细分垂直领域对硬件设备的需求也可能出现小而美的市场,如音乐类。

对于中游软件提供商:

1)对于深度垂直且易沦为标准品的软件服务商,主要有两种路径:其一,向整体解决方案提供商发展;其二,守住学校流量入口,争取C端市场,保证潜在增量空间。但现阶段从可行性方面看,更看好第一种路径。

2)对于深度接触教学活动的软件服务商,如教学系统,挖掘并利用自身的数据资源以建立竞争壁垒是当前重点。目前来讲,与大数据、人工智能等领域的企业/权威机构合作开采数据资源的价值似乎更具可行性。

对于中游内容提供商:

金准产业研究团队认为要重点要明确自身对校内教育资源的“补充作用”,而不是替代作用。市场新兴的、尚未建立健全的学科是最好的切入点。但内容提供商需要传递出内容的专业、权威性,主要有两种途径:其一,与学校合作,共同研发知识框架和教学内容体系;其二,与业内专家/专业机构合作开发。除了课程内容之外,与新兴硬件相匹配的教学内容资源的开发(如VR/AR在实验、特定教学场景)也表现出一定潜力。

 

 

金准产业研究 2019年中国营销云市场研究报告 2019-09-26 18:19:01

前言

自产业互联网被提出以来,企业级服务市场被推上风口,企业级营销服务市场也同样受到关注。多重因素之下,“营销云”的概念及价值被行业探讨和实践,当然对于营销行业来说,营销云已经不是第一次被大家热议,在2016年就已经有部分企业实践营销云战略,但在当时营销云并没有引起以往市场中现象级的追捧和流行,或许因为产业机遇不够明显,或许因为外部推动力不足,也或许因为营销云并不具备热点现象的特质,而是一种更为深入的基础设施......那么在今天的市场环境下,营销云将迎来怎样的终局?

一、存量时代下的营销运营之路

1.14P组合策略去看营销生态的结构性变化

提及营销,就会讲营销4P,4P是美国营销学学者杰罗姆·麦卡锡教授提出的“产品、价格、渠道、促销”的首字母缩写。但聚焦国内市场去看,互联网爆发前的4P从产品诞生到价格再到促销及分销,“中心化”特征明显,每个内容版块都有1-2个中心结构在支撑其内部生长和发展,并呈放射状形态。而在互联网时代,尤其移动互联网时代,技术的发展使去中心化的信息传播成为现实,因此由4P连接的营销生态“去中心化”特征明显,并呈网状形态,同时,每个节点都可能成为阶段性的中心,节点与节点之间也会相互影响。

 

1.2基于云计算实现的服务,五大特点决定其市场潜力

云服务是基于“云计算”技术,实现各种终端设备之间的互联互通。1)在营销云的概念中,从云的服务模式去看,SaaS层是营销云产品的入口,部分公司在实现规模化后也会考虑开发PaaS层,来满足企业的定制化需求;而IaaS层则是为企业提供服务器、存储器等基础设施服务,一般会使用阿里云、华为云等。2)从部署模式看分为公有云、私有云和混合云,三种部署模式均有特点,主要根据企业诉求决定部署方式。3)同时,云服务拥有随时接入、自助服务、资源共享、弹性扩展、服务可计量五大特点,其特点决定了云服务能够提升资源利用效率和节省开发运维成本的优势。

 

1.3目前缺乏严格界限定义,三种视角帮助理解营销云

目前,市场上没有明确的营销云定义,维基百科将营销云定义为一套营销系统,提供了集成在线营销和网络分析产品的集合。而Salesforce则将营销云描述为:“营销云平台,为企业提供高相关性、个性化的营销旅程,跨越平台和设备的限制,让企业能够在正确的时间,将正确的信息传递给消费者。”但在中国市场下,营销云的定义理解又有所不同。金准产业研究团队分析认为:基于中国的市场环境,营销云可从三种视角去理解。

 

二、营销云的核心价值

1.1多渠道数据信息实时共享和洞察,提升客户体验和运营效率

在今天的互联网环境下,营销活动已经从线性的营销活动,向以用户为中心的营销闭环发展,在闭环营销活动中,用户行为数据和信息分散在各个触点中,各个触点需要被实时连接和打通,并在触点的交叉中得出洞察和价值。

营销云在营销闭环中,1)其核心价值在于利用云的覆盖和计算能力,把多个成本较低的计算机实体合成一个或几个具有强大营销能力的体系;2)再通过云上的数据智能实现全渠道之间的信息流通,包含从产品、运营、营销再到销售的数据信息实时共享和实时洞察;3)最终使闭环里的各个环节都能达到实时洞察和实时决策,进而提升客户体验和运营效率。

 

 

提升工作效率

脱离传统的沟通和协作方式,保障信息实时在线和共享,提升决策效率和工作效率;

减少资源消耗

让客户免除繁琐的基础设施、应用安装、部署、维护等流程无需硬件配备,帮助企业减少资源消耗;

使数据资产化

数据孤岛问题得到调试,使企业各个触点的数据资产化并形成数据闭环,保障客户互动的持续性;

提升客户体验

全渠道营销触点的连接和打通,使营销决策更为清晰和精准,并完成个性化触达,提升客户体验;

三、中国营销云发展机遇

3.1从消费互联网到产业互联网,政策持续推动营销云落地

互联网已经进入下半场,政策的关注点也逐渐从消费互联网向产业互联网迁移,而企业上云作为产业互联网转型的基础和前提,也成为政策引导的重心。一方面,从宏观角度不断对市场进行教育和引导,提升对产业互联网转型来带的产业模式和发展效率的升级的价值认知;另一方面,从执行角度对企业上云提出具体的发展规划和措施,为产业互联网的发展打好基础。在此背景下,企业对上云的认知度、接受度和普及度都有了较大的提升,进而也为营销云的应用落地提供了良好的生长土壤。

 

3.2企业级SaaS高速发展,预计未来三年复合增长率近40%

中国企业级SaaS市场的高速发展,从供给端和需求端为营销云的普及和落地打下基础。1)从供给端来看,随着企业级SaaS市场发展的不断成熟与深化,对不同场景的垂直服务渗透程度也在不断提高,营销作为重要的SaaS应用业务场景,也有着越来越多的老牌厂商和新兴企业入场和布局。2)从需求端来看,企业级SaaS市场的不断增长,也从侧面反映了企业对基于SaaS和服务产品形式的接受度和普及度在不断上升,这也为未来营销云在企业的应用落地提供了良好的准备条件。

 

3.3互联网进入存量时代,流量扩张向用户经营营销战略迁移

中国互联网经过数十年的高速发展,已经逐渐进入存量时代。1)根据CNNIC数据显示,2008至2018年中国网民规模的增速不断放缓,近五年持续在低位徘徊。而作为重要增长点的移动互联网的流量红利也基本消退,十年内手机网民占整体网民的比例已经从39.5%增长至98.6%,几乎接近饱和。2)在此背景下,企业的营销战略也逐渐从粗放式的流量扩张向精细化的用户经营迁移,尤其是C端企业,未来将会把更多的精力和资源放在已有用户的价值挖掘和深度经营上。因此,营销云作为大数据时代下用户经营的工具和平台,将会产生越来越大的需求量。

 

四、中国营销云发展挑战

4.1企业信息化水平相对滞后,造成营销云市场发展进程缓慢

站在全球视角下,中国企业信息化投入与经济发展水平关系不平衡。1)2018年,中国GDP占全球的比例达到15.8%,但中国企业的IT支出占比仅为3.7%,可以明显看到,在过去以粗放式增长为主导的经济模式下,中国经济总量的快速增长并没有反应到企业的信息化投入当中。2)同时,通过2018年中国和全球企业IT支出结构看到,企业软件和IT服务支出均低于全球水平,这说明营销云厂商面临的市场环境中依然有大量企业的信息化停留在浅层水平,很多企业软件应用也并不广泛,营销云厂商即要在业务数字化尚未完全普及的情况下向数字化转型阶段过度,这无疑为供给侧和需求侧带来了挑战。

 

 

4.2广告主对营销云在应用落地层面的认知仍较为模糊

根据金准产业研究团队广告主调研数据显示,1)近八成广告主认为营销新技术在营销工作中很重要,而只有不到六成的广告主认为自身企业在营销新技术的使用程度是较好的,整体来看营销技术的认知程度和使用程度之间仍然存在明显间隙,这主要是由于广告主对营销技术的认知还停留在技术本身层面,对其在具体场景中应用落地的解决方案的认知仍需进一步提高。2)尤其营销云作为当前重要的提供营销运营解决方案的服务平台,在广告主的关注度中仍然较低,仅占21.4%,远远低于内容营销、短视频营销等应用场景和效能都更加易懂的营销现象,营销云到底能够为企业解决哪些问题,发挥什么作用,仍然是国内很多广告主的困惑和观望的原因。

 

 

 

 

 

4.3营销云概念引入时间较短,创新的普及和落地仍需时间

营销云作为一个新概念,进入国内市场的时间尚且较短,再加上其包含着技术创新、产品功能创新、服务创新及合作模式创新等多重创新维度,使得中国营销云市场还处在一个发展初期。相比于以美国为代表的海外市场,国内营销云在应用落地的普及度和渗透率上仍有存在着阶段层的滞后性。结合美国社会学家罗杰斯提出的创新扩散理论,金准产业研究团队分析认为当前国内营销云的创新扩散还停留在早期采用者阶段,大部分企业对营销云的创新接受与决策过程还在了解和兴趣阶段,要赶上海外市场的普及度,时间是必要条件。

 

 

4.4原生与转型皆有瓶颈,但更多的是机会和未来

如前文论述,基于中国独特的媒体生态和营销环境,国外成熟的营销云厂商在进入中国市场都会遇到不同程度的“水土不服”,因此国内营销云市场的发展大旗开始由本土厂商肩负。从目前来看,国内本土营销云厂商主要可以分为两大类别,一是原生类厂商,基于垂直场景从零到一开始搭建的新兴创业厂商,二是转型类厂商,既包括传统软件公司在“云化”战略升级中向营销场景的拓展,也包括传统营销服务商从前端广告服务向后端营销技术的拓展。无论是原生类还是转型类,其在营销云产品搭建中均会遇到各自的瓶颈和困境,而未来合作和实践将是打破瓶颈的重要手段。

 

 

五、中国营销云市场发展现状

5.1产业互联网趋势推动下,营销云市场规模将超百亿

2018年中国营销云市场规模为93.1亿元,增长率为64.1%。在此阶段,头部软件公司云形态交付的营销产品盈利提升明显,部分企业级营销服务商经过几年的时间积累也开始规模化盈利,因此增速较快。未来几年,营销云市场还将保持较好的增长态势,预计2021年规模将超250亿。1)金准产业研究团队分析认为,在产业互联网趋势下,一方面需求端对营销运营会愈加重视,另一方面供给侧厂商对细分赛道的探索会愈加成熟。2)此外,在需求端和供给方的助力下,也会加速资本市场对营销云市场的关注,三方互相渗透共同创造一个良性的营销云市场。

 

 

 

5.2营销云的发展是营销场景云化的逐渐渗透

营销云市场的发展可以理解为大数据和云技术在营销场景中不断渗透的过程,整体来看营销主要分为数据&策略、内容&创意、媒介&渠道和客户&流程管理四大场景,均已经在云的影响下,产生了新的营销方法和产品服务。从当前来看,云化渗透程度最深的主要集中在数据&策略和客户关系管理层面,广告主也已经开始接受在营销策略制定和客户关系管理中使用云技术和云平台,未来营销云在内容&创意和媒介&渠道方面的应用也会持续加深,为该环节带来更多的改变和创新。

 

5.3营销云场景的本质,都是用于发现、吸引、保留和培育客户

营销的本质是发现、吸引、保留和培育客户,数据&策略、内容&创意、媒介&渠道和客户&流程管理四大场景也是服务于营销在获客和转化方面的完整链条。分别来看:1)在数据&策略环节,营销云主要表现为DMP/CDP以及数据分析等产品和服务,帮助广告主发现客户并制定营销策略;2)在内容&创意环节营销云主要表现为创意自动化和内容营销平台等产品和服务,帮助广告主提供内容和创意的生产效率以及基于内容营销平台的获客管理;3)在媒介&渠道环节,营销云主要表现为投放优化等产品和服务,帮助广告结合投放数据优化渠道投放策略和效果,营销云在创意内容和媒介渠道上的赋能主要都是为了更好地吸引客户;4)在客户&流程管理环节,营销云主要表现为CRM/SCRM、营销自动化和渠道运营,帮助广告主更加高效且全面地管理客户的全生命周期,持续挖掘客户价值,其中渠道运营兼具吸引新客户和保留培育老客户的作用。

 

5.4中国营销云发展竞争要素

产品开发:自下而上思考,自上而下满足客户需求

虽然SaaS模式要求产品标准化,但中国大多数行业和企业定制需求明显,用一套标准化的服务模式很难满足不同客户的需求。1)与此对应的并不是厂商切入的行业越多,盈利越快,也并不是产品功能越多越能解决企业的痛点,尤其营销行业营销触点和用户场景众多,大而全的产品开发思维,会影响产品的运行效率和使用体验。2)因此,建议营销云厂商的产品定位遵循“客户行业×营销特点×使用人员×产品功能”的矩阵图。3)自下而上的思考要切入的行业赛道,要解决的特定行业或特定业务的痛点,要了解该行业的营销特性,要捕捉客户产品功能的开发和解决方案的制定。最终通过自上而下的沟通和服务,持续的满足客户需求和帮助客户实现销售增长。使用人员的痛点,进而确定产品功能的开发和解决方案的制定。最终通过自上而下的沟通和服务,持续的满足客户需求和帮助客户实现销售增长。

 

销售策略:洞悉客户需求旅程,打造以客户为中心的销售策略

营销云的服务场景天然需要与客户以及客户所在企业的内部运营流程走的更近,因此解决方案的提出,需要站在客户视角思考,而不是产品视角。以客户为中心的销售策略要求厂商从客户角度来设计自己的产品,更要充分关注客户的需求旅程和旅程特点,并围绕此来开发产品和服务,最终达到与客户保持长久而稳定的客户关系,从而为双方创造长期的客户价值和盈利价值。

内容营销:核心能力之上的高竞争壁垒,追赶时间成本高

对于营销云厂商而言,内容类产品已成为不可或缺的竞争壁垒,而内容营销手段的使用更是重中之重。在中国,微软、SAP、用友等已正式开始使用内容营销,但目前,大多数B2B企业对内容营销手段的使用程度还较低。金准产业研究团队分析认为:站在客户视角思考,企业主与用户保持沟通和建立信任感的要素始终是内容,所以无论2C还是2B,本质都是人与人的连接,而内容是人与人连接的桥梁。此外,内容层的构建,要考虑行业特性,要兼顾企业调性和用户获得信息的趣味性,更要在长周期的销售过程中注重内容的策略性和创意性,最终保证内容营销带来价值的持续性,因此内容营销也是厂商在核心壁垒之上拓展增值业务的高竞争壁垒。

六、营销云发展趋势

行业走向市场化,SaaS趋势和广告主诉求为营销云创造机遇。

2018年中国SaaS市场规模占应用软件的比例由2015年的8.3%上升到13.3%,软件SaaS化趋势不可逆转,预计2020年该比例将进一步增长至19.8%。同时,中国网络广告市场规模达到4844亿元,预计在2020年市场规模将达到近8000亿,从绝对值来看,中国网络广告产业的生命力依然旺盛。此外,从广告主的调研中可以明显看见的趋势是网络广告市场增长的动力,正在由原来以广告投放为核心的手段向全渠道营销触点的运营方式扩散,将分散的时刻转化为一种有凝聚力的体验并进行管理,已成为广告主重要的诉求。

 

 

 

结语

从根本上来讲,广告主营销上云的意愿程度,最主要还是由上云后所产生价值的迫切程度决定。尽管不同行业营销的本质都是发现、吸引、保留和培育客户,但由于各行业在营销生态链和客户数据量级的不同,营销上云后产生的价值程度也有所差异。通常来看,营销生态链条越复杂,周期越长,客户数据量级越大,上云后来带的成本优化、效率优化以及对客户的营销效果优化都会有更大程度的提升,但对应来看对营销云服务的要求也会更高。因此,营销云厂商在业务拓展时也会更多考虑不同行业的应用价值和自身能力,用综合型营销云产品去打通跨行业的基础服务,用专业型营销云产品去深耕垂直行业的精细化服务,而垂直型营销云产品的发展轨迹也将从行业营销生态链由深向浅辐射。