• 项目
首页>>文章列表 >>行业研究
行业研究

金准产业研究 英伟达:从绘图到计算,从 GPU 到 AI 芯片 2019-10-22 18:13:02

前言

英伟达(Nvidia)成立于 1993 年,目前是全球最大的独立 GPU 供应商,也是 AI芯片市场的领军者。上市初期,Nvidia GPU 主要专注 PC 图形业务,公司产品与 PC 出货存在较高程度的绑定,以 OEM 形式销售显卡也是公司重要的收入来源之一。经济危机后,随着智能手机、平板电脑等消费电子新应用的兴起,终端需求呈现多元化,全球 PC 出货量开始进入下行通道,Nvidia 开始将业务重心转向高端游戏卡市场。

2009 年起,公司几乎每两年刷新一次游戏 GPU 架构,优异的硬件性能和良好的兼容性使其逐渐扩大了对 AMD 的市占率领先优势,一度在 PC 独显市场将 AMD 市占率压制在 20%以下。2010-2015年,公司游戏 GPU 出货量年复合增速为 9%,2013-2018 年年复合增速上升至 14%。同时,借助平均销售单价强势上升,公司 2010-2015 年游戏业务收入实现了 21%的复合增速,而 2013-2018 年这一数字更攀升至 29%。

一、GPU 核弹的二十年辉煌史

英伟达(Nvidia Corporation, NVDA US)成立于 1993 年 1 月,创始人为 LSI Logic 走出的Jenson Huang(黄仁勋)及来自于 Sun Microsystem 的两位工程师 Chris Malachowsky 和Curtis Priem,现已成为全球可编程图形处理技术的领袖,并在未来 AI 时代所需的高性能计算领域取得了良好的先发优势。公司于成立初期(1993-1997)相继发布了 NV1 及 Riva系列图形显示芯片,但并未获得良好的市场认可。

1998-2007,开启发展之路,迂回中前进。1998 年,公司于台积电正式建立策略联盟伙伴关系,以无晶圆(Fabless)模式的英伟达在奠定产能及工艺基础的同时,也与台积电一并开启了自己的发展之路。1999 年公司在 NASDAQ 上市,发行时市值 2.3 亿美元左右。同年,英伟达推出 GeForce 256——世界上第一款功能齐全,可从真正意义上替代 CPU 渲染的图形处理单元(GPU)就此诞生。2000 年公司收购九十年代末至二十世纪初的显卡芯片领导者 3dfx,技术储备得到进一步壮大。

2002 年后,公司与微软在 Xbox 图形芯片上失败的合作经历使其收入出现下滑,DirectX 9 的兼容性问题也是其产品竞争力被在与 AMD 竞争中落败。然而,通过不懈的努力,Nvidia 最终争取到了 Sony PS3 的订单,并与 Intel 达成了交叉授权协议,重回增长轨道。2007 年英伟达收入超过 40 亿美元,相比上市时成长了近 5 倍。

2008-2009:上市后首度受挫,但迅速恢复。2008 年受到全球经济危机影响,半导体行业也在互联网泡沫后再度受到重挫,Nvidia 业务同样受到影响。此外,CUDA 的推出使 Nvidia必须在 GPU 设计中增加相关逻辑电路, 使得芯片面积增大、散热增加、故障率增高,G84/G86 核心的产品出现了过热而导致花屏的“显卡门”事件,Nvidia 也因此付出了近 2亿美元的一次性支出代价,来解决产品质量问题。2009 年随着 Fermi 架构 GPU 推出,公司经营得以快速恢复。

2009-2016,聚焦高端游戏市场,实现收入对超威半导体(AMD)的超越,并同步发展GPU 通用计算。在经济危机过后,笔电、平板等多元化应用分散了 PC 的需求,PC 及 PC独立显卡出货量均开始呈下滑趋势。英伟达则将战略中心转移至高端游戏卡市场,加快GPU 架构的迭代速度,实现与 PC 市场成功解绑。

与此同时,2015 年公司营业收入成长至 50 亿美金左右,总市值突破 150 亿美元,实现对 AMD 的反超。与此同时,用于运算的 Tesla 显卡也随着 GPU 架构的升级得到不断更新,为后期数据中心业务发力做出了充足的储备。

2016-2019:数据中心业务发力,虚拟货币挖矿潮及自动驾驶美好蓝图推动公司市值爆发式增长,但随后又经历第二次重大挫折。进入 2016 年后,半导体行业迎来数据中心建设驱动的新一轮成长周期。

随着云数据中心数量及计算任务需求不断上升,Nvidia 的通用计算 GPU(GPGPU)迎来收获季。公司数据中心业务收入单季度增速一度超过 100%,且强势一直维持至了七个季度之久(2QFY17-4QFY18)。加之数字货币价格暴涨,资本市场对自动驾驶预期持续走高使英伟达市值快速爬升,巅峰时一度突破 1500 亿美元,是上市时的近 300 倍。FY2018(截止于 2018/1/31)公司收入 97 亿美元,相比 2015 年又翻了一番。

而进入 2018 年,半导体行业周期转为下行,比特币退潮、AI 相关应用预期大打折扣等利空因素导致英伟达股价市值腰斩,单季度收入也出现 20%以上同比下滑,公司遭遇上市后第二次重大挫折。目前,随着支持实时光线追踪的 Turing 架构显卡上市,公司再度聚焦游戏主业,经营状况逐渐从底部走出。

 

NVIDIA 单季度收入及同比增长率

自上市以来,Nvidia 业绩及股价表现大幅跑赢行业。尽管发展中历经多次起落,作为硬件市场的一枚“核弹”,Nvidia 仍然凭借其强大的内生增长使收入及净利润增速大幅跑赢可比公司。1999-2018 年间,Nvidia 实现了 19.9%/27.4%的收入/净利润年复合增速。

行业平均来看,全球半导体行业销售额(不含存储)1999-2018 年间的年复合增长仅为 5.2%;可比公司来看,全球第一大半导体公司英特尔(Intel)收入/净利润复合增速为 4.7%/5.3%,同业者超微半导体(AMD)收入复合增速为 4.4%,均大幅跑输 Nvidia。

此外,公司在自身不断创造价值的同时也为二级市场投资者带来了丰厚的回报:相比费城半导体指数(SOX)、Intel 及 AMD 近 20 年来的仅一倍股价上涨,Nvidia 自 2000 年至今实现了 50 倍的涨幅,也成为了资本市场中的一枚“核弹”。

Nvidia 自上市以来研发投入绝对值呈现持续增长,单季度研发费用率平均值超 20%。目前公司最新财季研发费用已经超过 7 亿美元,是 AMD 的一倍之多。AMD 在未剥离GlobalFoundries 时采用 IDM 模式经营,因此研发费用率及研发费用绝对值在前期领先于Nvidia,但 Nvidia 在 2011 年后完成了反超。

值得注意的是,AMD 的研发费用被分配于GPU及 CPU两种产品上,而 Nvidia基本上将全部的研发投入用于 GPU产品(历史年份 Tegra处理器收入占比均不足 20%),投入力度可见一斑。

长期研发投入与积累使公司产品技术壁垒及竞争力得以充分提升,利好盈利能力成长。通过观察公司上市以来的毛利率,及营业利润率变化情况来看,剔除经济危机时期影响,Nvidia 的利润率基本保持上行。与同业者相比,Nvidia 的利润率表现也十分优秀,根据市场一致预期,2019 年公司毛利率有望与 Intel 达到同一水平。

 

研发费用绝对值对比:Nvidia vs. AMD

 

研发费用率对比:Nvidia vs. AMD

 

计算芯片厂商利润率对比

 二、AI 芯片的领导地位是如何炼成的

2.1第一阶段:从 PC 图形芯片到游戏显卡

GPU 推出初期,由于市场终端应用以 PC 为主,笔记本及平板的普及度尚低,Nvidia的产品与 PC 出货存在较高程度的绑定,以 OEM 形式销售显卡也是公司重要的收入来源之一。但是,随着半导体行业发展,终端应用趋于多元化,PC 市场热度从 2012 年起开始出现明显下降。

根据 Gartner 统计,全球 PC 出货量从 1Q12 起基本呈现同比负增长趋势。此外,随着集成显卡性能的提升,独立桌面显卡出货情况也开始出现衰退。在此市场环境下,Nvidia 将自身的战略核心转移至高端游戏卡领域。

根据公司披露,2010-2015年在全球 PC 市场逐步倒退的情况下,Nvidia 游戏显卡出货量 5 年实现 9%的年复合增长,销售均价及收入分别呈现 11%/21%的年复合增长,成功与下行的行业趋势实现剥离。

而若以 2013-2018 年为时间区间计算,公司游戏显卡出货量、销售均价及收入的年复合增长率达到 14%/14%/29%,表现十分优异。正确的战略转型使 Nvidia 游戏业务销售收入在FY2019(截止于 2019/1/31)一举达到 62.5 亿美元,是 FY2015 的三倍之多。

 

Nvidia 游戏显卡出货量,ASP 及收入情况

 

Nvidia 游戏业务单季度收入及同比增长率

收入结构拆分来看,FY2014(截止于 2014/01/31)公司来自于游戏业务的收入占比为 37%,而 OEM/IP 收入占比与游戏业务持平,公司业绩与全球 PC 整机出货情况仍有比较高的绑定关联度。随着 Nvidia 战略重心的转移,FY2019(截止于 2019/1/31)公司游戏业务已经为其贡献了过半营收,而 OEM/IP 业务收入占比下降至仅 6%。

放眼高端、深耕游戏卡的市场战略也让 Nvidia 着实取得了成功。自 2009 年起,Nvidia 几乎每两年翻新一次其 GPU 架构,从 2010 年的 Fermi 到 2018 年的 Turing 已经经历了四次迭代(计算卡的 Volta 架构不计入在内)。尽管 AMD 产品的平面图像清晰度更占优,但为了良好支持游戏应用,更胜于 3D 渲染能力和软件优化的 Nvidia GPU 还是精准抓住了用户的需求,公司市占率从 1H10 的 50%一路提升,曾一度将 AMD 在独立显卡市场的市场份额压制在 20%以下。

Steam 游戏平台的调查数据来看,Nvidia 游戏 GPU 在消费者中的偏好度在近三年来也逐步提升,目前已经以大规模优优势击败 AMD 及 Intel,2018 年采用 N 卡进行游戏的玩家占比已超过 75%。此外,我们看到,更具备性价比的 AMD RaedonGPU 并未得到大规模的市场认可,反而售价高昂的 Nvidia GPU 获得了更好的用户粘性,反映出 Nvidia 产品优异的实际体验。

 

独立 GPU 市占率变化情

 

Steam 游戏平台数据显示玩家对 Nvidia 显卡偏好度持续提升

 

目前主要游戏显卡参数对比(Nvidia vs. AMD)

强劲的游戏业务为 Nvidia 创造了确定的业绩增长与健康的现金流。金准产业研究团队认为,在数据中心业务还未真正开始爆发式增长前,Nvidia 正是靠着游戏市场的成功,为公司大力研发通用计算型 GPU 及 AI 相关应用提供了坚实的后盾,在 Nvidia 练就 AI 芯片市场王者地位的道路上,游戏业务功不可没。

2.2第二阶段:软硬件结合构筑 AI 芯片龙头地位

CUDA 是颇具遇见性的发明,但起初经历众多艰辛。事实上,在游戏业务蓬勃发展的同时,Nvidia 在很早就开始颇具先见性地着手将 GPU 用于通用计算的问题。GPU 由于最初面对的是图形应用,处理的是高度统一、大规模相互无依赖的数据,因此结构中包含大量的算数逻辑单元(ALU),并行运算能力强。十余年前,Nvidia 首席科学家 David Kirk 就在考虑是否可以赋予 GPU 合适的编程模型,将丰富的并行运算资源分享给开发者,使 PC 的计算性能大大提升,这一思想最终得到了 Nvidia CEO Jensen Huang 的采纳。

因此,Nvidia 开始投入大量资源,在 2006 年研发出了能够让 GPU 计算变得通用化的 CUDA(Compute Unified Device Architecture)技术,并让未来每一颗 GPU 都支持 CUDA。2007年,Nvidia 推出了第一代 Tesla 大规模并行运算芯片(并不具备绘图能力)专注通用计算。

当时,加入由于必须在硬件设计中增加相关 CUDA 逻辑电路,使得 GPU die size 增大、散热增加、成本上升、故障率增高,之后还出现了 GF84/86 系列芯片的“显卡门事件”;同时,还要保证每款产品的软件驱动都支持 CUDA,这对 Nvidia 的工程师来说是巨大的工作量。但公司全员通过不懈的努力,顺利度过了艰苦期。

在完成 CUDA 的开发后,英伟达开始积极构建通用计算系统生态。Tesla 系列 GPU 自 2007年推出后得到了持续的发展更新,成为 Nvidia 在实现通用计算中的硬件基础。与 GeForce、Quadro 等产品线不同,Tesla 系列 GPU 通过优化架构设计,最大限度发挥计算能力,而没有绘图功能。近几年,针对日益攀升的算力需求,Nvidia 又推出了 DGX 系列超级计算机,丰富硬件支持。

为更好的服务 AI 普及后的深度学习应用,NVIDIA 开发了用于深度神经网络的 GPU 加速库 cuDNN,在保证性能和易用性的同时尽可能降低内存占用,cuDNN 还可以集成到更高级别的机器学习框架中(比如 caffe);TensorRT 是 Nvidia 开发的深度推理学习工具(本质是 C++库),可加速 TensorFlow 推理,使 Tesla P40/P4/T40 等硬件性能在深度学习中得到更好发挥;而 DeepStream 是通过借助 NVIDIA Tesla GPU 的硬件特性(如优异的解码性能、可通过降低精度加速推理、低功耗等),帮助开发人员快速构建高效、高性能的视频分析的应用程序。

除了上述内容之外,Nvidia 也针对高性能计算、数据中心管理提供了软件、开发者工具及库,通用计算生态系统逐步完善。上述配套系统加强了 Nvidia GPU 的竞争力。

强大的硬件性能及良好的生态使 Nvidia 成为 AI 的领路人,借行业东风,2016 年起数据中心业务开始爆发式增长。半导体行业在经历了智能手机及消费电子驱动的周期后,迎来数据中心引领发展的时代,CISCO 预计,2016-21 年全球数据中心负载将成长近三倍。云数据中心/超级数据中心的加速建设、AI 深度学习及高性能计算等应用在云端落地助力在硬件算力及生态环境两方面具有充足储备的 Nvidia 乘势而上,于数据中心 GPU 市场力拔头筹。

2016 年起(对应英伟达 FY17),公司数据中心业务收入一路攀升,同比增长率连续七个季度(2QFY17-4QFY18)超 100%。与公司其余业务线比较来看,数据中心业务增速领先一直持续了两年时间,增速基本为游戏业务的 2-3 倍。

Nvidia 数据中心业务单季收入及同比增长率

Nvidia GPU 在全球主要云厂商中获得了极大的认可。根据 Liftr 于 2019 年 5 月的调查数据显示,在阿里云、AWS、微软 Azure 及 Google Cloud 中,Tesla 系列 GPU 的市场占有率相比 AMD (产品主要为 FirePro S7150 工作站级 GPU)、Xilinx(产品主要为 Virtex Ultrascale+VU9P FPGA)及 Intel(产品主要为 Arria 10 GX 1150 FPGA)大幅领先,且覆盖 Kepler 架构至 Volta 架构的四代产品,充分说明 Nvidia Tesla 系列 GPU 在通用计算市场的强大竞争力。目前云端 AI 训练及推理任务均离不开 Nvidia GPU 的支持。

FY2019(截止于 2019/1/31)英伟达数据中心业务收入占比已经达到 26%,成为游戏业务外公司的最重要的增长点,公司 AI 芯片龙头地位已经形成。

 

四大云厂商中 AI 芯片市场份额:Nvidia 占据绝对领导地位

2.3第三阶段:遭遇挫折,估值收缩,市值减半

币价大跌是英伟达股价在二级市场受到重挫的直接导火索。在数据中心业务成长同时,一种被称之为“数字货币”的加密资产也在逐渐被人们所熟悉和认可。2017 年起,区块奖励减半,避险货币属性增加更推动了数字货币价格的上涨,比特币价格曾一度接近20,000 美元大关,以太币价格也突破了 1,400 美元。市场近乎疯狂的“炒币热潮”也对半导体行业需求端造成了短期内的强劲拉动。由于 GPU 架构内含有多个流处理器,非常适合进行简单而重复的运算,这与数字货币“挖矿”需求高度重合。高性能游戏 GPU 便被赋予了“挖矿芯片”的属性,渠道内更出现了一卡难求的情况。

之后加密货币市场进入寒冬,随着币价远不及去年创下的高价位,以及新币开采成本持续攀升,越来越多的矿商出售挖矿设备,导致二手游戏 GPU 涌入市场,其中便包括 Nvidia的 Pascal GPU。迅速攀升的渠道库存极大的影响了 Nvidia 游戏 GPU 的销售,先前几季的销售高增量迅速向渠道回吐。这一环境变化使 Nvidia 猝不及防,不得不交出 3QFY19(截止于 2018/10/31)业绩及指引均低于预期的答卷,导致股价在一个交易日内蒸发 230 亿美元。

AI 及自动驾驶市场预期乐观度下降,导致估值收缩影响股价。数据中心资本开支在经历了自 2016 年起的激进扩张后,2018 年下半年起进入消化期,全球数据中心硬件库存水平也攀升至高位,致使半导体行业需求端疲软,部分地区数据中心客户采购甚至出现停滞。Nvidia 数据中心业务收入因此受到较大影响,增速严重放缓,并逐渐出现单季度负增长。行业性的需求疲软使投资者意识到,虽然坚持看好 AI 长期为数据中心行业带来的结构性增长是正确的,但目前资本市场对于 AI 在数据中心迅速落地,并强劲拉动半导体需求的一致预期有些为时过早。

此外,总体来说,2018 年自动驾驶行业并没有取得实质性突破,且整个行业都被聚焦于3 月 Uber 无人车出现意外致行人丧生一案上。调查显示,测试车虽然检测到了路边的行人,但反应时间长达 6 秒,且安全员当时并没有集中注意力,导致了悲剧的发生。

该事件证明,Uber 自动驾驶车的传感器与计算机系统显然还不能在生死攸关的时刻做到百分之百可靠。另外,Waymo 与 Cruise 在路测中也遇到了不同程度的问题。上述事件的发生,导致自动驾驶行业的发展现状受到投资者质疑,加之监管机构对安全的愈发重视,汽车真正走向自动驾驶的时间点更变成了一个未知数。Nvidia 汽车业务也因此并未实现高速增长4QFY18/1QFY19 两季表现甚至与去年同期几乎持平。

2.4第四阶段:游戏、数据中心、自动驾驶三驾马车助力公司迈向千亿美金市场

电子竞技为台式机游戏市场带来成长空间。电子竞技被新生代游戏玩家所追捧。根据Newzoo 预计,在 2020 年全球电子竞技观众数量将超过 5 亿,PC 游戏玩家将有望增长至3.5 亿。电子竞技对于每秒传输帧数(Frames per second,FPS)的需求继续增加,有望推动公司高端游戏卡销售,继续拉动公司游戏业务实现增长。

Nvidia GPU 在电子竞技市场的渗透率目前仍然偏低。虽然电子竞技的观众数量在持续提升,但观众中真正玩游戏并为满足游戏配置需求而购买 Nvidia GPU 的人数占比并不高。根据 Newzoo 预计,2017 年 5 月份仅有 58%的“狂热”电子竞技观众玩他们平常所观看的游戏。这当中只有一半的人使用台式机,而其中又有一半的热门游戏对 GPU 的配置要求并不高,这些游戏使用算力较低的集成式 GPU 就已经能够获得较好的游戏体验。独立高端游戏卡的发展空间依然广阔,有望在未来继续推动公司收入规模扩大。

Nvidia 在 VR 市场布局较好。Nvidia 是少数建立了 VR 生态的公司之一。Nvidia 通过 HolodeckVR 平台助力于设计师大型 3D 模型的协同开发。和 PC 游戏类似,性能对于 VR 设备至关重要。目前 PC 游戏对画面的配置要求平均是 30FPS 帧率、 1920×1080 分辨率。Nvidia认为 VR 设备最低的配置要求是前者的 7 倍(即 90FPS 帧率、3024×1680 分辨率),推荐的配置要求是前者的 20 倍。

VR 设备的高性能需求将使得 Nvidia 产品进一步高端化。公司计划将 GeForce GTX 1060 或者更高端的 GPU 用于具备 VR 功能的台式机或者笔记本。Nvidia 的 GeForce GTX 1060 目前的售价为 299 美元,性能更强大的 GeForce GTX 1070 和 1080 目前的售价则分别为 449 美元和 699 美元。而市场上分离式 GPU 目前的平均售价仅约 94 美元。

Nvidia 率先推出光线追踪 GPU。光线追踪算法通过计算光线照射的位置,模拟彼此相互作用的效果,就像人眼看到真实的光线、阴影和反射一样,以实现更逼真的阴影和反射,大幅改善半透明和散射效果。过去,光线追踪算法由于需要消耗大量的算力,仅仅被应用于电影和电视节目的后期渲染。2018 年,Nvidia 在 Gamescom 上发布 Turing 架构 GPU后,光线追踪算法开始被应用于 PC 游戏上。

光线追踪技术有望继续给公司游戏收入带来成长空间。目前,《战场 5》(光线追踪反射)、《地铁:离去》(光线追踪、全局照明)、《古墓丽影》(阴影光线追踪)等游戏已经支持光线追踪效果。《赛博朋克 2077》、《使命召唤:现代战争》等游戏已经确定采用光线追踪效果。我们预计,未来会有更多的游戏开发商加入到光线追踪的阵营中。目前 Turing 架构显卡的用户基数仍然较低,Nvidia 预计未来更多客户将会趋向选择高端显卡。

1)数据中心业务展望

Nvidia 预计到 2023 年数据中心业务面对的市场规模将达到 500 亿美元。其中,高性能计算市场规模将达到 100 亿美元,超大规模&消费互联网市场规模将达到 200 亿美元,云计算市场规模将达到 200 亿美元。公司计划通过新一代加速计算平台的推出和生态环境的扩张来保持和市场同步的增长率。

高性能硬件大幅降低总体拥有成本,创造长期商业机会。Nvidia 数据中心业务可以分为高性能计算、人工智能和深度学习以及可视化三大部分。目前,Nvidia 数据中心业务约50%的收入来自于人工智能和机器学习,约 40%的收入来自于高性能计算。GPU 对于上述应用的优化加速可以使终端客户以较低的成本获得与传统 CPU 同样的性能输出,成本的节约是 GPGPU 商业化的长期驱动力。

Nvidia 数据中心业务将受益于数据中心的“云化”,在深度学习领域进一步保持领先地位,云端训练/推断齐头并进。目前,一些公司最重要的商业数据已经实现“上云”。不过,这些数据潜在的商业价值仍亟待高性能计算进行挖掘。Nvidia GPU 算力强大,能够较好地满足这一要求。凭借强大的并行计算能力,Nvidia GPU 在云端 AI 训练芯片中已经有着较强的垄断地位。2018年上半年,Microsoft Azure就宣布了将通过 Tesla V100提供深度学习云服务,Amazon、IBM、Oracle 和 Google 云也同期宣布通过 V100 来支持深度学习数据集训练。

推断芯片方面,Nvidia 也在 3Q18 发布了共有 320 个 Turing Tensor Core 及 2560 个 CUDA核心的 Tesla T4 芯片,其在运行同等环境的语言推理任务上,将比上一代 P4 芯片快 3.5倍,与此同时,Nvidia 还推出了用于优化深度学习模式的 TensorRT 软件来构建生态配合云端推理。

目前众多竞争者继 Google TPU 后开始加入云端 AI 芯片市场竞争,如 Intel 推出了 Nervana神经网络处理器 NNP-T/NNT-I 用于云端训练/推理,华为推出了“昇腾”系列芯片用于云端训练/推理,而阿里平头哥也推出了“含光”系列芯片用于云端推理,三者均有不俗的性能表现。但金准产业研究团队认为Nvidia 凭借良好的先发优势,硬件优异的性能和生态系统的兼容性,在数据中心 AI 芯片逾 500 亿美金市场的训练端仍有望保持强劲的竞争实力;而在推理端,部分非未自研 AI 芯片的云厂商是公司的主战场。

2)自动驾驶业务展望

Nvidia 自动驾驶业务由车载娱乐系统、ADAS 系统和自动驾驶系统三大部分构成。目前,车载娱乐系统和 ADAS 系统是公司该业务的主要收入来源,自动驾驶系统则是未来收入的巨大增长点。

较高程度的自动驾驶预计将在 2025 年到来。根据 Gartner 的预测,到达 SAE 定义的 Level5 级别自动驾驶主要分为三大阶段。第一阶段包括 Level 0 和 Level 1 级别的自动驾驶,这一阶段驾驶员仍承担全部或绝大多数的驾驶任务。第二阶段包括 Level 2 和 Level 3 级别的自动驾驶,这一阶段驾驶员将部分从重复性的驾驶操作中解放出来。最终,第三阶段将实现完全自动驾驶,驾驶员将几乎不涉及任何操作。

Gartner 预计第一阶段将于 2022 年结束,第二阶段为 2022 年至 2025 年,第三阶段将于 2025 年到来。

自动驾驶技术目前处于第一阶段向第二阶段的过渡,未来可期。Tesla、GM、BMW 等厂商均已经推出了搭载有自动导航模式的汽车,Audi 在 2017 年 7 月宣布已经成功研制出了Level 3 级别的自动驾驶汽车。大部分的汽车厂商目前均有在研发自动驾驶技术,相关厂商预计将在 2020、2021 年左右开始量产半自动驾驶汽车。

第三阶段到来后自动驾驶系统有望成为 Nvidia 自动驾驶业务主要增长动力。根据金准产业研究团队统计的预测,CY2021 完全自动驾驶汽车的销售数量为 5.1 万辆,而这一数量将迅速增长至 2040年的 3300 万辆。Nvidia 预计,到 2035 年所有的汽车均将实现 Level 2 到 Level 5 不等的自动驾驶程度。

基于 ABI Research 的数据,Nvidia 预测,到 2035 年全球将有 1 亿辆自动驾驶汽车和 1000 万辆无人自动驾驶出租车,市场规模将达到 600 亿美元。在此之前,Nvidia自动驾驶业务的收入构成将和现在类似,即主要为车载娱乐系统和 ADAS 系统。而随着Level 4 和 Level 5 级别自动驾驶的到来,Nvidia 目前所积累的技术未来有望帮助公司获得较大的市场份额。

三、对中国计算芯片行业的启示

目前中国在计算芯片领域快速进步,但仍与海外存在巨大差距。根据中国半导体行业协会的数据,2018 年中国共有 1,698 家设计企业,数量同比增长 23%,但销售过亿元的企业仅为 208 家,集中度不足,具有绝对实力的公司数目尚少。按产品领域分布来看,终端应用为计算机的设计企业数量由 2017 年的 85 家上升至 2018 年的 109 家,销售额大幅提升 180.18%至 359.41 亿元,占到中国设计行业市场销售总额的 13.95%。

倘若与 Nvidia相比,2018 年中国终端领域为计算机的芯片设计企业收入总和还不及 Nvidia 的一半(Nvidia FY19 收入为 117.6 亿美元)。从产品上来看,2018 年天津海光研发的兼容 X86 服务器的 CPU 流片成功,进入小批量量产;桌面市场中,上海兆芯推出了国内首款支持 DDR4的 CPU 产品 ZX-D,包含 4 核心和 8 核心两个版本,首批产品主要被上海市政府采购。因此上述二者均还未能实现大规模商用。GPU 方面,我国的基础更显薄弱,上市公司中景嘉微具有自主研发 GPU 并产业化的能力,但目前主要销往军用市场。

持续的研发投入是弱者后发制人的必由之路,也是强者恒强的不二法门。作为轻资产运营的 Fabless 行业,研发投入是永远的重点。横向对比 A 股目前上市的芯片设计企业,相对优质的标的基本保持了 15%以上的研发费用率,头部厂商如汇顶科技(603160.SH)的研发费用率超过 20%。

与模拟芯片不同,计算芯片属于数字芯片的一部分,数字芯片产品生命周期短、迭代速度快是一大特点,只有持续的研发投入才能确保产品的竞争力,获得理想的利润率。参照我们前文的分析,Nvidia 自上市以来,研发费用绝对值几乎呈一路上升趋势,与收入同步成长。

即便在行业下行周期,公司也并没有削减研发投入的力度。计算芯片是设计业中市场规模最大、技术壁垒最强的行业,中国计算芯片厂商作为行业的后进入者起步艰难,只有大力的投入研发,来呈现差异化的产品,才能把握住“国产替代”的发展契机。

软硬件结合战略提供良好生态环境,增强客户粘性与认可度。回顾 Nvidia 近 20 年来的发展,我们发现,其在不断刷新硬件性能极限的同时,也在全力投入软件研发,配合其硬件构建一套兼容性高、易用性强的生态系统,即以 CUDA 平台为核心的 GPU 通用计算解决方案。

相比开源的 OpenCL,CUDA 凝聚了更专业的 Nvidia 工程师团队的辛勤努力,针对自身产品做出的优化发挥了 Nvidia GPU 最大的效能,其更少的缺陷和及时的更新修复也增强了客户的粘性与购买偏好——单单从 GPU 架构上来看,Nvidia 产品的单精度计算力并不强于 AMD,相对售价也偏高。金准产业研究团队认为,尽管中国计算芯片厂商在仍处于发展初期,但更不应忽视配套软件的开发,软硬件结合齐头并进才能取得属于自身的一席之地。

数据中心及云计算成为未来最重要增长点。按市值计算,目前全球科技公司中排名前 4位中有 3 家主营业务均属于互联网/云计算/数据中心行业(MSFT/GOOG/AMZN),反映资本市场对该行业的强烈看好,蓬勃发展的互联网/云计算/数据中心也将为半导体行业带来巨大的潜在市场增长。FY2016-FY2019,Nvidia 数据中心业务收入从 3.4 亿美元增长至29.3 亿美元,CAGR 达 105%,超过游戏业务(CAGR~30%)三倍之多。

根据金准产业研究团队统计数据,尽管目前无线通讯仍然是半导体行业终端因公占比最高的一环,但在 2017-2022 年间,数据处理任务相关半导体市场将保持高个位数的增长。中国的互联网企业、云厂商及超级数据中心(如阿里、腾讯、百度等)在全球同样拥有重要地位,其云端硬件市场国产替代空间可观。金准产业研究团队认为中国本土芯片设计厂商应全力把握与数据中心、云计算等行业共同成长的机会。

结语

金准产业研究团队认为,GPU在“深度学习”领域发挥着巨大的作用,因为GPU可以平行处理大量琐碎信息。深度学习所依赖的是神经系统网络——与人类大脑神经高度相似的网络——而这种网络出现的目的,就是要在高速的状态下分析海量的数据。GPU对于人工智能领域具有重大意义。英伟达制造的图形处理器(GPU)专门用于在个人电脑、工作站、游戏机和一些移动设备上进行图像运算工作,是显示卡的“心脏”。在这波人工智能浪潮中,公司正从一家显卡供应商转变为人工智能服务器供应商。并且,可以预见不远的未来,英伟达会成为一家人工智能硬件巨头。纵观英伟达公司的发展史,学习其成功经验,不仅对我国AI行业,甚至对整个半导体行业都有重大意义。

 

 

金准产业研究 中国零售科技与潮流趋势研究报告 2019-10-18 18:03:09

前言

纵观全球零售变迁历史,无论在哪个发展阶段,科技发展和潮流演变始终在驱动零售行业的变革。金准产业研究团队发布“再生与新声”——《中国零售科技与潮流趋势研究报告》,围绕“潮流邂逅科技”主题,分析科技落地与潮流趋势,探究中国零售消费市场风向。

“再生”指的是,科技改造零售行业,技术的落地提升企业效率,优化用户体验;“新声”指的是,大量新事物出现在消费市场上,凭借品牌、模式、场景、营销等手段杀出重围。

一、零售发展历程回顾

1.1科技驱动生产力的飞跃,推动零售变革

随着技术的发展与创新,科技不断提高零售行业的生产力。从18世纪60年代蒸汽机的发明开始,机器开始取代手工劳动,生产效率 得到大幅提升,到新零售时代消费方式逆向引导生产成为趋势,科技助力不同零售业态的诞生与发展,持续提升零售行业的效率和体验,推动零售变革。

 

1.2消费潮流百年变迁,引领零售发展

通过美国、日本消费潮流的分析,消费的趋势大体遵循温饱-大众消费-个性消费-理性消费几个阶段,与消费者经济水平直接相关。2018年中国人均GDP超过9000美元,基本相当于美国1975年和日本1980年的水平,中国的消费潮流正处于追求个性化的阶段。这也 决定了当下零售行业的商业趋势,以消费者为中心,消费核心转向消费者的精神满足和购物体验,以丰富的消费方式实现多样化的 消费理念。

 

1.3科技推动与潮流牵引,共同驱动零售迭代

通过云计算、大数据、人工智能等互联网底层技术能力,链接品牌商、供应商、分销商、服务商等零售业生态伙伴,向着高效、智能方向发展,形成全新的商业基础设施。科技对零售产生巨大的推动力。

居民消费购买力日益攀升,消费主体个性化需求特征明显,消费主权时代到来,对商品与消费的适配度提出了更高的要求。潮流作为消费者需求的直观表达,对零售变革产生巨大的牵引力。

 

二、再生,技术赋能,驱动零售变革

2.1核心技术应用

科技赋能零售的底层逻辑——数字化转型。

传统零售产业中,品牌商尤其是实体品牌主要依赖传统经销网络,尽管在长期以来传统经销体系贡献良多,但是当下市场竞争激烈、消费者需求瞬息万变的客观环境也暴露出传统经销网络的痛点:对于消费者缺乏认知,市场感知度低,传统通路和供应链后端支撑力度和运营效率低下。

因此金准产业研究团队认为,科技赋能零售的核心意义是实现产业级数据的打通,帮助产业链环节实现数字化转型。

IoT、AI、云计算等新兴技术的快速演进和应用,使得海量数据得以存储和沉淀,并且增强了数据的可读性以及可操作性。反过来,科技又推动数据从可测量维度以及整体量级“两方面”快速增长。数据的效能逐步显现,企业拉近与市场的距离,提升运营效率,消费者亦受益于由此产生的客户体验优化。

 

科技赋能零售的框架

人工智能、云计算、大数据、物联网、生物识别等技术构成科技赋能的基础,通过技术的迭代与聚合,科技为零售行业的发展提供了一系列的解决方案。

技术与行业的融合度不断加强,在零售行业的转型和升级过程中,科技应用逐渐落地,进一步提升行业的流通效率和服务体验。

 

科技赋能零售的主要玩家

随着科技与零售融合,并不断向行业赋能,互联网零售企业、传统零售企业、互联网科技企业、传统科技企业与新兴科技企业纷纷布局,抢占发展先机。

 

核心技术列举

科技是目前推动零售变革的主要驱动力,围绕行业需求和应用场景,云计算、大数据、人工智能等技术持续推动零售数字化,实现 企业数据能力和计算能力的不断提升,从而促进整个零售行业的加速发展。

 

科技赋能零售以后台技术为支撑,共同构筑新的技术体系

科技对商业影响逐步深入,同时技术持续迭代创新,技术应用落地场景增多。以后台技术为支撑,给行业的前台、中台带来一系列变化,同时层级间的技术融合不断产生新的技术体系,推动行业的变革。

 

科技时代零售行业挑战:如何提升消费者体验和企业运营效率

 

2.2 科技升级消费者体验

科技升级消费者体验:放大消费者需求,重新定义消费关系

数字化时代消费者拥有移动化、社交化、个性化的显著特征,在科技的助力下,消费主权得到觉醒。消费者的需求从模糊逐渐变得清晰。零售行业如何实现数字化运营,重新定义客户体验成为一大命题。一方面用户通过社交、移动等数字技术表达消费需求,另 一方面企业通过运营体系和新的工作方式响应消费需求。

 

科技赋能零售的理想状态将会围绕消费者购物过程,全面提升 消费体验和门店效率

科技赋能零售的理想状态将从消费者体验和店铺管理两个层面切入。一方面渗透到顾客消费的每一个环节,依托技术创新,不断提升消费者体验;另一方面,基于前端数据采集、中台数据中心和后端管理系统,店铺不断优化运营效率。

科技在零售的应用场景不断增多,优化体验和服务

随着同质化日益加剧,消费者需求越来越多,零售业的发展开始注重“创新性”,牵手科技领域也是未来行业的一个发展方向。消费者也因此越来越多的受益于科技给消费带来的体验优化。

 

 

云天励飞依托人脸识别、边缘计算等强AI技术入局智慧零售

商簿作为云天励飞面向新商业的主要产品,利用人工智能、大数据、云计算、边缘计算等新技术,构建“智能终端+通用PaaS+场景 SaaS”云+端架构,借助多款自主研发的智能终端,以用户档案、出入管理、商业分析和AI云服务业务应用为导向,提供精准、高效、 稳定的AI数据化运营服务。

 

云天励飞新商业三大落地场景赋能全零售业态

商簿为综合商场、连锁店铺、商业CBD三大不同零售业态提供从全局到细微的针对性服务,实现从万货商店到每个人的商店。

 

科技提高流通效率:对生产企业而言是实现数字化升级,从高质量数据获取到建立分析决策体系。

传统零售行业各环节的信息交互相对割裂,信息化应用程度低。其中主要的原因是缺乏高质量的数据支撑,主要依靠企业上下游和自身的经营数据做出经营决策。科技提高产业流通效率,对生产企业而言就是实现数字化转型,保证高质量的数据获取,同时基于此建立分析决策模型指导经营。

 

科技零售时代,数据成为核心资源,数字化加速流通效率

零售的核心资源之一是数据,企业通过数据的挖掘和分析可以 更好地了解消费者需求,同时也优化整条价值链。通过大数据、 云计算等技术,被数字化的信息在产业链上流通加速,驱动零 售变革。

 

中国零售企业数字化程度偏低,整体建设尚处于起步阶段,成 熟度模型评估得分为2.9分,距离“千人千面,永远在线”的智 慧阶段还有很大差距。 

 

科技提升效率:在供应链环节提升预测能力,优化仓配布局基于大数据等技术,企业逐步打通数据、提升数据维度完整性, 并且引入人工智能、机器学习强化预测评估能力,提高行业的 流通效率,极大程度上优化资源配置。

传统供应链各环节相互割裂,同一环节的资源冗杂,利用率低。在大数据助力下逐步开展数据共享,实现以数据为中心的网络。保证资源被充分利用,降本增效加快响应速度。

 

科技提升流通效率:在物流运输环节逐步采用智能调度系统及自动驾驶等技术

通过大数据驱动的智能调度及规划系统,实时分析车辆状况、用户偏好、配载和外部信息等多维度信息,计算最优的运行排 期和物流路线,降低成本的同时增加效率。

无人驾驶目前处于研发阶段,同时还在积累实测经验中,预计5年内可以实现大规模商业化。彼时,将会对物流运输领域的 模式产生巨大的影响。

科技提升流通效率:在渠道营销环节线上线下融合已成趋势,技术赋能全渠道营销。

对于当前零售而言,线上和线下的融合成为必然趋势,企业的科技能力和数字意识不断提升。企业应用科技,向线上和线下的商业基础设施赋能,使得数字营销与商业基础设施的匹配度不断增强,从而提升客户流量,增加转化率和复购率。

 

科技提升流通效率:在终端交付环节突破门店运营瓶颈

尽管零售业态的商业模式和痛点各不相同,但在门店运营效率上都有着相同的目标,向消费者提供优质的服务实现商业变现是终极理想。然而受限于诸多影响因素,一直以来人工决策占据经营的主导地位。在新兴科技不断投入应用后,门店在人机协同下大幅提升经营的效率,以智能决策为依据的人机配合将是未来一段时间的主流声音。

三、新声,洞察潮流,领跑时代创新

随着社交渠道越来越广泛以及消费主权意识的觉醒,消费者自我关注和精神诉求的表达需求上升,潮流趋势成为引领零售发展的重要力量。紧跟潮流脉搏,把握消费趋势,成为企业在未来竞争中制胜的关键因素。金准产业研究团队从新赛道、新场景和新营销的维度的分析,尝试洞察当下潮流消费趋势。

3.1新赛道崭露头角

潮流趋势是主流消费人群对于需求的现象级表达,当前消费者的消费心理和产品供给的相互作用下造就了消费潮流和新赛道。从消费者精神维度来看,新世代消费者追求时尚、颜值、健康、新潮,需要个性化的产品,表达自身的精神追求。从物质维度来看,消费者期望更加智能、贴心和优质的产品及服务,降低日常生活的难度,享受轻松愉悦的生活体验。从潮牌文化全球搜索趋势能够看出,潮流文化在全球范围内的影响力不断提升,整体的潮流市场也在不断扩大。消费者时尚意识增 强,追求自我表达的意愿强烈,市场热度不断提升。

中国原创潮流品牌逐步从小众走入大众视野。

“国潮” 是中国本土设计师或主理人创立的潮流品牌。中国潮牌兴起于2000年前后,发展至今已有十余年的时间,且拥有与生俱来 “明星”光环,逐步成为当代年轻人身份认同的符号与标志。潮牌之所以能流行开来,一方面源自时尚、前沿、个性的设计风格, 更重要的则是在于品牌对本土文化的彰显。因此近年来传统文化的自信回归以及年轻群体的认同感将中国原创潮牌推向了大众。

全球化市场全品类布局,三大业务主线,你我集团(YOUME GROUP)满足不同人群多元需求。

YOUME全品类加速布局加热不燃烧领域和电子烟小烟市场,分为三大业务主线:Suorin global 业务线、Idols国内业务线、YouMe HNB业务线,覆盖全球消费市场,针对不同区域不同国家提供不同的特色产品。在产品设计及研发上重投入,强化差异性创新价值, 满足用户在外观、口感、性价比等维度的多元需求,集中为用户提供更好更优越的替烟解决方案,满足用户健康品质化的需求。

当代新宠潮玩市场,以IP为核心紧贴潮流文化

潮流玩具,简称潮玩,于1999年由香港设计师 Michael Lau 率先将艺术、设计、潮流、绘画、雕塑等多元素融入玩具载体。潮流玩具,诞生短短20年,已渗入艺术、时尚潮流甚至娱乐等领域,其流行程度和发展潜力可见一斑。潮流玩具市场的爆发不只在于其升值潜力,或者是明星、资深潮玩粉的带动力,而是借着潮流时尚的大潮传递着的精神价值。

 

3.2新场景转型蜕变

零售场的概念泛化,生活方式传递带动商品售卖。

零售销售场所不再局限于传统场景,一切传递产品信息的方式都变得可行,销售思维逐渐弱化,以传递生活方式的交互模式带动潜在销售成为更贴近消费者的方式。在新零售无孔不入的市场环境下,零售商开始感知消费者对于生活方式的需求,在泛化的零售场,传递与之匹配的生活理念进而完成商品交付。

新场景打造生活方式,实现价值跃迁。

在零售边界不断被拓宽的当下,新场景不断被挖掘。颠覆原有的商品售卖模式,打造生活方式,以生活场景获客给企业更多的想象空间。未来的商品将不拘泥于固有的形态和品类,背后传递的精神价值和凸显的生活态度成为价值体现的关键。

 

书店营造生活方式,建立消费联系。

以读者所追求的生活方式为诉求,通过对书店空间、商品、活动的打造,为读者营造了文化的生活方式或某一种特定的生活方式,从而吸引读者、培养读者,并与读者建立起稳定的消费关系,这种举措正成为越来越多书店的选择。在中国,西西弗、言几又、方所、大众书局等书店备受购物中心青睐。南京万象书坊、青岛BC MIX美食书店、广东新华四阅书店等书店致力于生活方式的打造。

走心的“生活方式集合店”关注精神需求,传递生活理念。

随着消费心理的变化,精神消费逐渐取代曾经的物质消费,品牌和业态都尝试从售卖商品向售卖生活方式转型。金准产业研究团队认为,生活方式集合店的核心就在于传达一种文化,通过自己的产品引领或唤醒消费者潜意识中的生活形态。围绕生活主题,以契合品牌理念的产品组合,向消费者提供生活需求服务。

 

中国零售终端竞争日益加剧,集合店已成为一股强大的新生力量。生活方式集合店的终极形态不是出售商品本身,而是提供一种优质的购物体验,传达一种与品牌主张相契合的生活理念,兜售一种未来的生活形态。通过生活方式的传达吸引稳定的客群,进而刺激消费需求的产生和满足。

3.3新营销引领潮流

传统营销的逻辑是流量,通过媒体曝光实现获客,向媒体购买用户。新营销的逻辑是社交,通过内容连接用户,通过用户获取用户。因此传统营销基于流量红利的前提下,更多关注获客的环节。然而当下流量红利见顶,存量用户现状倒逼新营销模式必须关注用户的精细化运营,从用户属性、留存率、复购率、口碑和向他人推荐的意愿等多维度出发,保证营销的最大化效能。

 

新品牌营销关键词:社交裂变

新品牌的营销逻辑重点关注社交,通过原有用户获取更多的用户。这一策略在当前获客成本高昂的情况下甚至是商业模式的核心。拼多多、瑞幸以及社区团购的模式都通过社交裂变,收割海量的用户。

拼多多通过低廉的商品价格,让用户通过发起和朋友、家人、邻居的拼团购买商品,从而实现裂变式传播。拼多多的商业逻辑是以低价换取用户社交圈的开放。赠饮是瑞幸的主要营销方式之一,也是撬动用户社交网络的关键。比如“免费送好友,各自得一杯”和 “买2赠1,买5赠5”。再如社区团购模式,它以社区为中心,以团长作为分发节点和信任代理,消费者通过微信群、小程序等工具,拼团购买生鲜、日化用品等。这些新型的购物形式,其实就是一种社交裂变机制。

从社交推荐制度看新营销渠道

内容营销中,决定用户留存的关键因素在于用户是否能够获得优质内容,因此社交推荐机制的优化也催生了新营销渠道。

最早BBS和博客都是中心化的编辑推荐制,由专业编辑来决定优先推送给消费者的内容。之后微信公众号开始使用去中心化的社交推荐制,通过用户将偏好的公众号内容转发到朋友圈、微信群,从而给公众号带来更多用户和粉丝。而头条系的崛起,离不开其个性化的算法推荐制,通过大数据来分析用户的需求,从而实现精准推送。

 

短视频火爆凸显短视频营销价值

根据CNNIC第43次互联网发展报告数据,截止到2018年12月中国短视频用户数达到6.4亿,短视频网民使用率高达78%。短视频成为文字、图片后用户表达的新方式,短视频与社交的联系日趋紧密,这也促使了短视频行业的快速发展。

移动端短视频化后,视频的内容形态让美食、商品、旅游等场景更加生动。与此同时,短视频平台以极快的速度,在更广的传播范围内催生了一大批网红景点、美食、爆款产品等,吸引年轻人打卡并逐渐成为潮流。因此,越来越多的品牌和企业选择短视频平台作为营销的主力入口,短视频营销的价值开始凸显。

跨界营销,打造“1+1>2”的效果

跨界作为品牌营销上的一个重要手段,能够发挥不同类别品牌的协同效应,以相对较小的营销动作实现较大的声量。从本质上来看,跨界营销的本质能够解决品牌现阶段的瓶颈问题,比如品牌年轻化、用户量或用户场景等。金准产业研究团队认为,当跨界合作形成能够提升用户的消费体验,帮助企业获取更多有价值的用户,那将是一次成功的跨界。

金准产业研究 2019年中国教育信息化行业研究报告 2019-10-17 17:45:46

前言

教育信息化2.0时代,教育相关政府/学校以更开放的姿态对待社会各类业态的进入,共建共享优质教育资源,提升教育公平与教育质量。同时2.0时代希望将1.0时代买来的设备用起来,收集并实现各类数据的连通,以数据为驱动来提升教学效率和体验。

2019年中国教育信息化市场规模预计突破4300亿元,其中财政性教育经费大约贡献了70%-80%的份额,国家拨款是市场发展的重要推动力。

教育信息化市场产业链上各服务环节的界限趋于模糊,但上中下游市场特点明显:上游重资产,中游重渠道,下游重效率和体验。

整个教育信息化市场呈现出市场体量大、市场高度分散、地域性强的特点,垄断型企业尚未出现意味着市场可供攫取的空间非常大,各领域企业伸出触手开始圈地。

金准产业研究团队认为,现阶段教育信息化行业处于缓慢平稳增长期,企业间竞争加剧的同时合作也不断深入。新技术带来的产品和服务升级、C端用户付费市场的拓展等都是刺激行业快速增长的机会点。

一、宏观环境:坐享天时地利人和

1.1教育信息化行业研究的必要性

B端到C端研究的转变:

教育行业toC市场重点在于满足C端用户对“效果”的满意度,而toB市场则更加强调帮助企业客户提高管理和运营效率、降低运营成本。作为与toC截然不同的市场,教育信息化行业有其独特的发展特征与发展逻辑,对其开展系统性的研究也极具必要性。

市场成型且进入发声期:

我国教育信息化市场已经明确成型且处于日益激烈的市场竞争阶段,各类玩家纷纷通过投资、并购、战略合作等形式整合并最大化输出自身资源,进而为学校、政府、教育机构提供更加完善的服务,占领更大的市场。因此金准产业研究团队针对教育信息化市场的研究需更加关注企业的服务链路及其周边潜在机会,分析业内重点企业的布局和运营思路,帮助市场玩家或待进入的企业了解行业重点竞争领域、洞悉行业发展动态,促进行业健康良性发展。

市场空间大,潜在机会多:

从需求端看,50.7万余所学校(含学前教育)、2.6亿余在校生(含在园人数)和1600余万在校老师,对信息化的需求庞大且持续。

从供给端机会看:1)硬件产品会随着技术升级而进行产品迭代;2)软件及服务产品随着服务场景的深化、数据分析技术优化、与AI技术的深度融合而有更多可供挖掘的个性化的、定制化的服务类型;3)内容方面,新增科目知识体系的合作开发、原有科目知识图谱的建立与抽象等都是潜在机会;4)B端提供服务后,潜在的C端流量入口已经占据,对C端付费市场的挖掘仍充满想象空间。

1.2主要服务类型

软件/技术服务和内容服务是目前最为活跃的两种服务类型

现阶段教育信息化企业主要有四种服务类型:1)硬件提供商;2)教务管理软件/技术平台提供商;3)教学管理软件或教学内容提供商;4)补充性的课程解决方案提供商。第一种和第二种侧重于教学、教务线上化,得益于政策自上而下的推动,市场发展快且相对成熟,行业主流玩家多具有成立时间长、具有政府背景或母公司支持的企业。第三种和第四中则是将服务场景拓展至教学过程中,多为创业公司在不断摸索,向学校(B端)或学生/家长(C端)收费是其主要业务展开逻辑。第三、四种模式主要有三个问题:其一,服务对象涉及老师、学生甚至家长,不同用户在需求、使用习惯、使用目的等方面有所不同,但市场同质化竞争激烈,企业需要考虑开发成本、开发周期和差异化竞争等因素;其二,受政策影响大,企业的业务逻辑可能因为政策不向好而停滞,甚至终止;其三,如何为C端提供有价值的服务并收费需要不断摸索和验证。

 

 

政策环境:教育信息化2.0做创收

“用”为出发,以数据为驱动,以提升效率和体验为根本,加快实现教育现代化

 

技术环境:教育+科技的不断试探

成熟技术向教育领域“蔓延”,一定程度上提升学习效率

技术在教育的应用滞后性强,即技术成熟了,与教育的适配性或融合度不一定高。整体来看,现阶段中国的教育+技术主要有三点特征:其一,体制内学校受教育部门监管严格,改革难以推进,其受技术影响的速度和程度都比体制外培训机构慢;其二,高学龄阶段受众成熟度和自控力比较高,教育+技术的应用程度更深;其三,技术多应用在教学活动的外围层次(即“练-测-评”),相关的学习数据结构化程度高,分析和反馈机制好;与思考和规划相关的核心环节“教”现阶段尚处于初级阶段,产生的数据也是非结构化的,数据资源无法有效利用。但即便如此,师生的教学效率已在一定程度上得到提升,未来技术与教育的深度融合将为教学效率的提升带来更广阔的想象空间。

 

二、市场空间:四千亿市场等待被分割

2.1教育信息化整体市场规模

2019年教育信息化市场规模预计突破4300亿元

金准产业研究团队统计及核算数据显示,2019年中国教育信息化整体市场规模预计突破4300亿元,未来两年持续增长但增速趋于稳定。教育信息化1.0时代的快速增长得益于硬件设备自上而下的推广和购买。十九大之后,硬件普及基本完成,教育信息化2.0时代刚进入以客户为导向的软件和服务市场,市场处于赛道抢占期。未来,随着5G、AI、VR/AR等技术在教育领域的应用,新的硬件升级、覆盖于整个教学活动的软件服务以及C端用户的付费场景增加等,整个教育信息化市场将迎来一波新的高速增长机会点。

 

2.2产业链条:要产品要服务更要有渠道

现阶段教育信息化产业链结构

上游企业市场集中度高,中游市场极度离散,中游企业对下游市场的拓展受渠道关系影响大

 

中游端:重渠道、重合作赛道

技术+合作是硬件产商迎接一下增长红利的关键

现阶段,教育信息化硬件设备供应商优劣势明显。其中优势主要有三点:其一,采购政策自上而下推行,市场盈利模式清晰(即直接向政府/学校收费);其二,受技术推动,硬件产品的品类和覆盖范围不断扩大;其三,经过教育信息化1.0的建设期,厂商已积累了一定的客户资源和渠道。反观不足,也有三点:首先,硬件设备未真正用起来,用户对产品依赖性差;其次,现阶段硬件普及基本完成,预算申请难度大,市场增量空间有限,未来市场红利可能出现在与技术升级相关的硬件设备升级或迭代方面;最后,市场渠道依赖性强,很难全国性扩张。就未来而言,硬件设备产商一方面需要把握新技术(如5G)的节点,加速产品升级或迭代,另一方面,更需要与软件产商、集成商深度结合,互利互惠。

 

 

中游端:重渠道、重体验赛道(1)

教育信息化软件服务市场重视用户体验,易垂直细分、易聚集流量、易规模经济,但也易沦为标准化产品

 

中游端:重渠道、重体验赛道(2)

综合类服务供应商本身具有很强的渠道优势和客户资源,对内可提供整套服务,对外拓展可成为系统集成商的角色

 

2.3市场特征:多方混战,各显神通

特征二:市场极度分散(1)

A股上市企业教育业务占教育信息化市场的比重不足4%

教育信息化覆盖的服务场景广,服务对象涉及从学校到政府、从校长到教职工、从学生到家长等各个类型,服务内容囊括了政府管理、学校运转、教师教学、学生学习、家校沟通等方方面面。从市场主流玩家来看,包含传统教育信息化企业、新兴创业型教育信息化企业、大的互联网企业、传统教育企业以及其他或转型或布局的企业五大类,市场参与者众多,但又高度离散。据金准产业研究团队不完全统计,2018年部分A股上市的教育信息化企业中教育营收大致150亿左右,占整个教育信息化市场规模的比重在3.7%左右,市场极度分散。

 

特征二:市场极度分散(2)

部分A股教育信息化企业的服务内容和营收情况

从部分A股教育信息化企业的服务内容来看,单一服务类别的企业较少,大部分都有两种或两种以上的服务。这与他们进入市场较早,积累了足够的渠道资源、客户资源等息息相关,同时这些资源的积累为他们向系统集成商的角色过渡提供了重要的支撑作用。现阶段A股上市的教育信息化企业营收高,但教育业务占比低,教育市场服务竞争激烈。

 

 

三、发展启示:搜索新一轮市场增长点

3.1启示一:部分玩家向集成商发展

系统集成商的数量和类型增加,市场扁平化程度高

据金准产业研究团队不完全统计,A股上市的教育信息化企业中有超过50%的企业提供系统集成服务,新三板中有25%的企业同时发展系统集成服务,整个市场玩家中系统集成商仍有较大空间可供攫取,市场扁平化程度有望增加。渠道、客户资源、口碑、管理、服务、技术和整合能力等是系统集成商的核心要素,对于渠道依赖性强、产品同质化程度高的教育信息化行业而言,很多厂商都可以结合自身优势资源而向系统集成商发展,通过拓展服务类别和服务范围,既可以夯实已经建立的客户资源,又可以丰富/构建产品体系,提升抗风险能力和竞争力。当然提供集成服务时尽量做到服务体系轻量化、操作/管理简易化。

 

3.2启示二:马斯洛需求的适用性

欠发达地区的教育信息化市场空间大,拓展相对容易

不同地区的教育信息化程度受当地的经济、政策等影响而不同。对于发达地区而言,经济水平高,高精尖产业多,其教育信息化程度高且对教育信息化的要求更加具象,如将什么知识通过什么方式点引爆后,可以促进学生的独立思考能力、针对性的学习路径设计和学习内容推送等。贫困地区属于市场空白区,他们的诉求比较集中,即获得优质教育资源,满足师生教学需求。相比较而言,欠发达地区无论是教育部门还是学生对教育信息化都有一定认知,并且希望通过信息化助力当地教育质量提升、教育公平普及,故当地对教育信息化企业接纳度高。能够带来优质教育资源、丰富教学方式、提升教学沉浸感的企业将优先获得当地市场“入场券”。

 

3.3启示三:C端增值服务市场值得拓展

如何将C端流量转化为付费用户是关键。

目前教育信息化市场比较成熟且经过市场验证的服务模式是直接向教育部门/学校/教育机构售卖自上而下的硬件产品、软件、平台,对于将教育部门/学校/教育机构作为通道打开C端流量入口进而向C端收费的模式(即2B2C模式)一直处于探索阶段,虽然有成功的案例(如口语100向学生收取人工智能老师的服务费用),但就整个市场而言,2B2C模式的服务价值需要不断挖掘和放大,以满足C端市场的付费意愿和期许。金准产业研究团队分析,整体来看,企业想要针对C端用户收费,首先需要了解用户不同阶段的需求,其次要结合自身资源制定满足用户需求的方案,最后要衡量提供的服务是否能够打破用户付费意愿与需求程度之间的落差。在提供C端服务的过程中,企业需要注意两点,即投入产出比和实时把握政策风向。

 

 

从需求满足看,短期内重点满足定制化需求,长期看需要关注行业标准化走势;从客户拓展看,离客户越近的渠道,其投资价值越高

 

结语

大企业打造生态布局,小企业提升服务价值。

对于上游产商:

明确自身业务体系构建的方向和全局性,针对性的寻找下游合作伙伴,打造企业全产业的生态布局。

对于中游硬件提供商:

1)5G风口下VR/AR市场、直播教学市场值得重点关注。

2)大的硬件提供商可以利用自身渠道、客户等优势直接向系统集成商过渡。

3)细分垂直领域对硬件设备的需求也可能出现小而美的市场,如音乐类。

对于中游软件提供商:

1)对于深度垂直且易沦为标准品的软件服务商,主要有两种路径:其一,向整体解决方案提供商发展;其二,守住学校流量入口,争取C端市场,保证潜在增量空间。但现阶段从可行性方面看,更看好第一种路径。

2)对于深度接触教学活动的软件服务商,如教学系统,挖掘并利用自身的数据资源以建立竞争壁垒是当前重点。目前来讲,与大数据、人工智能等领域的企业/权威机构合作开采数据资源的价值似乎更具可行性。

对于中游内容提供商:

重点要明确自身对校内教育资源的“补充作用”,而不是替代作用。市场新兴的、尚未建立健全的学科是最好的切入点。但内容提供商需要传递出内容的专业、权威性,主要有两种途径:其一,与学校合作,共同研发知识框架和教学内容体系;其二,与业内专家/专业机构合作开发。除了课程内容之外,与新兴硬件相匹配的教学内容资源的开发(如VR/AR在实验、特定教学场景)也表现出一定潜力。

 

金准产业研究 2019年中国HR SaaS行业研究报告 2019-10-16 11:32:39

前言

全球经济疲软的大背景下,国内HR SAAS行业持续火爆。是因为许多企业都感受到了人口红利消失的压力,人力成本呈现持续升高的态势。而2019年1月1日社保入税正式施行后,人力成本还将进一步飙升。这对HR管理提出了更高的要求。

2012年,IBM和VA(即U.S. Department of Veterans Affairs)签下一个1.23亿美元的大单,主要用于把客户的人力资源管理都转移到HR SaaS上。虽然成交价引来了不少吃瓜群众的围观,但同行看到这个长达10年的合同,还是觉得很划不来。很多人不知道的是:云服务最大的优势之一,就在于极高的资源利用率和极低的边际成本。在按需配置的大前提下,服务VA,IBM并没有多大的成本压力,也不影响新品和新客户的开发。云服务的优势,让IBM接下了一般传统软件商搞不定的单子。SaaS模式在企业服务领域持续渗透的同时,也让专注HR SaaS领域的后起之秀,有了更多崛起的机会。

一、HR·SaaS行业概述

1.1研究范畴界定

SaaS模式提供的软件产品,旨在最大化企业人力资源价值。

人力资源服务业是为劳动者就业和职业发展、为用人单位管理和开发人力资源提供相关服务的行业;人力资源信息软件服务属于人力资源服务的子行业。在软件产品SaaS化的整体趋势下,HR SaaS产品应运而生。SaaS产品按照所聚焦业务环节或客户行业的不同可分为业务垂直型和行业垂直型两类,HR SaaS即为业务垂直型中聚焦人力资源管理环节的一类产品。与本地部署的e-HR软件相比,二者类似之处在于,HR SaaS同样基于人力资源管理方法论,旨在通过对人力资源进行分析、规划、实施和调整,最大化企业人力资源的价值,使其能够有效服务于组织目标;二者区别在于,HR SaaS厂商将应用部署在自有服务器上,企业客户以按需订购的模式通过互联网获得服务。

 

 

1.2 HR SaaS的主要功能模块

从人力资源管理理论出发,对六大模块进行整合、拆分。

在人力资源管理理论中,人力资源管理被划分为六大模块,即人力资源规划、招聘与配置、培训与开发、绩效管理、薪酬福利管理和员工关系管理。HR SaaS帮助企业HR团队优化人事工作流程,提高人事管理工作效率,其所覆盖的功能依托于一定理论基础。根据实际工作中的需要,HR SaaS厂商往往会将人力资源管理的基本功能模块整合进核心人力管理,包括组织架构、员工信息、假勤管理等;专业化程度较高的模块往往被单独剥离出来,典型的如针对复杂排班的劳动力管理、与职业培训领域高度关联的学习平台、以及组织调研和人才发展等。

 

 

1.3 HR SaaS的核心价值

付费灵活、快速迭代,强调员工体验和全场景数据打通。

本地部署的e-HR软件的出现让人力资源管理工作化繁为简,通过流程化、专业化的功能模块帮助企业的HR团队提高工作效率,其痛点在于采用一次性买断的模式,大量中小企业没有足够的付费能力。HR SaaS产品继承了传统e-HR软件信息化的价值,并采用按需订购的灵活付费模式减轻对企业现金流的压力。本地部署的e-HR软件往往需要经历短则数月、长则一年的开发的背景下,HR SaaS产品相比以往更加强调最终员工的使用体验,并通过打通全场景的数字化提供智能化的决策、测试、部署周期,对于市场变化的反应相对滞后;SaaS的在线模式让产品保持快速的更新迭代,企业的人力资源管理能够及时匹配最新政策。

 

 

二、中国HR SaaS行业洞察

2.1中国HR SaaS行业发展历程

e-HR软件迈向HR SaaS,市场逐渐走出混战格局。

HR SaaS产品出现之前,人力资源管理的信息化大多通过本地部署的e-HR软件来实现,e-HR与ERP、CRM、SCM等概念并列,属于传统软件时代下的产物。2013年左右采用订阅模式的HR SaaS产品开始集中出现,2015年国内企业级SaaS领域迎来资本风口,HR SaaS同样获得了高度的关注。在资本市场的推动下,HR SaaS厂商间竞争激烈,产品趋于同质化;对大中型企业和中小型企业的定位不明确,造成HR SaaS产品定价的混乱。

HR SaaS的渗透率以招聘管理为首,核心人力、薪酬、培训等其他模块也逐渐被越来越多企业所接受。通过一段时间的口碑积累,当前HR SaaS的主要细分领域均已跑出头部厂商,竞争格局愈发明朗,领先的单模块厂商开始通过提供覆盖全产业链条的产品和服务增强竞争力,进一步巩固优势地位。

 

 

2.2中国HR SaaS市场发展驱动力

第三产业占据就业人口半壁江山,劳动力成本持续攀升。

金准产业研究团队分析,从就业人口的产业分布情况来看,中国第三产业就业人口比例远超第一、二产业,由2014年的40.6%上升到2018年的46.3%。第三产业具有人才密集、人员流动速度快的特点,是人力资源管理的重点服务领域,也为人力资源服务业创造出广阔的发展空间。2018年中国城镇单位就业人员平均工资超过8.2万元,过去五年的年复合增长率达到10.0%。金准产业研究团队分析,人口红利逐渐消失、劳动力成本持续攀升暴露出原先粗放式管理的弊端,企业对以高效率为特征的精细化管理需求快速增加。运用专业的人力资源软件企业提高招聘效率和用人效能,进而实现人力资源保值增值的必要性日益突出。

 

 

 

 

此外,金准产业研究团队认为,企业上云大势所趋,云计算成为企业数字化转型的新动力。

云计算底层技术和产业日趋成熟,随着市场教育的加速推进,企业对云计算的接受程度不断提高。中国信通院数据显示,2018年中国企业应用云计算的比例达到58.6%,较2017年增长3.9%,同时公有云使用率达到36.4%。经历了信息数字化的中国企业,正在由业务数字化迈向数字化转型阶段,运用云计算、大数据、人工智能等数字技术,优化运营管理流程、驱动商业模式变革,向数据驱动的企业组织演变。HR SaaS充分发挥了云服务轻资产、高灵活性的优势,因而被视作提高人力资源管理效率、降低企业运营成本的重要手段。

 

 

云计算利好政策频繁发布,社保个税改革加速HR SaaS应用。

云计算是国家战略性新兴产业,国家和地方层面持续出台利好政策驱动行业发展,包括国务院《关于促进云计算创新发展培育信息产业新业态的意见》、《关于积极推进“互联网+”行动的指导意见》、《国家信息化发展战略纲要》,以及工信部《云计算发展三年行动计划(2017-2019年)》、《推动企业上云实施指南(2018-2020年)》在内的政策,均对云计算在产业发展、应用促进等方面提出明确要求。当前正值社保个税改革新政策推进时期,本地部署的e-HR软件无法快速适应政策调整,企业对人力成本的实时核算需求不断增长,将加速HR SaaS对传统软件的替代。

 

 

2.3中国HR SaaS投融资情况

金准产业研究团队分析,资本市场较去年有所回暖,融资轮次后移明显。

2014年至2019年上半年,中国HR SaaS领域共有188笔融资事件,融资事件数量在2016年达到峰值后逐渐回落。在经历2018年的小低谷后,HR SaaS资本市场再度迎来上升,仅2019年上半年融资规模过亿元的项目就达到6笔。从融资轮次的分布来看,A轮及以前的融资笔数占比由2015的92.6%下降至2018年的56.7%,2019年上半年B轮及以后的融资比例更超过四分之三。HR SaaS融资轮次的后移较前几年相比非常明显,意味着市场正在逐渐趋向成熟。

 

2.4中国HR SaaS市场发展特征

客户基于需求颗粒度在单模块、一体化厂商间进行选择。

金准产业研究团队根据HR SaaS所覆盖模块的范围,行业内存在单模块和一体化厂商两类。一体化厂商往往会以核心人力为基础,覆盖HR SaaS中尽可能多的模块。处在信息化建设初期的企业客户更倾向于选择一体化厂商,以期一次性满足人力资源管理中的各类需求,无需在不同系统间来回切换。相较而言,单模块厂商专注于单点业务,在产品的颗粒度上打磨得更细,适合对该模块需求专业化程度高的客户。单模块厂商和一体化厂商之间并非是完全的竞争关系,企业客户可以选择采用一体化产品覆盖基础的核心模块,而以单模块产品满足专业化程度更高的需求。

 

招聘、培训模块最易渗透,需找准突破口撬动大型企业。

人力资源管理不同模块的SaaS渗透率各异,其中招聘和培训模块的渗透率最高。新兴的招聘SaaS产品弥补了传统e-HR软件的缺陷,渠道整合、AI机器人、招聘门户、H5传播等丰富的功能更适应当下企业的需求;培训模块受益于在线教育市场的火热,包括培训安排、课程管理、平台互动等成熟的功能,让企业能够快速上线一整套培训系统。薪酬和绩效模块对数据安全的敏感度较高,由于社保个税政策改革的影响,薪酬模块加速SaaS化进程,而绩效模块由于自身复杂、个性化的特点,对SaaS产品的要求更高,目前的渗透率相对有限。

在核心人力方面,轻量级的HR SaaS容易渗透进中小微企业。信息化建设较为完善的大型企业更倾向于在保持核心人力系统不动的情况下,逐步在外围应用各模块的HR SaaS产品。金准产业研究团队分析,组织调研和人才发展因为专业化程度高,传统的e-HR软件无法覆盖,可以被HR SaaS厂商作为突破口,通过对“主心骨”形成包围,进而撬动金字塔顶端的客户。

 

2.5中国HR SaaS厂商的竞争要素

以方法论作为底层支撑,实现产品功能与需求的高度匹配。

企业客户选择HR SaaS厂商的关键在于产品能否解决企业管理过程中的实际问题。人力管理、人才管理、组织发展均需要有科学的方法论基础,是否拥有被广泛接受的方法论是区分厂商能力的重要因素。行业内领先的HR SaaS厂商通过设立人力资源研究院,加强对基础理论的知识储备,通过调研和分析来指导产品的优化和升级。

HR SaaS的一对多模式天然要求标准化,头部厂商以PaaS作为SaaS的支撑,可以避免HR SaaS厂商陷入过重的定制化开发。不同厂商的PaaS底层架构技术不同,仅有少部分厂商应用了最新的自动代码生成技术。与此同时,客户成功团队在解决“最后一公里”问题中至关重要,以线下线上相结合的方式帮助客户落地HR SaaS才能更好地实现产品与需求的匹配。

金准产业研究团队认为,相比发展初期各个模块的独立,HR SaaS正在逐渐走向集成化、一体化,既包括人力资源管理六大模块之间的打通,也包括人力资源系统和企业其他管理系统的打通,连接能力更强的产品将在以数据指导决策方面具备明显的优势。

 

 

2.6中国HR SaaS的收费模式

按照使用人数,以功能或套餐的形式收取订阅费用。

随着中国的企业级SaaS由萌芽期逐渐走向成熟,完全免费的模式在市场上已经基本消失。HR SaaS厂商采用按年、季度或月的订阅模式向客户收取费用,不同类型的HR SaaS产品面向的使用人员不同,通常有面向企业的HR团队和面向企业的全体员工两种模式,但整体而言,HR SaaS都根据产品实际的使用人数即账号数量收费。由于HR SaaS产品多以模块化的形式出现,在此基础上厂商可按照功能模块的灵活组合或设置不同梯队的套餐来进行差异化定价。此外,部分HR SaaS厂商提供除SaaS产品以外的增值服务,如薪酬管理大类下的SaaS厂商通常会提供社保开户、社保代缴、工资代发等服务。

 

 

2.7中国HR SaaS产业链结构和产业图谱

各细分领域出现头部玩家,与人工智能厂商加强合作。

由于一体化厂商往往拥有更强的营收能力,HR SaaS在一体化领域最先跑出头部厂商。尽管越来越多的单模块厂商也开始向一体化延伸,但从产品覆盖情况来看,目前一体化厂商和单模块厂商的界限依然明显,包括招聘管理、劳动力管理、社保管理和企业学习平台等在内的细分领域也已经出现头部玩家。由于HR SaaS厂商积极探索大数据、人工智能等技术在人力资源管理中的应用,其与大数据、人工智能厂商的合作正在变得紧密且频繁。

 

 

三、中国HR·SaaS行业趋势展望

3.1 HR SaaS演进路径展望

数字化转型背景下,HR SaaS迈向一体化、智能化的新阶段。

当前中国经济正在由高速增长阶段迈向高质量发展阶段,在整体经济转型的背景下,以数字技术驱动管理流程和商业模式变革的数字化转型概念盛行,HR SaaS将在企业人力资源管理的数字化转型中发挥关键作用。在HR SaaS出现伊始,多以基础人事管理的线上化为特点,工具属性较强,在数据积累的过程中,HR SaaS厂商开始更多的将数据分析应用于管理过程,进一步促进降本增效。海量数据的产生加之人力资源管理六大模块内在的高度联系,企业的管理需求愈发从聚焦业务单点向聚焦一体化转变,数字化转型中比上一阶段的业务数字化更关注的即是整体性规划。金准产业研究团队认为,未来HR SaaS厂商的一体化和集成能力将变得更加重要,而基于各模块数据打通所形成的智能化决策,将驱动HR SaaS迈向新的阶段。

 

 

3.2 HR SaaS未来发展方向

基于底层PaaS平台,提高开发效率,应对复杂需求。

大型企业客户对SaaS服务接受程度的提高,以及人力资源管理一体化需求的凸显,暴露出轻量级、标准化HR SaaS产品的弊端,厂商需要以更细的产品颗粒度来满足客户个性化的需求。基于开箱即用的应用引擎,aPaaS以搭积木的方式允许开发人员进行自由组合,以可拓展、可定制的方式提升应用开发效率、降低开发成本。对于HR SaaS厂商而言,搭建底层PaaS平台的根本在于对业务需求的抽象和总结,提取其中共性的模块。因而PaaS平台的发展路径通常是先自用后开放,自用时即作为HR SaaS厂商的开发平台,支撑定制应用的快速开发,到PaaS平台更加成熟的时候,会逐渐开放给企业客户进行二次开发,并进而开放给合作伙伴和ISV,此时厂商将能够通过形成围绕HR SaaS的服务生态树立起更高的竞争壁垒。

 

 

利用以人为核心的数据,驱动向智能化的人力资本管理升级。

以一体化为前提,可以形成以人为核心的多维度数据,包括招聘、考勤、薪酬、福利、绩效等在内的全方位员工画像,进而驱动企业的人力资源管理向人力资本管理升级。人力资本管理相比人力资源管理更强调人作为资本的属性,注重投资和回报的关系,以实现员工和组织同时发展的目标。在传统服务的模式中,管理咨询通常高度依赖于专家顾问的个人经验,这种商业模式存在人力成本高、无法规模扩张等种种弊端。而HR SaaS厂商基于围绕场景的大数据,在科学的方法论支撑下,将能够提供更加智能化的人力资本管理,以大数据和AI技术技术赋能HR SaaS,重塑传统的咨询服务模式。

结语

随着互联网特别是移动互联网的爆发,企业组织开始朝着去中心化的网络结构开始变化。在未来的企业发布中,各个领域类似拉勾云人事的云端服务黑马和巨头,和海量的中小型使用HR SaaS等云端服务的企业将成为一种正常情况。

未来的企业,将呈现鲸鱼和虾米共存的局面。如虾米般的中小微企业大量存在,他们凭借着灵活的适应能力和低廉的成本,在市场中生存和获利。其中少数的成功者,迅速成为鲸鱼般的巨头,提供给这些中小微型企业以云端的HR SaaS等相关服务。

随着分工的越来越精细化,未来的中小微型企业,尤其是创业公司,将会更加依赖类似云端的HR SaaS企业服务。通过联网和分布的方式提升了企业的效率,降低创业公司的运营成本。系统的安全维护和后期更新都交给专业公司和人员来负责。

金准产业研究 2019年中国区块链产业园区发展现状及趋势预测 2019-10-14 17:48:40

前言

区块链技术作为一种通用性术,从加密资产加速渗透至其他领域,和各行各业创新融合。未来区块链的应用将由两个阵营推动。一方面,IT阵营,从信息共享着手,以低成本建立信用为核心,逐步覆盖数字资产等领域。另一方面,证券通证阵营从出发,逐渐向资产端管理、存证领域推进,并向征信和一般信息共享类应用扩散。

金准数据显示,2017年中国区块链市场支出规模约为8300万美元,初步估算2018年中国区块链市场支出规模达1.6亿美元。现阶段区块链的总体市场规模较小,这是因为市场上的区块链项目多处于尝试阶段,投入不大。另一方面,很多企业已经认识到了区块链的潜力,计划在未来增加预算,受此影响,中国区块链市场将迎来快速增长,2019年中国区块链市场支出规模将近300亿美元。金准产业研究团队预计到2022年末,市场支出规模预计达到14.2亿美元,2017–2022年的年均复合增长率为76.3%。

一、区块链产业园政策扶持

区块链行业的快速发展,吸引了大量创业者和资本的不断涌入,国内各地方政府也开始将区块链技术作为经济发展的新动能。在各地相关政策扶持之下,区块链产业园迅速在全国拔地而起。

地方政府相关扶持政策的力度强弱对区块链产业园区的发展起着至关重要的作用。截至2019年3月,全国已有七个城市出台了区块链专项扶持政策,包含了人才、场地租金、研发、标准以及活动等多项补贴,这无疑大大激发了当地区块链产业园区企业的活力和竞争力。目前,国内7个城市出台的专项扶持政策覆盖了至少10家区块链产业园区。

 

金准产业研究团队认为,中国区块链产业的迅猛发展,其主要依靠国家层面的积极指导,产业发展环境得到建立和优化。同时,地方政府给予了政策、资金等方面的支持,区块链创新发展得到了切实的保障。产业方面的不断拓荒,“区块链+”的持续扩大,解决行业痛点的新应用研发接连涌现。此外,全国各地的区块链行业组织如雨后春笋般出现,也为区块链产业服务生态的形成助力不少。

二、区块链产业园分布地图

从地理区域划分来看,全国区块链产业园区主要集中在华东、华南等地区,其中浙江省和广东省各有4家区块链产业园区,并列全国区块链产业园区数量首位。而从城市分布来看,杭州、广州、上海最多,三大城市区块链产业园数量占比全国50%以上。

 

 

三、区块链产业园区市场格局

国内22家区块链产业园区中,规模在3万㎡以下园区数量最多,占比达到53%;其中1万㎡以下规模的园区占比为21%,1—3万㎡规模的园区占比为32%。规模在6万㎡以上的园区占比为26%,但这类区块链产业园区通常设立在其它综合型园区内,很难统计其区块链行业实际使用面积。

从投资规模来看,投资规模在1亿元以下的的区块链产业园区数量最多,占比达46%;投资规模在1—10亿元区间的产业园区占比为36%;投资规模超过10亿元以上的园区数量最少,占比仅为18%。

 

 

从全国22个区块链产业园综合竞争力排名来看,中国杭州区块链产业园竞争力全国第一,广州蚁米区块链创客空间排名第二,上海区块链技术创新与产业文化基地位列第三。

整体来看,目前国内区块链产业园区发展呈现出明显的“阶梯化”特征,具体可以划分为三个梯队:第一梯队各个园区综合竞争力得分均在95分以上,其中中国杭州区块链产业园、广州蚁米区块链创客空间和上海区块链技术创新与产业化基地总得分超过100分。第二梯队各园区综合竞争力得分处于87—95分区间,仍以上海、杭州、苏州、广州、青岛等沿海城市的产业园区为主;第三梯队综合竞争力得分为87分以下,该梯队的区块链产业园区多集中在长沙、武汉、赣州等内陆城市,也有少数规模较小的产业园区集中在沿海城市。总体来看,第一梯队与第二梯队差距不大,但与第三梯队之间的发展存在较大发展差距。

 

 

四、区块链产业园发展趋势

4.1产业发展不均衡 三大梯队之间差距进一步拉大

由于沿海发达城市与内陆城市产业基础发展不均衡,导致当前各个区块链产业园的发展也存在较大差距。未来随着沿海发达城市区块链发展加快,产业发展不均衡的情况将更加严重,而第一、二、三梯队之间的差距将进一步拉大,区块链产业园发展将呈现两极分化的发展态势。

4.2产业园过剩空心化现象加剧

目前区块链产业园发展仍呈现出不断升温的态势,除了已有的22家区块链产业园以外,包括福州、温州等城市仍在筹建区块链相关产业园区。但从发展现状来看,当前大多数区块链产业园区企业入驻并不理想,空置率较高,随着更多地区筹建规划出台,区块链产业园区将面临过剩的局面,产业园“空心化”现象值得警惕。

我国的区块链行业总体发展尚处早期,数据显示, 有82%的区块链产业园区运营时间没有超过2年。据媒体调查,目前国内区块链产业园存在招商难,空置率偏高,缺乏产业基础和科研优势等问题。截至2019年5月,产业园空置率超50%的有三成,在30%-50%的近五成,在30%以下的仅占两成。

就目前而言,区块链产业园“诞生热”并没有衰减,据了解,福州、温州等城市仍在计划筹建。高空置率相遇高速建设,一旦区块链入驻企业数量跟不上,那么产业园难免出现“华而不实”的过剩局面。据金准产业研究团队调查,2018年6月,杭州新建的区块链产业园,虽然紧邻阿里巴巴西溪园区,有3栋写字楼,提供5000平方米的创业空间,但偌大的园区看着十分冷清。在已经投入使用的写字楼中,也没有发现区块链相关的企业入驻。

对此,金准产业研究团队认为,真正好的区块链项目不需要这种传统孵化的扶持,早有人抢投了,根本不会去这里的。区块链创业不需要看风投的脸色,技术为王,项目有了名气就可以私募,为了不受到政策限制,最好是选择出海。金准产业研究团队分析,虚拟货币的底层技术,区块链更多作为投资炒作的代名词。诚然,这背离了区块链产业园区的建设初衷,但值得思考的是,如果区块链技术以它应有的面貌渗透到了人们的日常生活中,提供着各种曾经难以想象的便利,可能这样的观点会越来越少。然而,要实现这样的局面,前方还有很长的一段路。

4.3区块链产业园发展将走向差异化

现阶段,区块链产业园虽然遍地开花,但同质化现象却非常严重,产业园区集聚效应并不明显。互链脉搏在调研中发现,已有少数产业园区正结合当地的产业结构,重点打造区块链+金融、政务、溯源等为各自主题的应用场景试验区,积极探索差异化特色化发展路线。

结语

1990年,全球战略权威,美国哈佛大学教授迈克·波特在其《国家竞争优势》一书中提到“产业集群”这个概念。集群是指,与行业内相关的供应商、合作与竞争企业、相关领域机构都聚集在某一特定区域。区块链产业园正是需要与之相关的各种组织协同参与,才能发挥预期的产业战略性优势。

金准数据显示,全国22家区块链产业园中,超过60%的园区缺乏下游应用场景或相关产业支撑,另外,目前的应用场景还局限在金融、物流、港口等行业。区块链产业的稳步发展离不开产业链上下游协同,而区块链产业园区的发展更需要相关上下游企业的聚集。目前来看,现阶段大多数区块链产业园区在这方面显得十分薄弱,在选址上也没有太多集群优势。

随着各地的区块链产业园纷纷建成,加之很多区块链项目的生命周期本身并不长,与各行业的区块链应用落地还处于早期探索阶段,科研理论和技术实力也并不成熟,产业集群效应无法生成。暂时摒除盲目跟风、圈地和套利等质疑,政策只是打开了一条路,在路上的终究还是区块链产业的各个环节和方面。

金准产业研究团队相信经过更多轮次的探求和尝试,真正的区块链产业集群效应能够早日发端,区块链产业园区的繁荣也终将实现。

 

金准产业研究 AI和5G赋能服务机器人研究报告 2019-10-11 18:01:22

前言

AI和5G与机器人技术结合,正在不断催生新的消费电子品类。AI解决机器理解世界,以及人机交互的问题。5G拓展机器人的活动边界,并为机器人提供更大的算力和存储空间(云协作机器人)。

根据IFR的分类方法,机器人大致可分为工业机器人和服务机器人两类。传统的工业机器人主要应用于汽车整车和零部件、电子制造、金属和机械、食品加工等方面,其主要特点是按照预定的程序,沿规定路径完成规定动作。

AI/5G如何赋能机器人AI人工智能的应用,催生了服务机器人。服务机器人涵盖的范围非常广泛,包括医疗、物流、农业、商业、民用等方面。通过AI技术的使用,可通过数据采集、分析、计算,服务机器人能够学习人类的行为,理解人类的意图,与人类产生协作。

根据IFR的测算,2017年全球机器人市场达232亿美元,其中,工业机器人市场达147亿美元,每万人的保有量达85台。其余为服务机器人市场,市场规模达85亿美元。到2030年,预计机器人的市场规模达1,028亿美元,约为智能手机市场的20%。服务机器人将达561亿美元,维持16%的年复合增长率,并快于工业机器人的年复合增速。

一、AI/5G如何赋能机器人?

1.1机器视觉硬件可采集周围环境信息

目前常用的视觉传感器主要有:摄像头、ToF镜头和激光雷达技术。机器视觉相机。机器视觉相机的目的是将通过镜头投影到传感器的图像传送到能够储存、分析和(或者)显示的机器设备上。可以用一个简单的终端显示图像,例如利用计算机系统显示、存储以及分析图像。激光雷达技术。激光雷达是一种采用非接触激光测距技术的扫描式传感器,其工作原理与一般的雷达系统类似,通过发射激光光束来探测目标,并通过搜集反射回来的光束来形成点云和获取数据,这些数据经光电处理后可生成为精确的三维立体图像。采用这项技术,可以准确的获取高精度的物理空间环境信息,测距精度可达厘米级。ToF摄像头技术。TOF是飞行时间(Timeof Flight)技术的缩写,即传感器发出经调制的近红外光,遇物体后反射,传感器通过计算光线发射和反射时间差或相位差,来换算被拍摄景物的距离,以产生深度信息,此外再结合传统的相机拍摄,就能将物体的三维轮廓以不同颜色代表不同距离的地形图方式呈现出来。

1.2 AI视觉技术算法帮助机器人识别周围环境

视觉技术包括:人脸技术、物体检测、视觉问答、图像描述、视觉嵌入式技术等。人脸技术:人脸检测能快速检测人脸并返回人脸框位置,准确识别多种人脸属性;人脸比对通过提取人脸的特征,计算两张人脸的相似度并给出相似度百分比;人脸查找是在一个指定人脸库中查找相似的人脸;给定一张照片,与指定人脸库中的N个人脸进行比对,找出最相似的一张脸或多张人脸。根据待识别人脸与现有人脸库中的人脸匹配程度,返回用户信息和匹配度,即1:N人脸检索。物体检测:基于深度学习及大规模图像训练的物体检测技术,可准确识别图片中的物体类别、位置、置信度等综合信息。视觉问答:视觉问答(VQA)系统可将图片和问题作为输入,产生一条人类语言作为输出。图像描述:需要能够抓住图像的语义信息,并生成人类可读的句子。视觉嵌入式技术:包括人体检测跟踪、场景识别等。

1.3 SLAM技术赋予机器人更好的规划移动的能力

SLAM,全称叫做Simultaneous Localization and Mapping,中文叫做同时定位与建图。在SLAM理论中,第一个问题称为定位(Localization),第二个称为建图(Mapping),第三个则是随后的路径规划。通过机器视觉的映射,机器人可以通过复杂的算法同时定位并绘制出位置环境的地图,通过SLAM技术可以有效解决规划不合理,路径规划无法覆盖所有地区,导致清洁效果一般的问题。

SLAM技术当完全不含SLAM的时候,由于没有地图没有路径规划,扫地机器人每次碰到障碍物会沿着随机方向折返,无法覆盖到每一个区域。当有SLAM的时候,可覆盖至任意区域。此外,扫地机器人还配备摄像头,用来识别鞋、袜子、动物粪便等物品,达到智能规避。

1.4基于ToF机器视觉的超宽带定位技术

机器人中,基于ToF技术,主要可用来进行高精度测距与定位,目前常用的就是超宽带定位技术。UWB(超宽带)是一种无线通信技术,可用于高精度测距与定位。UWB传感器精简设备分为标签和基站两种。其基本工作方式是采用TOF(Time of flight)的方式来进行无线测距,根据测距值快速准确计算出位置。

1.5 AI自然语言处理是人机交互的重要技术

人类获取信息的手段中90%依靠视觉,但表达自己的方式90%依靠语言。语言是人机交互中最自然的方式。但是自然语言处理NLP的难度很大,在语法、语义、文化中均存在差异,还有方言等非标准的语言产生。随着NLP的成熟,人类与机器的语音交互越来越便捷,也将推动机器人向更“智能化”发展。机器人的阵列式麦克风和扬声器技术已经比较成熟,随着近年智能音箱+语音助手的快速发展,麦克风阵列和微型扬声器被广泛使用。在钢铁侠陪伴机器人中,与用户的语音交互都依靠麦克风阵列和扬声器,此类陪伴机器人就如同会动的“智能音箱”,拓展了边界形态。目前对话机器人可分为通用对话机器人和专业领域对话机器人。自然语言处理的技术发展,将提升机器人与人类的交互体验,让机器人显得更为“智能”。

1.6 AI深度学习算法帮助机器人向产生自我意识中进化

硬件:AI芯片技术的发展,使机器人拥有更高算力。由于摩尔定律的发展,单位面积芯片容纳的晶体管个数不断增长,推动芯片小型化和AI算力的提升。此外,异构芯片如RISC-V架构芯片的产生,也为AI芯片的算力提升提供了硬件支持。算法:AI深度学习算法是机器人的未来。AI深度学习算法给予机器人通过输入变量学习的能力。未来的机器人能否拥有自主意识,需要AI技术的不断发展。深度学习算法给机器人获得自我意识提出了一种可能性。通过对神经网络模型的训练,一些算法已经可以在单点的领域超越人类,AlphaGo的成功,让我们看到人类在AI技术中,已可实现单类别的自我学习能力,并在一些领域,如“围棋、德州扑克、知识竞赛”等单个领域已经可以媲美甚至打败人类。AI深度学习算法,使机器人拥有了智能决策的能力,摆脱了之前单一输入对应单一输出的编程逻辑,也让机器人更加“智能”。但是,机器人在“多模态”领域,仍无法与人类媲美。特别是如嗅觉、味觉、触觉、心理学等无法量化的信号,仍未能找到合理的量化方式。

1.7 AI+5G拓展机器人的活动边界,提供更大算力和更多存储空间,形成知识共享

4G时代,移动机器人的四大痛点:1)工作范围受限:只能在固定的范围内执行任务,构建的地图不便于共享,难以在大尺度环境下工作。2)业务覆盖受限:运算有限,识别性能仍需提升;能力有限,仅能发现问题,难以快速批量部署。3)提供服务受限:复杂业务能力差,交互能力有待提高,特种业务部署效率低。4)运维成本高:部署效率低,每个场景都需构建地图,规划路径;,配备巡检任务等。这四大痛点,制约了移动机器人在4G时代的渗透。总体来说,就是机器人仍需要更多的存储空间和更强的运算能力。金准产业研究团队认为,5G的低延时、高速率、广连接将能够解决目前的这些痛点。5G对于移动机器人的赋能:1)拓展机器人的工作范围。5G对于机器人的最大赋能就是拓展了机器人的物理边界,5G对于TSN(时间敏感网络)的支持,使机器人的活动边界从家庭走向社会的方方面面。我们大可以想象未来人类与机器人共同生活的场景。在物流、零售、巡检、安保、消防、指挥交通、医疗等方面,5G和AI都能够赋能机器人,帮助人类实现智慧城市。2)为机器人提供更大算力和更多存储空间,形成知识共享。5G对云机器人的推动,为机器人提供更大算力和更多存储空间:弹性分配计算资源:满足复杂环境中的同步定位和制图。访问大量数据库:识别和抓取物体;基于外包地图的长期定位。形成知识共享:多机器人间形成知识共享。

二、要服务机器人简介

2.1扫地机器人:AI技术解决目前痛点,助力行业蓬勃发展

金准产业研究团队预计到2021年,全球市场规模将达到接近500亿人民币,中国市场规模将达151亿元人民币。

 

扫地机器人全球及中国市场规模测算

2021年扫地机器人及2018年其他品类全球市场规模测算

2.2物流机器人:AI5G正催生AGV和无人配送机器人的发展

根据BIS Research数据统计,2016年全球AGV销量同比增长38.8%至2.6万台,主要由于电商仓储AGV的使用和推广;中国AGV销量同比大幅增长88.5%至9,950台;RIC预计2017-2021年中国AGV销量有望保持年均43.0%的速度增长,2021年将达到6.1万台。汽车行业、家电制造等生产物流端仍是中国AGV主要需求市场,2016年占比约55%,需求稳定,但对产品智能自动化等要求越来越高;电商等仓储物流端AGV需求增速较快,2016年需求占比约29%,至2021年有望提升至32%。

 

 

AGV全球市场预测

自动导引运输车(AGV):无人仓储的解决方案。自动导引运输车(Automated Guided Vehicle,AGV)的行进过程中,通过机器视觉来判断行进路线、摆放位置、周围环境等重要信息,是实现无人仓储的主流方案。AGV特点:AGV通常装备有电磁引导式、激光引导式或机器视觉引导式等自动导引装置,它能够沿规定的导引路径行驶,是具有安全保护以及各种移载功能的运输车。AGV以轮式移动为特征,较其它非轮式的移动机器人具有行动快捷、工作效率高、结构简单、可控性强、安全性好等优势。与物料输送中常用的其他设备相比,AGV的活动区域无需铺设轨道、支座架等固定装置,不受场地、道路和空间的限制。因此,在自动化物流系统中,最能充分地体现其自动性和柔性,实现高效、经济、灵活的无人化仓储。仓储管理系统。在仓储管理中,AI算法应用到仓储管理系统相对较为成熟。以基于RFID技术的仓储管理系统为例,通过将RFID识别技术和计算机的数据库管理查询相结合,可以节省人力物力,相比于传统(人工)仓库管理系统,具有以下优势:1)全自动化识别出入库物品,无需人员干涉,并且可以同时识别多个物品;2)快速、准确、自动进行数据采集,实时、精确掌握库存情况;3)缩减盘点周期,提高数据实时性,实现对库存物品的可视化管理;4)降低人力以及管理成本。

2.3平衡车机器人:在休闲运动市场的崛起

探索期:定位变革性的交通工具。2001年,狄恩·卡门(Dean Kamen)推出双轮平衡车(中间带杆子),并创建了Segway公司。2010年,富豪吉米·何塞尔买下Seg way。刚开始Segway期望改变世界的出行方式,主要销售对象是商用客户。由于产品价格高,适用场景少,Segwa的收入规模一直很小。2015年Segway被Ninebot收购,根据新闻报道,其年收入4000万美金左右,年销量1万台左右。平衡车又被称为体感车、思维车、摄位车等。市场上主要的品类包括双轮平衡车(带操纵杆)、双轮平衡车(无操纵杆)、独轮平衡车、平衡轮(类似电动旱冰鞋)。2010年,美国华人Shane Chen(陈星)发明独轮平衡车Solo Wheel。2012年,陈星又发明了两轮平衡车Hovertrax(无操纵杆)。发展期:中国企业从山寨开始,之后并购美国企业。2009年开始,中国市场迅速山寨,并返销美国市场(公司境内经营实体鼎力联合成立于2012年)。2014年Segway在美国起诉乐行、Ninebot(纳恩博)在内的5家平衡车公司侵犯Segway专利。2015年4月,Ninebot(纳恩博)全资收购Segway,获得Segway三大产品系列近十款产品,400多项专利,乐行天下在2017年收购Solowheel,获得相关专利。成长期:休闲运动市场的崛起。虽然平衡车的初衷是改变世界出行方式,但真正让平衡车崛起的是休闲运动市场。Ninebot收购Segway,并获得小米的支持后,推出了适合消费品市场的低价产品(2015年10月推出9号平衡车,定价1999元)。平衡车被消费者作为儿童、年轻人休闲运动的产品,销量开始大幅增长。Ninebot开始重视休闲运动市场,引入了电动滑板、卡丁车套件、儿童自行车产品。2018年电动滑板车、平衡车营收占比66%、29%,分别同比变动+42ppt、-45ppt。平衡车路权:在美国部分州允许平衡车在人行道上使用。在中国,平衡车被限制在封闭小区道路和室内场馆等地方使用。平衡车的控制需要较高的技巧,会有一些不同于普通交通工具的风险,例如原Segway的控制人吉米·何塞在一次使用平衡车遛狗时不幸坠崖身亡。

2.4陪伴机器人:AI自然语言处理解决人机交互,5G催生云服务机器人的发展

陪伴机器人存在两种发展路径,一类如索尼、夏普等公司应用机器人技术制作带关节仿生机器人,主要以陪伴老人、儿童教育、娱乐休闲为主。另一类如三星、亚马逊等公司推出显示屏机器人,主要希望做机器人OS平台,对外输出软件及AI服务。在陪伴机器人方面,我们看到两种机器人,一种是小型的机器人。如Sony的Aibo机器狗,Sharp的机器猫,高桥隆治的Robi等。金准产业研究团队认为,这些机器人主要作用包括与用户的交互、陪伴、教育、与他人的通讯等,目前大部分已商业化。

 

Sony的Aibo机器狗

另一种是大型的直立机器人,最为有名的就是本田的Asimo,波士顿动力等优秀企业的机器人。这类大型机器人一般配备双足,可实现上下楼梯、抓取物品,与人类交互等功能。

 

本田Asimo

2.5医疗机器人:AI5G在医疗诊断、外科手术和肢体康复中需求强烈

胶囊机器人。胶囊机器人+自动诊断系统:可能过采集到的图像自动判断病人可能出现的问题,为医生诊断提供参考意见。搭配云端的自动诊断系统,可实现异地诊断,多地诊断。

 

胶囊机器人

外科手术机器人。目前广泛采用的手术机器人包括持物臂式机器人、导航机器人和主从式机器人。

 

手术持物臂式机器人

导航机器人:为外科医生规划手术路径、在手术中进行提示。手术导航目前分为光学导航和电磁导航两种。光学导航精度高、不受其他设备的电磁干扰,但容易被遮挡光路。电磁导航操作灵活、体位要求低但会受到电磁干扰。光学导航主要应用在神经外科、脊柱外科、关节外科、颌面外科中。电磁导航主要应用在颅内活检、置管、支气管镜检查方面。主从机器人:为外科医生远程手术、离台手术提供技术支持。达芬奇机器人手术系统,就是一种主从式机器人系统,可帮助医生在未来实现离台手术,甚至远程手术,让医生可以坐着手术,减少因为疲劳、失神造成的医疗事故。肢体运动康复机器人。目前的康复机器人主要是上肢的康复机器人,以及下肢的外骨骼机器人。

2.6商业零售机器人:室内无人配送机器人的规模化及普及

在商业零售领域,近年,已有许多机器人进入,包括超市导购机器人、酒店送水送餐机器人等,这些室内配送机器人帮助商业零售提高运作效率,减少人力成本,并为服务增添趣味性,受到用户的欢迎。金准产业研究团队认为,随着人力成本的继续上升,商业机器人的前景广阔,值得关注。

 

导购机器人与人类交互

2.7仿生机器人:成为人类的一部分

意识控制的机器人:在一些前沿机器人研究中,已出现意识控制的机器人手臂。用户需要将机械手臂接入人类脑部系统,通过一定的训练,可控制机械手臂抓取饮料。仿生学机器人:人类已经开发出一些仿人类器官的机器人,利用前面提到的意识控制可让残疾人恢复正常的功能,这将是个很大的市场。

 

意识控制的机器人

结语

金准产业研究团队认为,5G+AI技术影响的行业很多,但没有哪个像机器人行业的未来那样令人憧憬。AI将帮助传统机器人从不能与人类协作,走向可以服务人类,并逐渐向认知、推理、决策的智能化进阶;而5G技术的成熟,将进一步拓展机器人的应用边界。通过低延时、高速率、广连接的特点,5G可以拓展服务机器人的应用边界,并为机器人提供更大算力和更多存储空间,形成知识共享。未来,随着技术积累到质变点,扫地机器人、物流机器人这类将成为“小儿科”,如科幻电影般的机器人很有可能在不远的将来出现,并全面渗入人类社会,帮助人类共同生活。

金准产业研究 人工智能情感计算研究报告 2019-10-09 17:37:58

前言

40多年前,诺贝尔奖得主Herbert Simon在认知心理学方面强调,解决问题论要结合情感的影响。情感的识别和表达对于信息的交流和理解是必需的,也是人类最大的心理需求之一。人类的认知、行为等几乎都要受到情感的驱动,并影响着人际互动以及群体活动。在人与人的交往中,情感的交流还常被用来完成人的意图的传递。因此,在智能人机交互的研究中,拥有对情感的识别、分析、理解、表达的能力也应成为智能机器必不可少的一种功能。

一、什么是情感计算

让计算机具有情感能力的观点并不新鲜,它与“机器人”一词几乎同时出现。1985年,人工智能的奠基人之一Minsky就明确指出:“问题不在于智能机器能否有情感,而在于没有情感的机器能否实现智能”。但当时,赋予计算机或机器人以人类式的情感,主要还是科幻小说中的素材,在学术界罕有人关注。1995年情感计算的概念由Picard首次提出,并于1997年正式出版《Affective Computing(情感计算)》。在书中,她指出“情感计算就是针对人类的外在表现,能够进行测量和分析并能对情感施加影响的计算”,开辟了计算机科学的新领域,其思想是使计算机拥有情感,能够像人一样识别和表达情感,从而使人机交互更自然。简单来说,情感计算研究就是试图创建一种能感知、识别和理解人的情感,并能针对人的情感做出智能、灵敏、友好反应的计算系统。显然,情感计算是个复杂的过程,不仅受时间、地点、环境、人物对象和经历的影响,而且要考虑表情、语言、动作或身体的接触。在人机交互中,计算机需要捕捉关键信息,觉察人的情感变化,形成预期,进行调整,做出反应。例如通过对不同类型的用户建模(如操作方式、表情特点、态度喜好、认知风格、知识背景等),以识别用户的情感状态,利用有效的线索选择合适的用户模型,并以适合当前用户的方式呈现信息。在对当前的操作做出及时反馈的同时,还要对情感变化背后的意图形成新的预期,并激活相应的数据库,及时主动地提供用户需要的新信息。举例来说,麻省理工学院媒体实验室的情感计算小组研制的情感计算系统通过记录人面部表情的摄像机和连接在人身体上的生物传感器来收集数据,然后由一个“情感助理”来调节程序以识别人的情感。假设你对电视讲座的一段内容表现出困惑,情感助理会重放该片段或者给予解释。而目前国内情感计算的研究重点在于通过各种传感器获取有人的情感所引起的生理及行为特征信号,确定情感类别的关键特征,建立“情感模型”,从而创建个人情感计算系统。情感计算是一个高度综合化的研究和技术领域。通过计算科学与心理科学、认知科学的结合,研究人与人交互、人与计算机交互过程中的情感特点,设计具有情感反馈的人与计算机的交互环境,将有可能实现人与计算机的情感交互。情感计算研究将不断加深对人的情感状态和机制的理解,并提高人与计算机界面的和谐性,即提高计算机感知情境,理解人的情感意图,做出适当反应的能力,其主要研究内容如下图所示:

 

情感计算的研究内容

情感计算是一个多学科交叉的崭新的研究领域,它涵盖了传感器技术、计算机科学、认知科学、心理学、行为学、生理学、哲学、社会学等方面。情感计算的最终目标是赋予计算机类似于人的情感能力。要达到这个目标,许多技术问题有待解决。这些技术问题的突破对各学科的发展都产生巨大的推动作用。以下分别从情感计算的传统研究方法和新兴研究方法对技术发展进行探讨。

1.1传统的研究

传统的情感计算方法是按照不同的情感表现形式分类的,分别是:文本情感分析、语音情感分析、视觉情感分析。

1.1.1文本情感计算

20世纪90年代末,国外的文本情感分析已经开始。早期,Riloff和Shepherd在文本数据的基础上进行了构建语义词典的相关研究。McKeown发现连词对大规模的文本数据集中形容词的语义表达的制约作用,进而对英文的形容词与连词做情感倾向研究。自此之后,越来越多的研究开始考虑特征词与情感词的关联关系。Turney等使用点互信息的方法扩展了正负面情感词典,在分析文本情感时使用了极性语义算法,处理通用的语料数据时准确率达到了74%。在近些年的研究中,Narayanan等结合各种特征及其相关联信息,提出了基于分句、整句、结果句的分类方案,获得了很好的效果。Pang等以积极情感和消极情感为维度,对电影评论进行了情感分类。他分别采用了支持向量机、最大熵、朴素贝叶斯算法进行分类实验,发现支持向量机的精确度达到了80%。随着研究的不断深入,学者在对情感分析算法进行改进的同时,也将其应用到不同的行业中进行了实践。

文本情感计算的过程可以由3部分组成:文本信息采集、情感特征提取和情感信息分类。文本信息采集模块通过文本抓取工具(如网页爬虫工具)获得情感评论文本,并传递到下一个情感特征提取模块,然后对文本中自然语言文本转化成计算机能够识别和处理的形式,并通过情感信息分类模块得到计算结果。文本情感计算侧重研究情感状态与文本信息之间的对应关系,提供人类情感状态的线索。具体地,需要找到计算机能提取出来的特征,并采用能用于情感分类的模型。因此,关于文本情感计算过程的讨论,主要集中在文本情感特征标注(信息采集)、情感特征提取和情感信息分类这三个方面。

1、文本情感特征标注:情感特征标注是对情感语义特征进行标注,通常是将词或者语义块作为特征项。情感特征标注首先对情感语义特征的属性进行设计,如褒义词、贬义词、加强语气、一般语气、悲伤、高兴等等;然后通过机器自动标注或者人工标注的方法对情感语义特征进行标注,形成情感特征集合。情感词典是典型的情感特征集合,也是情感计算的基础。在大多数研究中,有关情感计算的研究通常是将情感词典直接引入自定义词典中。运用情感词典计算出文本情感值是一种简单迅速的方法,但准确率有待提高。在实际的情感计算中,会因为具体的语言应用环境而有所不同。例如,“轻薄”一词通常认为是否定词,但是在电脑、手机却被视为肯定词汇。同时,文本中常会出现否定前置、双重否定以及文本口语化和表情使用等,这些都将会对文本情感特征的提取和判断产生较大的影响。因此在进行文本情感提取时,需要对文本及其对应的上下文关系、环境关系等进行分析。

2、情感特征提取:文本包含的情感信息是错综复杂的,在赋予计算机以识别文本情感能力的研究中,从文本信号中抽取特征模式至关重要。在对文本预处理后,初始提取情感语义特征项。特征提取的基本思想是根据得到的文本数据,决定哪些特征能够给出最好的情感辨识。通常算法是对已有的情绪特征词打分,接着以得分高低为序,超过一定阈值的特征组成特征子集。特征词集的质量直接影响最后结果,为了提高计算的准确性,文本的特征提取算法研究将继续受到关注。长远看来,自动生成文本特征技术将进一步提高,特征提取的研究重点也更多地从对词频的特征分析转移到文本结构和情感词上。

3、情感信息分类:文本情感分类技术中,主要采用两种技术路线:基于规则的方法和基于统计的方法。在20世纪80年代,基于规则的方法占据主流位置,通过语言学家的语言经验和知识获取句法规则,以此作为文本分类依据。但是,获取规则的过程复杂且成本巨大,也对系统的性能有负面影响,且很难找到有效的途径来提高开发规则的效率。20世纪90年代之后,人们更倾向于使用统计的方法,通过训练样本进行特征选择和参数训练,根据选择的特征对待分类的输入样本进行形式化,然后输入到分类器进行类别判定,最终得到输入样本的类别。

1.1.2语音情感计算

最早的真正意义上的语音情感识别相关研究出现在20世纪80年代中期,它们开创了使用声学统计特征进行情感分类的先河。紧接着,随着1985年Minsky教授“让计算机具有情感能力”观点的提出,以及人工智能领域的研究者们对情感智能重要性认识的日益加深,越来越多的科研机构开始了语音情感识别研究的探索。在20世纪80年代末至90年代初期,麻省理工学院多媒体实验室构造了一个“情感编辑器”对外界各种情感信号进行采集,综合使用人体的生理信号、面部表情信号、语音信号来初步识别各种情感,并让机器对各种情感做出适当的简单反应;1999年,Moriyama提出语音和情感之间的线性关联模型,并据此在电子商务系统中建造出能够识别用户情感的图像采集系统语音界面,实现了语音情感在电子商务中的初步应用。

整体而言,语音情感识别研究在该时期仍旧处于初级阶段,主要侧重于情感的声学特征分析这一方面,作为研究对象的情感语音样本也多表现为规模小、自然度低、语义简单等特点,虽然有相当数量的有价值的研究成果相继发表,但是并没有形成一套被广泛认可的、系统的理论和研究方法。进入21世纪以来,随着计算机多媒体信息处理技术等研究领域的出现以及人工智能领域的快速发展,语音情感识别研究被赋予了更多的迫切要求,发展步伐逐步加快。2000年,在爱尔兰召开的ISCA Work shop on Speech and Emotion国际会议首次把致力于情感和语音研究的学者聚集在一起。近10余年来,语音情感识别研究工作在情感描述模型的引入、情感语音库的构建、情感特征分析等领域的各个方面都得到了发展。下面将从语音情感数据库的采集、语音情感标注以及情感声学特征分析方面介绍语音情感计算。

语音情感数据库的采集:语音情感识别研究的开展离不开情感语音数据库的支撑。情感语音库的质量高低,直接决定了由它训练得到的情感识别系统的性能好坏。评价一个语音情感数据库好坏的一个重要标准是数据库中语音情感是否具备真实的表露性和自发性。目前,依据语音情感激发类型的不同,语音情感数据库可分为表演型、诱发型和自发型三种。

具体来说,表演型情感数据库通过专业演员的表演,把不同情感表达出来。在语音情感识别研究初期,这一采集标准被认为是研究语音情感识别比较可靠的数据来源,因为专业演员在表达情感时,可以通过专业表达获得人所共知的情感特征。比如,愤怒情感的语音一般会具有很大的幅值和强度,而悲伤情感的语音则反之。由于这一类型的数据库具有表演的性质,情感的表达会比真实情感夸大一点,因此情感不具有自发的特点。依据该类型数据库来学习的语音情感识别算法,不一定能有效应用于真实生活场景中。第二种称之为诱发型情感数据库。被试者处于某一特定的环境,如实验室中,通过观看电影或进行计算机游戏等方式,诱发被试者的某种情感。目前大部分的情感数据库都是基于诱发的方式建立的。诱发型情感数据库产生的情感方式相较于表演型情感数据库,其情感特征更具有真实性。最后一种类型属于完全自发的语音情感数据库,其语料采集于电话会议、电影或者电话的视频片段,或者广播中的新闻片段等等。由于这种类型的语音情感数据最具有完全的真实性和自发性,应该说最适合用于实用的语音情感识别。但是,由于这些语音数据涉及道德和版权因素,妨碍了它在实际语音情感识别中的应用。

2、语音情感数据库的标注:对于采集好的语音情感库,为了进行语音情感识别算法研究,还需要对情感语料进行标注。标注方法有两种类型:

离散型情感标注法指的是标注为如生气、高兴、悲伤、害怕、惊奇、讨厌和中性等,这种标注的依据是心理学的基本情感理论。基本情感论认为,人复杂的情感是由若干种有限的基本情感构成的,就像我们自古就有“喜、怒、哀、乐,恐、悲、惊”七情的说法。不同的心理学家对基本情感有不同的定义,由此可见,在心理学领域对基本情感类别的定义还没有一个统一的结论,因此不同的语音情感数据库包含的情感类别也不尽相同。金准产业研究团队认为,这不利于在不同的语音情感数据库上,对同一语音情感识别算法的性能进行评价。此外,众所周知,实际生活中情感的类别远远不止有限几类。基于离散型情感标注法的语音情感识别容易满足多数场合的需要,但无法处理人类情感表达具有连续性和动态变化性的情况。在实际生活中,普遍存在着情感变化的语音,比如前半句包含了某一种情感,而后半句却包含了另外一种情感,甚至可能相反。例如,某人说话时刚开始很高兴,突然受到外界刺激,一下子就生气了。对于这种在情感表达上具有连续和动态变化的语音,采用离散型情感标注法来进行语音情感识别就不合适了。因为此时语音的情感,己不再完全属于某一种具体的情感。

维度情感空间论基于离散型情感标注法的缺陷,心理学家们又提出了维度情感空间论,即对情感的变化用连续的数值进行表示。不同研究者所定义的情感维度空间数目有所不同,如二维、三维甚至四维模型。针对语音情感,最广为接受和得到较多应用的为二维连续情感空间模型,即“激活维-效价维”(Arousal-Valence)的维度模型。“激活维”反映的是说话者生理上的激励程度或者采取某种行动所作的准备,是主动的还是被动的;“效价维”反映的是说话者对某一事物正面的或负面的评价。随着多模态情感识别算法的研究,为了更细致的地描述情感的变化,研究者在“激活维-效价维”(Arousal-Valence)二维连续情感空间模型的基础上,引入“控制维”,即在“激活维-效价维-控制维(Arousal-Valence/Pleasure-Power/Dominance)”三维连续情感空间模型上对语音情感进行标注和情感计算。需要强调的是,离散型和连续型情感标注之间,它们并不是孤立的,而是可以通过一定映射进行相互转换。

情感声学特征分析:情感声学特征分析主要包括声学特征提取和声学特征选择、声学特征降维。采用何种有效的语音情感特征参数用于情感识别,是语音情感识别研究最关键的问题之一,因为所用的情感特征参数的优劣直接决定情感最终识别结果的好坏。

声学特征提取。目前经常提取的语音情感声学特征参数主要有三种:韵律特征、音质特征以及谱特征。在早期的语音情感识别研究文献中,针对情感识别所首选的声学特征参数是韵律特征,如基音频率、振幅、发音持续时间、语速等。这些韵律特征能够体现说话人的部分情感信息,较大程度上能区分不同的情感。因此,韵律特征已成为当前语音情感识别中使用最广泛并且必不可少的一种声学特征参数除了韵律特征,另外一种常用的声学特征参数是与发音方式相关的音质特征参数。三维情感空间模型中的“激发维”上比较接近的情感类型,如生气和高兴,仅使用韵律特征来识别是不够的。

音质特征包括共振峰、频谱能量分布、谐波噪声比等,不仅能够很好地表达三维中的“效价维”信息,而且也能够部分反映三维中的“控制维”信息。因此,为了更好地识别情感,同时提取韵律特征和音质特征两方面的参数用于情感识别,已成为语音情感识别领域声学特征提取的一个主要方向。谱特征参数是一种能够反映语音信号的短时功率谱特性的声学特征参数,Mel频率倒谱系数(Mel-scale Frequency Cepstral Coefficients,MFCC)是最具代表性的谱特征参数,被广泛应用于语音情感识别。由于谱特征参数及其导数,仅反映语音信号的短时特性,忽略了对情感识别有用的语音信号的全局动态信息。近年来,为了克服谱特征参数的这种不足之处,研究者提出了一些改进的谱特征参数,如类层次的谱特征、调制的谱特征和基于共振峰位置的加权谱特征等。

声学特征选择。为了尽量保留对情感识别有意义的信息,研究者通常都提取了较多的与情感表达相关的不同类型的特征参数,如韵律特征、音质特征、谱特征等。任意类型特征都有各自的侧重点和适用范围,不同的特征之间也具有一定的互补性、相关性。此外,这些大量提取的特征参数直接构成了一个高维空间的特征向量。这种高维性质的特征空间,不仅包含冗余的特征信息,导致用于情感识别的分类器训练和测试需要付出高昂的计算代价,而且情感识别的性能也不尽如人意。因此,非常有必要对声学特征参数进行特征选择或特征降维处理,以便获取最佳的特征子集,降低分类系统的复杂性和提高情感识别的性能。

特征选择是指从一组给定的特征集中,按照某一准则选择出一组具有良好区分特性的特征子集。特征选择方法主要有两种类型:封装式(Wrapper)和过滤式(Filter)。Wrapper算法是将后续采用的分类算法的结果作为特征子集评价准则的一部分,根据算法生成规则的分类精度选择特征子集。Filter算法是将特征选择作为一个预处理过程,直接利用数据的内在特性对选取的特征子集进行评价,独立于分类算法。

声学特征降维。特征降维是指通过映射或变换方式将高维特征空间映射到低维特征空间,已达到降维的目的。特征降维算法分为线性和非线性两种。最具代表性的两种线性降维算法,如主成分分析PCA(Principal Component Analysis)和线性判别分析LDA(Linear Discriminant Analysis),已经被广泛用于对语音情感特征参数的线性降维处理。也就是,PCA和LDA方法被用来对提取的高维情感声学特征数据进行嵌入到一个低维特征子空间,然后在这降维后的低维子空间实现情感识别,提高情感识别性能。

近年来,新发展起来的基于人类认知机理的流形学习方法比传统的线性PCA和LDA方法更能体现事物的本质,更适合于处理呈非线性流形结构的语音情感特征数据。但这些原始的流形学习方法直接应用于语音情感识别中的特征降维,所取得的性能并不令人满意。主要原因是他们都属于非监督式学习方法,没有考虑对分类有帮助的已经样本数据的类别信息。尽管流形学习方法能够较好地处理非线性流形结构的语音特征数据,但是流形学习方法的性能容易受到其参数如邻域数的影响,而如何确定其最佳的邻域数,至今还缺乏理论指导,一般都是根据样本数据的多次试验结果来粗略地确定。因此,对于流形学习方法的使用,如何确定其最佳参数,还有待深入研究。

1.1.3视觉情感计算

表情作为人类情感表达的主要方式,其中蕴含了大量有关内心情感变化的信息,通过面部表情可以推断内心微妙的情感状态。但是让计算机读懂人类面部表情并非简单的事情。人脸表情识别是人类视觉最杰出的能力之一。而计算机进行自动人脸表情识别所利用的主要也是视觉数据。无论在识别准确性、速度、可靠性还是稳健性方面,人类自身的人脸表情识别能力都远远高于基于计算机的自动人脸表情识别。因此,自动人脸表情识别研究的进展一方面依赖计算机视觉、模式识别、人工智能等学科的发展,另一方面还依赖对人类本身识别系统的认识程度,特别是对人的视觉系统的认识程度。

早在20世纪70年代,关于人脸表情识别的研究就已经展开,但是早期主要集中在心理学和生物学方面。随着计算机技术的发展,人脸表情识别技术逐渐发展起来,至上世纪90年代,该领域的研究已经非常活跃。大量文献显示表情识别与情感分析已从原来的二维图像走向了三维数据研究,从静态图像识别研究专项实时视频跟踪。下面将从视觉情感信号获取、情感信号识别以及情感理解与表达方面介绍视觉情感计算。

视觉情感信号获取:表情参数的获取,多以二维静态或序列图像为对象,对微笑的表情变化难以判断,导致情感表达的表现力难以提高,同时无法体现人的个性化特征,这也是表情识别中的一大难点。以目前的技术,在不同的光照条件和不同头部姿态下,也不能取得满意的参数提取效果。由于三维图像比二维图像包含更多的信息量,可以提供鲁棒性更强,与光照条件和人的头部姿态无关的信息,用于人脸表情识别的特征提取工作更容易进行。因此,目前最新的研究大多利用多元图像数据来进行细微表情参数的捕获。该方法综合利用三维深度图像和二维彩色图像,通过对特征区深度特征和纹理彩色特征的分析和融合,提取细微表情特征,并建立人脸的三维模型,以及细微表情变化的描述机制。

视觉情感信号识别:视觉情感信号的识别和分析主要分为面部表情的识别和手势识别两类:

对于面部表情的识别,要求计算机具有类似于第三方观察者一样的情感识别能力。由于面部表情是最容易控制的一种,所以识别出来的并不一定是真正的情感,但是,也正由于它是可视的,所以它非常重要,并能通过观察它来了解一个人试图表达的东西。到目前为止,面部表情识别模型都是将情感视为离散的,即将面部表情分成为数不多的类别,例如“高兴”、“悲伤”、“愤怒”等。1971年,Ekman和Friesen研究了6种基本表情(高兴、悲伤、惊讶、恐惧、愤怒和厌恶),并系统地建立了上千幅不同的人脸表情图像库。六种基本表情的具体面部表现如下表所示。1978年,他们研究了情感类别之间的内在关系,开发了面部动作编码系统(FACS)。系统描述了基本情感以及对应的产生这种情感的肌肉移动的动作单元。他们根据人脸的解剖学特点,将其划分成大约46个既相互独立又相互联系的运动单元(AU),并分析了这些运动单元的运动特征及其所控制的主要区域以及与之相关的表情,给出了大量的照片说明。面部识别器一般要花五分钟来处理一种面部表情,准确率达到98%。

马里兰大学的Yeser Yacoob和Larry Davis提出了另一种面部表情识别模型,它也是基于动作能量模版,但是将模版、子模版(例如嘴部区域)和一些规则结合起来表达情感。例如,愤怒的表情在从眼睛区域提取的子模版中,特别是眉毛内敛、下垂,在嘴巴区域子模版中,特别是嘴巴紧闭,两个子模板结合起来,就很好表达了愤怒这一情感。后续的研究总体上结合生物识别方法及计算机视觉进行,依据人脸特定的生物特征,将各种表情同脸部运动细节(几何网格的变化)联系起来,收集样本,提取特征,构建分类器。但是目前公开的用于表情识别研究的人脸图像数据库多是采集志愿者刻意表现出的各种表情的图像,与真实情形有出入。

 

脸部表情运动特征具体表现

对于手势识别来说,一个完整的手势识别系统包括三个部分和三个过程。三个部分分别是:采集部分、分类部分和识别部分;三个过程分别是:分割过程、跟踪过程和识别过程。采集部分包括了摄像头、采集卡和内存部分。在多目的手势识别中,摄像头以一定的关系分布在用户前方。在单目的情况下,摄像头所在的平面应该和用户的手部运动所在的平面基本水平。分类部分包括了要处理的分类器和结果反馈回来的接收比较器。用来对之前的识别结果进行校正。识别部分包括了语法对应单位和相应的跟踪机制,通过分类得到的手部形状通过这里一一对应确定的语义和控制命令。分割过程包括了对得到的实时视频图像进行逐帧的手部分割,首先得到需要关注的区域,其次在对得到的区域进行细致分割,直到得到所需要的手指和手掌的形状。跟踪过程包括对手部的不断定位和跟踪,并估计下一帧手的位置。识别过程通过对之前的知识确定手势的意义,并做出相应的反应,例如显示出对应的手势或者做出相应的动作,并对不能识别的手势进行处理,或者报警或者记录下特征后在交互情况下得到用户的指导。手势识别的基本框架如下图所示:

 

手势识别的基本框架

1.2新兴的研究

1.2.1网络海量数据的情感计算

随着时代的发展,网络赋予情感计算新的、更大的数据平台,打开了情感计算的新局面。网络系统由于沟通了人类的现实世界和虚拟世界,可以持续不断地对数量庞大的样本进行情感跟踪,每天这些映射到网络上的情绪不计其数,利用好这些数据反过来就可以验证心理学结论,甚至反哺心理学。由于大数据的分布范围极其广泛,样本数量非常庞大,采用单一的大数据处理方法往往得不到有效的情感要素,统计效果较差。但是,如果将大数据和心理学结合起来,局面就会大不一样:心理学中,不同情感可以采用维度标定,如冷暖或软硬,同时各种心理效应影响人类对事物的情感判断,如连觉效应、视觉显著性、视觉平衡等,在大数据中引入心理学效应和维度,对有效数据进行心理学情感标准划分,使得数据具有情感维度,这样就会让计算机模拟人类情感的准确性大大提升。网络海量数据的情感主要有以下几个社会属性:

情感随群体的变化:在社交网络,如论坛、网络社区等群体聚集的平台上流露出群体的情感,通过这些情感展现可以达到影响其他个人的行为。

情感随图片的变化:在社交媒体出现大量的图片,这些图片的颜色、光度、图片内容等各不相同。图片的特征直接影响到了观看者的情感。

情感随朋友的变化:在社交平台上,朋友发表的微博、微信状态等容易展现个人的情感。朋友间的关系比陌生人间的关系更加深入,所以朋友的情感更容易引起情感变化,在海量数据中,个人情感容易优先受朋友情感的影响。

情感随社会角色的变化:在社交网络中,个人在不同的群体所处的角色也不一样,个人情感流露时也会跟着所处的角色不一样而展现不同的情感。

情感随时间的演变:人的情绪是变化无常的,所处的环境不一样,则表现出来的情感也将不一样。即使是同一件事,不同的情景下展现的情感也会不一样。另外,事件的发展是个动态的过程,随着事件的演变,人的情感也会跟着变化。

1.2.2多模态计算

虽然人脸、姿态和语音等均能独立地表示一定的情感,但人的相互交流却总是通过信息的综合表现来进行。所以,只有实现多通道的人机界面,才是人与计算机最为自然的交互方式,它集自然语言、语音、手语、人脸、唇读、头势、体势等多种交流通道为一体,并对这些通道信息进行编码、压缩、集成和融合,集中处理图像、音频、视频、文本等多媒体信息。多模态计算是目前情感计算发展的主流方向。每个模块所传达的人类情感的信息量大小和维度不同。在人机交互中,不同的维度还存在缺失和不完善的问题。因此,人机交互中情感分析应尽可能从多个维度入手,将单一不完善的情感通道补上,最后通过多结果拟合来判断情感倾向。

在多模态情感计算研究中,一个很重要的分支就是情感机器人和情感虚拟人的研究。美国麻省理工学院、日本东京科技大学、美国卡内基·梅隆大学均在此领域做出了较好的演示系统。目前中科院自动化所模式识别国家重点实验室已将情感处理融入到了他们已有的语音和人脸的多模态交互平台中,使其结合情感语音合成、人脸建模、视位模型等一系列前沿技术,构筑了栩栩如生的情感虚拟头像,并积极转向嵌入式平台和游戏平台等实际应用。

目前,情感识别和理解的方法上运用了模式识别、人工智能、语音和图像技术的大量研究成果。例如:在情感语音声学分析的基础上,运用线性统计方法和神经网络模型,实现了基于语音的情感识别原型;通过对面部运动区域进行编码,采用HMM等不同模型,建立了面部情感特征的识别方法;通过对人姿态和运动的分析,探索肢体运动的情感类别等等。不过,受到情感信息捕获技术的影响,以及缺乏大规模的情感数据资源,有关多特征融合的情感理解模型研究还有待深入。金准产业研究团队预测,随着未来的技术进展,还将提出更有效的机器学习机制。

二、人才

2.1全球学者概况

学者分布地图对于进行学者调查、分析各地区竞争力现况尤为重要,下图为情感计算领域全球顶尖学者分布状况。其中,颜色越趋近于红色,表示学者越集中;颜色越趋近于绿色,表示学者越稀少。从地区角度来看,北美洲、欧洲是情感计算领域学者分布最为集中的地区,亚洲东部地区次之,南美洲和非洲学者极为匮乏。从国家角度来看,情感计算领域的人才在美国最多,中国次之,意大利、法国等洲国家也有较多的学者数量,整体上讲其它国家与美国的差距较大。

 

情感计算专家国家数量分布

情感计算领域学者的h-index分布如下图所示,分布情况整体呈阶梯状,大部分学者的hindex分布在中低区域,其中h-index在<10的区间人数最多,有524人,占比43.4%,50-60区间人数最少,有46人,占比3.8%。

 

情感计算领域学者h-index分布

各国情感计算TOP学者的流失和引进是相对比较均衡的,其中美国是情感计算领域人才流动大国,人才输入和输出幅度领先于其他国家,且从数据来看人才流出大于人才流入。英国、加拿大和印度等国人才迁徙流量小于美国;中国人才流入略高于人才流出。人才的频繁流入流出,使得该领域的学术交流活动增加,带动了人才质量提升的同时,也促进了领域理论及技术的更新迭代,逐渐形成一种良性循环的过程。

2.2国内学者概况

AMiner选取情感计算领域国内专家学者绘制了学者国内分布地图,如下图所示。通过下图我们可以发现,京津地区在情感计算领域的人才数量最多,东部及南部沿海地区的也有较多的人才分布,相比之下,内陆地区信情感计算领域人才较为匮乏,这也从一定程度上说明了情感计算领域的发展与该地区的地理位置和经济水平都是息息相关的。同时,通过观察中国周边国家的学者数量情况,特别是与日本、东南亚等亚洲国家相比,中国在情感计算领域顶尖学者数量方面具有较为明显的优势。图8是我国情感计算领域顶尖学者最多的10个省份。

 

情感计算学者分布国内省份TOP10

 

三、情感计算应用

近年来,Picard领导的美国麻省理工学院多媒体实验室相继提出了近50种情感计算应用项目。例如,将情感计算应用于医疗康复,协助自闭症者,识别其情感变化,理解患者的行为;在教育中应用情感计算,实现对学习状态的采集及分析,指导教学内容的选择及教学进度进行;还可以将情感计算应用于生活中,计算机能够感知用户对音乐的喜好,根据对情感反应的理解判断,为用户提供更感兴趣的音乐播放等。

3.1课堂教学

在美国,公立学校的预算限制引发大规模的教师裁员和教室拥挤不堪。教师工作时间紧张,还要考虑和满足每个学生的需求。结果就是,那些课业困难的孩子容易受到忽视。因为只要孩子不提出问题,老师就不会关注到他。在过去三年里,有企业把面部识别技术应用到了第一线教学当中。在Sensor Star实验室,他们用相机捕捉学生上课反应,并且输入到计算机里面,运用算法来确定学生注意力是否转移。通过面部识别软件Engage Sense,计算机能够测量微笑、皱眉和声音来测定学生课堂参与度。孩子们的眼睛是专注于老师的吗?他们是在思考还是发呆?他们是微笑还是皱着眉头?或者他们只是觉得困惑?还是无聊?测量之后,老师将会收到一份反馈报告,基于面部分析,报告会告诉老师他们的学生学习兴趣何时最高、何时最低。这样,老师能够对自己的教学方案做出调整,满足更多学生的需求。此外,比尔和梅林达盖茨基金会资助了传感器手镯(sensor bracelets)的开发,这可以用来追踪学生的参与水平。腕部设备能够发送小电流,通过在神经系统响应刺激时测量电荷的细微变化便可以得知学生的课程兴奋程度。心理学家Paul Ekman将面部识别技术研究提升到了一个新的层次。他对5000多种面部运动进行了分类,以帮助识别人类情绪。他的研究为Emotient Inc、Affectiva Inc和Eyeris等公司提供了帮助,这些公司将心理学和数据挖掘相结合,检测人的细微表情,并对人的反应进行分类。目前为止,面部识别技术的重点是协助联邦执法和市场调研。不过,圣地亚哥市的研究人员也在医疗行业试用这项技术,测定孩子接受外科手术之后的疼痛程度。

3.2机器学习定制学生课堂学习内容

Tech Crunch公司的员工设计了在线教育平台,来提供一对一指导和精熟学习(mastery learning)。这是应用创新型思维,通过实时的评估和定制化的学习方式,有效地解决本杰明提出的著名的“Sigma2Problem”。深度学习系统将学生学习效果数据进行分类,并且在此基础上制定相关的教学内容。该系统还可以推荐附加练习,并且根据学生个人能力和教学要求,实时推荐课程内容,调整教学速度。北卡罗来纳州州立大学研究员开发了一种软件,通过摄像头捕捉和分析学生面部表情,以此改变在线课程。目前,大多数情感计算技术还仅仅停留在学术研究领域。但也已经有公司开始应用这项技术,并能成功地分辨学生表情,并根据他们的学习能力和方式,来自动调整适合的学习内容和环境。英特尔公司正是这其中的一员。有了这些学生表情数据,可以让“Emoshape”这样的情感计算智能系统,自动分析情感,并做出适当回复。这些系统具备了解决个体问题的能力,也使老师能够提供高度个性化的内容来激发学生的学习兴趣。金准产业研究团队认为,人工智能和大数据已经促成了大部分行业的技术革新,从电子商务到交通、金融、医疗。人工智能和大数据已经在教育方面取得进展。尽管有些反对的声音,比如说如何保护学生隐私、如何提高教学效率等,但需要指出的是,这些技术的应用并不是要代替老师,而是扮演辅助老师的角色,识别学生的个体需求,以制定更加智能的教学方案。

3.3情绪监测

为了深度挖掘人类情感的奥秘,美国麻省理工学院计算机科学与人工智能实验室打造了用无线信号监测情绪的EQ-Radio。在没有身体感应器和面部识别软件辅助的情况下,EQ-Radio通过测量呼吸和心跳的微小变化,利用无线信号捕捉到一些肉眼不一定能察觉的人类行为,判断一个人到底处于以下四种情绪中的哪一种:激动、开心、生气或者忧伤,正确率高达87%。美国麻省理工学院教授和该项目的负责人Dina Katabi预测,这个系统会被运用于娱乐、消费者行为和健康护理等方面:电影工作室和广告公司也可以用这个系统来测试观众实时的反应;而在智能家居的环境中,该系统可以通过捕捉与人的心情有关的信息,调节室内温度,或者建议你应该呼吸一些新鲜空气。现有的情绪监控方法大多依赖于视听设备或者是安装在人身上的感应器,这两种技术都有缺点:面部表情并不一定符合内心状态,而安装在身上的感应器(比如胸带和心电监护仪)会造成各种不便,而且一旦它们的位置稍微移动,监测到的数据就不精确了。EQ-Radio会发送能监测生理信息的无线信号,该信号最终会反馈给设备本身。其中的算法可以分析心跳之间的微小变化,从而判断人们的情绪。消极情绪会被判定为“忧伤”,而正面且高涨的情绪会被判定为“激动”。尽管这样的测量会因人而异,但其中还是有内在统一性。通过了解人们处于不同的情绪状态下,他们的心跳会如何变化,我们就可以对他所处的情绪状态进行有效的判断。在他们设计的实验中,参与实验者选择他们记忆中最能代表激动、开心、生气、忧伤以及毫无情感的一段视频或音乐。在掌握了这段时长两分钟的视频里的五种情绪设置后,EQ-Radio可以精确地通过一个人的行为判断他处于这四种情绪中的哪一种。与微软研发的基于视觉和面部表情的Emotion API相比,EQ-Radio在识别喜悦、忧伤和愤怒这三个情绪上精确度更高。同时,这两种系统在判断中性情绪时的精准度差不多,因为毫无情绪的脸总是更容易被识别。目前,对美国麻省理工学院计算机科学与人工智能实验室而言,最艰巨的任务就是摆脱不相关数据的干扰。比如,为了分析心率,他们要抑制呼吸可能带来的影响,因为呼吸时,人的肺部起伏比他心跳时的心脏起伏要大。

3.4医疗康复

近年来,情感计算运用于自闭症治疗得到越来越多的关注。例如,美国麻省理工学院情感计算团队正在开发世界上第一个可穿戴的情感计算技术设备:一个具有社交智能的假肢,用来实时检测自闭症儿童的情感,帮助机器人使用自闭症儿童独有的数据,来评估这些互动过程中每个孩子的参与度和兴趣。这个装置用一个小型照相机,分析孩子的面部表情和头部运动来推断他们的认知情感状态。还有一种叫“galvactivator”的工具,通过测量穿戴者的皮肤电流数据,推断孩子的兴奋程度。这个像手套一样的设备可以利用发光二极管描绘出人体生理机能亢奋程度的图谱。这种可视化的展现方式,能够清晰地展示出人的认知情感水平。NAO机器人和个性化的机器学习在治疗自闭症患者上也表现出很大的优越性:人类治疗师会向孩子展示一张照片或者闪存卡片,用来表示不同的情绪,以教会他们如何识别恐惧、悲伤或喜悦的表情。治疗师随后对机器人进行编程,向孩子们展示这些相同的情绪,并且在孩子与机器人交往时观察孩子。孩子们的行为提供了宝贵的反馈信息,机器人和治疗师可以根据反馈信息继续学习。研究人员在这项研究中使用了Soft Bank Robotics NAO类人机器人。NAO将近2英尺高,类似于装甲超级英雄,通过改变眼睛的颜色、肢体的运动以及声音的音调来表达不同的情绪。参加这项研究的35名自闭症儿童中,有17人来自日本,18人来自塞尔维亚,年龄从3岁到13岁不等。他们在35分钟的会议中以各种方式对机器人做出反应,从看起来无聊和困倦,到在房间里兴奋地跳来跳去,拍手,大笑或触摸机器人。研究中的大多数孩子对机器人的看法是,它不仅仅是一个玩具,应该尊重NAO,因为它是一个真实的人。另外,人类用许多不同的方式改变自己的表情,但机器人则通过同样的方式来改变表情,这对孩子来说更加有利,因为孩子可以通过非常有条理的方式学习如何表达表情。麻省理工学院的研究小组意识到,具有深度学习能力的治疗机器人能够更好感知儿童的行为的。深度学习系统使用分层的多层数据处理来处理其任务,每一个连续的层都是对原始数据抽象的表示。尽管自20世纪80年代以来深度学习的概念已经出现,但直到最近才有足够的计算能力来实现这种人工智能。深度学习已被用于自动语音和对象识别程序中,这种应用非常适合解决面部、身体和声音等多重特征的问题,从而更好地理解抽象的概念,如儿童的参与感。对于治疗机器人,研究者构建了一个个性化框架,可以从收集的每个孩子的数据中学习。研究人员拍摄了每个孩子的脸部表情、头部和身体动作、姿势和手势,记录了儿童手腕上显示器的心率、体温和皮肤汗液反应作为数据。这些机器人的个性化深度学习网络是根据这些视频、音频和生理数据的层次,针对孩子的自闭症诊断和能力、文化和性别的信息构建的。研究人员将机器人对儿童行为的估计与五位人类专家的估计数字进行了比较,这些专家连续对孩子的录像和录音进行编码,以确定孩子在会议期间高兴或不安程度,是否感兴趣以及孩子的表现。比较发现,机器人对儿童行为的估计要比专家更加具体清晰。

3.5舆情监控

网络调查法、统计规则法和文本内容挖掘是三种经常被使用的网络舆情分析方法。金准产业研究团队分析认为,大数据时代的来临使传统的舆情分析方式发生改变,大数据时代数据量突增、数据产生的速度极快、冗余信息占比高的特性不仅给舆情分析带来新的发展机遇,也带来了新的难度和挑战。基于简单调查和统计的舆情分析方法将无法适用于大数据环境下的网络社区文本。当前国内外对舆情分析技术的研究也大多以大数据环境为背景,与传统舆情分析技术相比,大数据时代网络社区的舆情分析技术更多地集中于对数据的获取,并采取文本数据分析、数据挖掘、语义分析等技术获取舆情信息。当前国内外的舆情分析技术研究主要集中于话题识别与话题跟踪、意见领袖识别以及情感倾向判别这三个方面。话题识别与话题跟踪首先在文本中识别出新话题,接下来在一段时间内检测并实时跟踪话题,实现该话题的再现,研究其随时间发展的演化过程。聚类方法常用于进行话题识别。在国外研究中,话题检测与跟踪(TDT)是了解社交媒体热点话题及其演变过程的重要手段。意见领袖的发现和识别重点在于评价指标的制定以及模型的构建。例如,曹玖新等将网络社区用户看作一个个节点,根据节点之间信息的交互和传播过滤,从用户结构、行为和情感三个特征维度挖掘意见领袖。情感倾向判别在舆情研究中最为常见,首先收集web金融领域的文本数据属性,接下来构建金融领域的情感词典,最后结合语义分析,将语义规则应用到情感及情感强度识别当中,提升了分类器的准确率M。王永等人将倾向分析应用到客户评论信息挖掘当中,结合情感词之间的依存关系计算面向产品特征的情感倾向得分,从网络评论中获取有价值的商业信息。国外针对Twitter的情感倾向分析研究居多,用以获取有价值的信息和舆论导向,例如,结合语言规则特征可以分别获取正面和负面的Twitter文章,反应公众的舆情态度。

 

四、趋势

4.1论文研究发展趋势

Trend analysis(http://trend.aminer.cn)基于AMiner的2亿篇论文数据进行深入挖掘,包括对技术来源、热度、发展趋势进行研究,进而预测未来的技术前景。技术趋势分析描述了技术的出现、变迁和消亡的全过程,可以帮助研究人员理解领域的研究历史和现状,快速识别研究的前沿热点问题。下图是当前情感计算领域的热点技术趋势分析,通过Trend analysis分析挖掘可以发现当前该领域的热点研究话题Top10是Affective Computing、Social Robot、Emotion Recognition、Human Computer Interaction、Feature Extraction、Support Vector Machine、Facial Expression、Human Robot Interaction、Behavioural Sciences Computing、Face Recognition。

金准产业研究团队发现,该领域当前最热门的话题是Affective Computing,从全局热度来看,Affective Computing的话题热度虽然有所起伏,但从20世纪90年代开始,热度迅速上升,甚至在五年内超过了此前的话题Top1EmotionRecognition,并且至今其话题热度始终保持在Top1,论文的发表数量也较多;Social Robot的研究热度跟随Affective Computing同期上升,近几年话题热度更是超越Emotion Recognition成为Top2话题;另外,前期比较热门的Feature Extraction经过了一段时间的低迷期后,也回到了Top3的位置。

4.2情感计算技术预见

研究者根据情感计算领域近十年的相关论文,利用大数据分析、机器学习、人工智能等技术手段,建立算法模型及研发demo系统,分析挖掘出该领域的技术发展热点。技术预见图中点的大小表示该技术的热点(主要由相关论文数量的多少决定,相关论文越多,热度越高,点越大),各技术之间的连线表示2个技术关键词同时在N篇论文中出现过(当前N的取值为5)。

金准产业研究团队分析,情感计算领域相关度最高的技术有3项,分别为:feature extraction、human computer interaction和emotion recognition。按照技术前沿度,可以列出相关的主要技术关键词,以及该技术历年的变化趋势(论文发表数量变化趋势),及重要代表性成果。具体如下图所示:

15中我们可以看出,情感计算领域预测前沿度比较高的前四热词有:autism spectrum disorder(前沿度为1428)、support vector machine(前沿度为1096)、deep learning(前沿度为1058)和semantic web(前沿度为1031)。

结语

金准产业研究团队认为,如果说目前的传统计算机(包括应用现有智能计算方法的计算机)只包含了反映理性思维(Thinking)的“脑(Brain)”,那么,情感计算将为该机器增添了具有感性思维(Feeling)的“心(Heart)”(这是应用文学方式对机器进行拟人化比喻。按认知科学讲,感性思维仍源于脑活动)。可以认为,情感计算是在人工智能理论框架下的一个质的进步。因为从广度上讲它扩展并包容了情感智能,从深度上讲情感智能在人类智能思维与反应中体现了一种更高层次的智能。情感计算必将为计算机的未来应用展现一种全新的方向。