• 项目
首页>>文章列表 >>行业研究
行业研究

金准数据机器学习预测报告——以文本摘要自动生成为例

前言:

机器学习能力正在快速增长,将各种行业的商业应用从医疗和保健转向自动驾驶汽车,游戏和欺诈检测等等。 我们期望机器学习处理在2018年变得更加快速和更加智能,我们可以看到它在更多不同领域和业务问题中得到应用。2017年,我们看到人工智能融入了我们生活的许多方面以及无数社交项目。 2018年,我们会看到更多的初创公司展示高度先进的产品,而且在美国以外的这些科技公司以及中国和欧洲等硅谷典型场景中,这些公司的工作量也有明显增加。 准备好更好地融入我们的日常生活,并在AI革命中取得更多进展。

2018年,人工智能无处不在,或者更确切地说,机器学习将无处不在。这项技术几乎“无所不能”,并将在2018年创造出无限可能。

2018年,英国的IntelligentX有望推出世界上第一款AI酿造啤酒;俄罗斯的DeepFish致力于利用神经网络来识别雷达图像中的鱼类;瑞典的Hoofstep更是筹集了风投资金,计划为马匹进行深度行为分析。

机器学习对众多世界范围内的大数据行业都具有潜在影响,这将继续继续推动风险投资、私人股本(PE)融资、合并,和关注点在赢得这一领域知识产权(Ip)和专利竞赛的收购。

机器学习知识产权中增长最快的领域之一是定制芯片组(custom chipset)的开发。金准数据预计全球数据中心今年将使用多达800,000的机器学习芯片。在2018年,企业正加大对机器学习项目的研究、投资和试点力度。虽然不同预测来源的方法各不相同,但市场估计和预测都反映出,机器学习将提高公司的敏锐性和洞察力,在实现更快、更有利可图的增长方面。金准数据根据机器学习市场预测、市场评估和规划,关键数据如下:


一、2018年机器学习预测

1. 支持机器学习的数据科学平台大幅增长

在整个商业智能(BI)和分析市场中,预计到2021年,支持机器学习的数据科学平台(Data Science platform)将达到13%的复合年均增长率。同时,数据科学平台的增长率将超过更广泛的商业智能(BI)和分析市场,预计同期将达到8%的复合年均增长率,其价值将从2017的30亿美元增长到2021的48亿美元。



2.机器学习专利、实施项目数量激增

2013年至2017年,机器学习专利以34%的复合年增长率增长,在所有专利中增长速度排第三位。 IBM, Microsoft, Google, LinkedIn, Facebook, Intel和Fujitsu(富士通)是2017年最大的7家机器学习专利生产商。

金准数据根据德勤全球预计,与2017年相比,2018机器学习试点和实施项目的数量将翻一番,到2020将再次翻一番。推动机器学习试点项目增长的因素包括应用程序接口(APIs)更广泛的支持、自动化数据科学任务、减少培训数据的需要、加快培训和对解释性结果的洞见。

3.机器学习和人工智能投资引领行业

61%的机构最经常选择机器学习/人工智能作为公司明年最重要的数据计划。那些受访机构表示,他们积极使用机器学习和人工智能,58%的人表示他们在生产中运行模型。


包括Amazon, Apple, Google, Tesla和Microsoft在内的科技市场领导者,在机器学习和人工智能投资方面正大幅度地引领行业。每一个都将机器学习设计成未来的新一代产品,并使用机器学习和人工智能改善客户体验,提高销售渠道的效率。

金准数据预测, 在人工智能和机器学习上的的支出将会从2017年的120亿美元增长到2021年的576亿美元。

全球机器学习市场预计将从2017的14亿美元增长到2022的88.1亿美元,达到44.1%复合年增长率。市场快速增长的因素包括在数据聚合、集成和分析方面表现卓越的新技术,以及更可伸缩的云平台。

2017年的认知(cognitive)和人工智能系统的全球收入是125亿美元,到2020年将超过460亿美元。

基于金准数据在2017对14家供应商采用的23项评估标准,SAS*、IBM和SAP*领导了预测分析和机器学习市场。金准数据预测表明,预测分析和机器学习市场(the Predictive Analytics & Machine Learning market,PAML)将在2021年以21%的复合年增长率增长,这一点可以从他们看到的客户咨询和采购活动的增加中得到证明。




4.机器学习正在增强数据分析能力和洞察力

60%的机构处在采用机器学习的不同阶段,近一半(45%)的机构说这项技术导致了更全面的数据分析和洞察力,35%的机构可以完成更快的数据分析,提高洞察速度,这使他们的机构更加敏锐。35%的机构还发现机器学习正在增强他们对下一代产品的研发能力。


谷歌日前发布公告称60.3%的潜在恶意应用(Potentially Harmful Apps,PHAs)都是由机器学习技术检测出来的。这些潜在恶意应用的检测是由一项名为Google Play Protect的服务来完成的,该服务已经预装在了超过20亿台运行Android 4.3及以上系统版本的Android设备上,并将持续扫描并发现有恶意行为的应用程序。Google Play Protect运用了多种策略来确保Android手机用户的数据安全,而机器学习技术的加入让其检测潜在恶意应用的能力更上一层楼。

Play Protect机制在2017年累计自动扫描了超过500亿款手机应用,最终发现并移除了将近390亿款Android手机应用。Play Protect每天至少会自动扫描Android手机一次,如果用户愿意还可以自己手动扫描。

直到最近,Play Protect才要求在检测时需要设备联网。因为谷歌发现有35%的新潜在恶意软件安装都发生在设备离线或失去网络连接时,谷歌开发出了新的功能来解决此问题。在2017年10月,Play Protect推出了离线扫描功能,从那之后,该保护机制多阻止了1000万次潜在恶意应用的安装行为。

Google Play Store对比第三方应用商店

Android设备在出厂时一般都自带谷歌官方应用商店Google Play Store,大多数国家的Android用户都从这个平台上获取应用。然而在有些国家,第三方应用商店成了Android用户下载、安装应用的唯一选择,或者有时候用户间也会直接分享自己从其他来源下载到的应用。只从Play Store上下载、安装应用的Android设备遇到潜在恶意应用的几率比时常从其他来源获取应用的Android设备要低9倍。

在2017年,有0.56%的安装有Play Protect的Android设备检测出了潜在恶意应用,而在2016年,该比率为0.77%。另外,在2017年,Android用户在Play Store上下载到潜在恶意应用的几率是0.02%,该比率较2016年下降0.02%。

Play Protect可以随时移除Play Store上的潜在恶意应用,但是显然它不能对第三方应用商店采取同样措施。对于从其他来源下载的应用,Play Protect只能警告Android用户说这是一个潜在恶意应用,而如果检测到是勒索软件或者可能盗窃银行账户的恶意应用,Play Protect则会阻止其安装。

在2017年,谷歌通过发出警告阻止了74%的潜在恶意应用安装行为,在2016年该比率是55%。谷歌没有透露剩下的26%的或是忽略了警告提示,或是在安装前没有被确认为恶意应用的潜在恶意应用安装行为的具体数据。


5.人工智能和机器学习吸引外部投资

金准数据估计,2016年人工智能的年度外部投资总额在80亿至120亿美元之间,其中机器学习吸引了近60%的投资。机器人和语音识别是两个最受欢迎的投资领域。由于基于代码的初创企业在快速扩展,不断增加新功能,投资者们最青睐机器学习初创企业。基于软件的机器学习初创企业优于成本更高的基于机器的机器人竞争者,后者往往没有他们的软件同行。由于这些提到的和更多没提到的因素,企业并购在这一领域正飞速发展。下面的图片显示了不同技术分类的外部投资分布情况。


6.机器学习芯片市场广阔

金准数据分析预计,数据中心使用的机器学习芯片将从100,000增长到2016年的200,000,今年将增长到800,000。其中至少25%是现场可编程门阵列(FPGA)和专用集成电路(ASIC)。德勤发现,截至2020,机器学习加速器技术的总可用市场(Total Available Market,TAM)可能会达到260亿美元。


Amazon正依靠机器学习来改善其业务关键领域的客户体验,包括产品推荐、替代产品预测、欺诈检测、元数据验证以及知识获取。


二、机器学习附能文本摘要自动生成

金准数据研究了人工智能在信息大潮中帮助人们提高工作能力的方法——让算法自动归纳长文本。但是怎样训练能够产生长句、连贯和有意义的摘要的模型仍然是一个有待解决的研究问题。事实上,即使是较先进的深度学习算法,生成任何长文本也是很困难的。为了使模型能够成功地生成摘要,金准数据认为可以从两个独立的方法进行改进:一个更加语境化的词生成模型和一种通过强化学习(RL)训练摘要模型的新方法。

两种训练方法的结合使得系统能够创建相关且高可读性的多语句长文本(例如新闻文章)摘要,并在之前的基础上实现了显著的提升。我们的算法可以对各种不同类型的文本和摘要长度进行训练。在本文中,金准数据介绍了两种模型的主要贡献,并概述了文本摘要特有的自然语言挑战。

1.文本摘要的发展现状

目前主流的文本摘要声称有两种方式:提取式摘要(Extractive Summarization)与抽象式摘要(Abstractive Summarization)。

自动摘要模型可以通过以下两种方法实现:通过提取或抽象。提取式模型执行“复制和粘贴”操作:它们选择输入文档的相关短语并连接它们以形成摘要。它们非常稳健,因为它们使用直接从原文中提取的已有自然语言短语,但是由于不能使用新词或连接词,它们缺乏灵活性。它们也不能像人一样改述。相反,抽象式模型基于实际的“抽象”内容生成摘要:它们可以使用原文中没有出现的词。这使得它们有更多的潜力来产生流畅和连贯的摘要,但因为需要模型生成连贯的短语和连接词,这也是一个更难的问题。

虽然抽象式模型在理论上更强大,但在实践中也常出现错误。在生成的摘要中,典型的错误包括不连贯、不相关或重复的短语,特别是在尝试创建长文本输出时。从已有模型来看,它们缺乏一般连贯性、意识流动性和可读性。在本任务中,我们解决了这些问题,并设计了一个更稳健和更连贯的抽象式摘要模型。

抽取式摘要是一种比较成熟的方案,其中Text rank排序算法以其简洁、高效的特点被工业界广泛运用。大体思想是先去除文章中的一些停用词,之后对句子的相似度进行度量,计算每一句相对另一句的相似度得分,迭代传播,直到误差小于0.0001。再对上述得到的关键语句进行排序,便能得到想要的摘要。抽取式摘要主要考虑单词词频,并没有过多的语义信息,像“猪八戒”,“孙悟空”这样的词汇都会被独立对待,无法建立文本段落中的完整语义信息。


生成式文本摘要主要依靠深度神经网络结构实现,2014年由GoogleBrain团队提出的Sequence-to-Sequence序列,开启了NLP中端到端网络的火热研究。Sequence-to-Sequence又称为编、解码器(Encoder、Decoder)架构。其中Encoder、Decoder均由数层RNN/LSTM构成,Encoder负责把原文编码为一个向量C;Decoder负责从这个向量C中提取信息,获取语义,生成文本摘要。

但是由于“长距离依赖”问题的存在,RNN到最后一个时间步输入单词的时候,已经丢失了相当一部分的信息。这时候编码生成的语义向量C同样也丢失了大量信息,就导致生成的摘要不够准确。

Bahdanau等人在14年发表的论文《Neural Machine Translation by JointlyLearning to Align and Translate》中,第一次将Attention机制应用于NLP中。Attention机制是一种注意力(资源)分配机制,在某个特定时刻,总是重点关注跟它相关的内容,其他内容则进行选择性忽视。就像下图,在翻译“Knowledge”时,只会关注“知识”.这样的对齐能让文本翻译或者摘要生成更具针对性。

RNN/LSTM单元,由于每个词是按顺序输入网络的,所以会记录文章的序列信息。因此,大部分的NLP任务,都是采用的RNN架构。但是这也限制了网络训练及摘要生成的速度,因为RNN必须一个个输入,一个个生成,无法并行计算。2016年Facebook AI Research(FAIR)发表了《A Convolutional Encoder Model forNeural Machine Translation》,对Encoder部分采用似乎不擅长处理序列信息的卷积网络(CNN)来实现,结果在翻译、摘要任务中,也达到了当年的最高水准。

2017年5月,还是FAIR,发布了《ConvolutionalSequence to Sequence Learning》,第一次实现了Encoder、Decoder都采用CNN单元,使得网络在训练阶段,可以并行计算,效率进一步提升。同时引入了Multi-step Attention(多跳注意),相比之前只在最后一层生成翻译时往回看,多跳注意使得Decoder阶段生成每一层的语义向量时都往回看,进一步提升了准确度。同时还有一些其他的Trick:引入单词的位置信息,残差网络,计算Attention时候对高层语义信息和低层细节信息,兼收并取等。最后在生成翻译和摘要时,速度相比之前最快的网络,提升了近9倍。同时在WMT-14英德、英法两项的单模型训练结果中,BLEU得分达到了25.16、40.46,其中英法翻译也是迄今为止的最高得分。

时隔一个月,17年6月,Google团队发布了名为《Attention Is All You Need》的文章,即不用CNN和RNN单元,只用Self-Attention和Encoder-Decoder Attention,就完全实现了端到端的翻译任务。并且在WMT-14英德、英法翻译任务中,BLEU值达到了28.4和41.0的高分。因为同样可以并行计算,模型的训练及生成速度也有所提升。Self-Attention相比于之前的模型更加关注句子的内部结构,也就是word-pairs的信息,附图是论文中Attention可视化的结果,可以发现仅在源文端,模型便学习到了“making more difficult”的word-pairs信息。

同理对目标端,模型也会单独学习句子的内部结构信息。之后利用Encoder-Decoder Attention建立源文和目标词组、句子的对应关系。相比于FAIR的卷积模型到很高层才能看到句子的完整信息,Self-Attention在第一层便巧妙地建立了每个词和整个句子的联系,同时位置编码采用三角函数的相对位置法表示,理论上可以泛化到训练中未见过的更长长度句子的翻译中。目前Self-Attention仅用在了翻译任务中,但这样的思想,在文本摘要自动生成的任务中,也是可以参照的。

(Google Transformer模型的拆解)

2.监督式学习训练模型 VS. 强化学习训练模型

为了理解我们的新抽象式模型,我们首先定义基本构建块(building block),然后介绍我们新的训练方式。

用编码器-解码器模型读取和生成文本

循环神经网络(RNN)能够处理可变长度的序列(例如文本),并为每个短语计算有用的表征(或隐藏状态)。网络逐一处理序列的每个元素(在这种情况下,即每个词);对于序列中的每个新输入,网络通过该输入和之前隐藏状态的函数输出新的隐藏状态。从这个角度讲,在每个词处计算的隐藏状态是所有之前读到的单词的函数输出。

循环神经网络通过对每个词应用相同的函数(绿色)来读取输入语句

RNN 也可以用类似的方式产生输出序列。在每个步骤中,RNN 隐藏状态用于生成添加到最终输出文本的新词,该词将被用作该模型的下一个输入。

RNN 可以生成输出序列,并重使用输出单词作为下一个函数的输入

输入(读取)和输出(生成)RNN 可以组合在联合模型中,其中输入 RNN 的最终隐藏状态被用作输出 RNN 的初始隐藏状态。以这种方式组合,联合模型能够读取任何文本并从中生成不同的文本。该框架称为编码器-解码器(encoder-decoder)RNN(或 Seq2Seq),它是我们摘要模型的基础。另外,我们用双向编码器替代传统的编码器 RNN,它使用两个不同的 RNN 来读取输入序列:一个从左到右读取文本(如图 4 所示),另一个从右到左读取。这有助于我们的模型更好地表示输入语境。

编码器-解码器 RNN 模型可用于解决自然语言中的 sequence-to-sequence 任务(如摘要)

一种新的注意及解码机制

为了使我们的模型输出更连贯,我们允许解码器在生成新单词时回顾部分输入文档,这种技术称为时间注意(temporal attention)模型。与完全依赖自己的隐藏状态不同,解码器可以通过注意函数(attention function)整合不同部分的输入语境信息。调整注意函数,以确保模型在生成输出文本时使用不同部分的输入,从而增加摘要的信息覆盖度。

另外,为了确保我们的模型不产生重复信息,我们还允许它回顾解码器之前的隐藏状态。用类似的方式,我们定义内部解码注意函数(intra-decoder attention function),它可以回顾解码器 RNN 之前的隐藏状态。最后,解码器将来自时间注意模型的语境向量(context vector)与来自内部解码注意函数的语境向量相结合,在输出摘要中生成下一个词。下图展示了在给定解码步骤中这两个注意函数的联合过程。

由编码器隐藏状态和解码器隐藏状态计算得到的两个语境向量(标记为“C”),使用这两个语境向量和当前的解码器隐藏状态(“H”),生成一个新的词(右)并添加到输出序列中。

如何训练模型?监督式学习 VS. 强化学习

要训练这个模型并应用于新闻文章等真实数据,通常的方法是使用教师强迫算法(teacher forcing algorithm):一个模型在生成一个摘要时使用参考摘要(reference summary),并且该模型在每生成一个新单词时会被分配一个逐词误差(word-by-word error,或“局部监督/local supervision”,如下图所示)。

用监督式学习训练模型。每个生成的单词得到一个训练监督信号,通过与同一位置的正确摘要单词进行比较来进行训练。

该方法可用于训练任意基于循环神经网络的序列生成模型,具有非常好的结果。然而,对于我们的特定任务,正确的摘要不一定要按照逐字来匹配参考序列。你可以想像,对于同样的新闻文章,两个人可能在风格、单词或句子顺序上产生不尽相同的摘要,但仍然认为摘要是好的。教师强迫算法的问题是:一旦产生了前几个单词,训练就会被误导:严格遵守一个官方正确的摘要,但不能适应一个潜在正确但不同的开头。

考虑到这一点,我们可以比教师强迫的逐词方法做得更好。这里可以应用一种称为强化学习(RL)的不同类型的训练。首先,强化学习算法使模型生成自己的摘要,然后使用外部评分器(scorer)来比较生成的摘要与正确摘要。这个评分器然后向模型表明生成的摘要有多“好”。如果分数很高,那么模型进行更新,使得这些摘要更有可能在将来出现。否则,如果得分低,模型将受到惩罚,并改变其生成过程以防止生成类似的摘要。这种强化模型擅长得出用于评估整个序列而不是逐词预测的摘要分数。

在强化学习中,模型没有对应每个预测词的局部监督信号,而是用基于整个输出和摘要参考的奖励信号(reward signal)进行训练。

如何评估摘要?

评分器到底是什么?它如何分辨出一个摘要的“好坏”?由于要人手动评估数以万计的摘要在很大程度上是耗时并不切实际的,因此,我们使用一种名为 ROUGE(Recall-Oriented Understudy for Gisting Evaluation)的自动评分指标。ROUGE 通过对比摘要中将生成的摘要中的匹配子短语和实际数据的参考摘要中的子短语来运作,即使它们并不是完全一致的。不同的 ROUGE 变体(ROUGE-1、ROUGE-2、ROUGE-L)都以相同的方式工作,但使用不同的子序列长度。

尽管 ROUGE 分数与人类判断总体上有很好的相关性,但 ROUGE 较高分的总结不一定是最可读或最自然的。当我们仅通过强化学习来训练模型使 ROUGE 得分较大化时,这就成为一个问题。我们观察到我们具有较高 ROUGE 分数的模型也会生成几乎不可读的摘要。

为了发挥两个领域的优势,我们的模式同时受到教师强迫和强化学习的训练,能够利用词级和整个摘要层面的监督使摘要具有连贯性和可读性。特别是我们发现 ROUGE 优化的强化学习有助于改善回调(即所有需要总结的重要信息实际上已经被总结),并且词级学习监督能确保良好的语言流畅性,使得摘要更连贯可读。

监督学习(红色)和强化学习(紫色)的组合,演示了我们的模型同时学习本地和全局奖励并同时优化可读性和整体 ROUGE 分数的方法

直到最近,CNN / Daily Mail 数据集中的抽象摘要的较高 ROUGE-1 分数是 35.46。结合解码器内部注意 RNN 模型的联合监督和强化学习训练,这个分数提高到了 39.87,并且,如果仅是强化学习,该分数为 41.16。下图显示了我们和其他的现有模型的摘要分数。即使我们的纯强化学习模型具有较高的 ROUGE 分数,我们监督的+ 强化学习模型具有较高的可读性,因此它与该摘要任务更加相关。注意: 由于使用稍微不同的数据格式,Nallapati et al 的结果与我们的和其他数据格式不能直接相比,但仍然给出了很好的参考。

CNN / Daily mail 数据集的摘要结果,比较我们的模型与现有的抽象式和提取式方法

样本输出

从传统的Textrank抽取式,到深度学习中采用RNN、CNN单元处理,再引入Attention、Self-Attention、机器生成摘要的方式,这些跟人类思维越来越像,都建立在对整段句子的理解之上。与此同时生成摘要的效果,也常常让我们惊艳。

但文本摘要自动生成依然还有很多难题,比如如果段落太长,那么机器对段落的理解时间就要很长,而过长的时间会导致机器对段落信息的记忆的损失。而且深度学习非常依赖有标签的样本,标注工作也是一笔非常大的开销。

总的来说,文本摘要自动生成是个非常具有前景但也非常具有挑战性的技术。


我们的模型生成的更多的摘要例子,对比同一篇文章的人工撰写的摘要

为了说明我们在文本摘要方面的主要贡献带来的影响,下图显示了如果不考虑内部注意力和强化学习训练,我们模型的输出是如何离题的。


我们的模型生成的示例摘要,有和没有我们的主要贡献。原始文章中不存在的新词将以绿色显示。摘要中重复的短语显示为红色。



结论:

金准数据认为,基于机器学习的训练模型显著提高了在多语句摘要生成方面的技术水平,优于现有的抽象式模型和提取式基线。我们相信,我们的贡献(解码器内部注意模块和组合的训练目标)可以改善其他的序列生成任务,特别是较长的输出。

我们的工作也涉及诸如 ROUGE 等自动评估指标的限制,这表明需要更好的指标来评估和优化摘要模型。一个理想的度量指标在摘要的连贯性和可读性方面应与人类的判断相一致。当我们使用这样的指标来强化摘要模型时,摘要的质量可能会进一步提高。

用于抽象式摘要的基于注意 RNN 的编码器-解码器模型已经在短输入和输出序列上取得了良好的表现。但是,对于更长的文档和摘要,这些模型通常会包含重复的和不连贯的短语。我们引入了一种带有内部注意(intra-attention)的神经网络模型和一种新的训练方法。这种方法将标准的监督式词预测和强化学习(RL)结合到了一起。仅使用前者训练的模型常常会表现出“exposure bias”——它假设在训练的每一步都会提供 ground truth。但是,当标准词预测与强化学习的全局序列预测训练结合起来时,结果得到的摘要的可读性更高。我们在 CNN/Daily Mail 和 New York Times 数据集上对这个模型进行了评估。我们的模型在 CNN/Daily Mail 数据集上得到了 41.16 的 ROUGE-1 分数,比之前的较佳模型高出了显著的 5.7 分。其也是第一个在 New York Times 语料库上表现良好的抽象式模型。人类评估也表明我们的模型能得到更高质量的摘要。



金准数据 关于张量方法加速深度神经网络模型的研究报告

前言

现代的机器学习涵盖了大量的数据以及变量,构成了高维数据问题。张量方法在处理这种高维数据的机器学习方法中十分有效,而且已经应用到诸如社交网络分析、文档分类、基因学的诸多领域中,未来还会涉猎对人脑神经元行为理解这一问题。

用张量进行概率隐含变量的机器学习训练

当多个设备或者传感器在收集数据的时候,我们能不能设计出有效率的通信和路由机制,使得在“网络内部”已经开始数据整合,减少传输的数据量,同时又能为处理特定问题(比如工作状态异常)提供信息?金准数据从统计角度进行了该类问题的调研,整合了一些概率图模型,设计了一些显著减少数据通信需求的算法。

现代的机器学习问题经常发生于高维世界,在时间轴上产生了大量的多元数据,这其中也包含了很多数据噪声。从噪声里发现有用的信息有时就像大海捞针,是极具挑战性的。

工作的第一个步骤就是对隐藏信息和观测数据之间的关系进行建模。在一个推荐系统中,隐藏的信息就是用户对于商品的潜在兴趣,而观测数据包含了他们已经购买的商品。如果某个用户近期购买了自行车,说明她对骑车/户外运动感兴趣,而且很可能会在近期购买自行车配件。我们能够通过她的购买模式推断出隐含变量,从而对她的兴趣进行建模。然而问题在于,我们需要从大量用户的行为中获得大量购物模式的观测数据,于是这就变成了一个大数据问题。


图1:亚马逊推荐系统会告诉你推荐原因


现在的工作着力于如何高效地在大数据集上有效训练这种隐含变量模型。在这种无监督学习的方法中,算法能够自动发现潜在的、对解释观测数据有意义的变量。大体上而言,机器学习研究者们都同意这种算法能够解决本领域中一类悬而未决的挑战。

金准数据认为,一种新颖的算法能够去处理这个挑战性的难题,并展示了在没有监督数据的情况下,张量代数如何能够发现隐藏的结构性规律。张量是矩阵的高维推广。就像矩阵能够展示事物的两两关系一样,张量能够表现更高阶的关系(后面关于这一点会详述)。金准数据研究发现,对高阶张量进行操作可以有效地进行一大类概率隐含变量的机器学习训练。


图2:张量方法是矩阵方法的扩展

张量算法如何真正帮助我们解决机器学习问题呢?第一眼看过去,我们可能会认为张量跟这些机器学习任务没什么关系。把这二者联系起来需要一个额外的概念,就是高阶关系(或者高阶矩)。正如之前提到的,我们能够用张量表征变量之间的高阶矩关系。通过考察这些关系,我们对隐含变量模型就能进行更有效的训练。


张量算法应用场景

我们把算法应用于很多场景上。比如,在不知道主题先验分布的情况下,对文本文档进行分类。在这个场景下,主题本身就构成了一组隐含变量,必须把它们从观测数据中提炼出来。一种可能的解决方式可能会是从词频里训练出主题,但这种简单的处理方式无法合理解决在不同上下文中出现同一个单词的问题(注:语义消除歧义问题)。

考虑一下,如果我们不考虑单个词的词频而考虑二元词组的出现频率,将会导致一个更稳健的结果。但是我们为什么要止步于二元词组?我们为什么不检查一下三元词组乃至多元词组这种高维问题呢?这些高维关系又能揭示出哪些有意义的信息呢?金准数据认为,使用流行的潜变量狄利克雷分配(Latent Dirichlet Allocation,LDA)算法需要三元关系,仅有二元关系是不够的。

图3:社交网络

我们可以更进一步的扩展隐含变量模型的概念。这种方法更适合应用于一类问题,包括对种族进化树的建模,或者理解人类疾病产生的层级结构。在这里的例子中,我们的目标是通过给定的数据,学习出隐含变量的层级结构,训练出能够量化隐含变量影响的一组参数。

最终学习出来的的结构,揭示了位于叶子节点上的观测变量的层次聚类结果,以及量化的聚类强度参数。然后我们把问题简化为找到某种层级性的张量分解,针对这个问题我们已经构造出有效的算法了。


场景应用中张量的重要性

金准数据认为,这些张量算法绝不仅仅是理论上的研究兴趣,而是具有可信的证据,它们不仅能够对算法进行加速,还能提高计算结果的精度。Rutgers大学的Kevin Chen在最近的NIPS工坊中进行了一次非常有说服力的演讲,其内容是关于在基因组学中张量算法的优越性:这种算法能够提供更好的生物学解释,相对于传统的期望-最大化算法(Expectation-Maximization,EM算法)而言,产生了100倍的计算加速。张量方法是如此有效,就是因为他们的算法利用已经高度优化过的线性代数计算库,跑在了时下流行的大规模计算集群上。总而言之,张量方法现在具备出人意料的可并行性,因此易于在异构硬件平台上进行大规模训练。

 

图4:Spark是一种基于内存的分布式机器学习工具



 

图5:LDA是一种自然语言处理(NLP)常见的算法


以上的直觉能够应用在更广泛的领域。就拿网络来说吧。你可能希望通过观察个体之间的互动来发现潜在的群体,像社交网络中的朋友关系推荐系统中的购买行为,以及大脑内神经元之间的彼此连接都是一些直接的例子。金准数据相关研究揭示了研究朋友的朋友或者类似的高阶关系对于社群发现的必要性。尽管这些函数之前已经被广泛地研究过了,但是我们开创性地展现了这种关系所蕴含的信息量,以及如何提高计算这些指标的效率。

张量对一类更丰富的数据进行建模,使我们能够掌控多元关系的数据。这些数据同时具有空间特性和时间特性。张量中的不同方向表示着不同类型的数据。

 

图6:张量类似矩阵,是可分解的


张量能够用比矩阵更丰富的代数结构来对信息进行编码,这就是它的核心所在。如前文所述,考虑一个通过行和列来表达的矩阵——或者叫二维数组。张量把这个概念延拓到了高维数组。

一个矩阵的意义远比仅仅是行和列要多。你可以通过线性操作对矩阵进行重塑,这就是我们常说的线性代数张量建立在一种更具有延展性的形式上,因此操作它们的学问也被扩展了,术语上叫做多线性代数

在拥有这种有效的数学结构之后,我们如何压缩它们以获取信息?我们能够对张量操作算法进行设计和分析吗?为了解决这些问题,我们需要一组关于解决非凸优化问题的证明技巧。


基于低秩张量分解方法

基于低秩张量分解方法,用于在现有的深度学习模型中进行分层并使其更紧凑。加上裁剪(pruning),张量分解是加快现有深度神经网络的实用工具

裁剪(pruning)技术能够减少模型中的参数数量。在一个数据集上正向传递(有时是反向传递)裁剪(pruning),然后根据网络中激活的一些标准对神经元进行排序。

完全不同的是,张量分解的办法只用到层的权重,假设网络层是参数化的,它的权重能够用一个矩阵或者是一个低秩的张量来表示。这意味这个它们在参数化的网络下效果最佳。像VGG神经网络设计为完全参数化的。另外一个关于参数化模型的例子是使用更少的类别对网络进行微调以实现更简单的任务。和裁剪(pruning)相似,分解之后通过模型需要微调来恢复准确性。

在我们会深入讨论细节之前,最后一件要说明的事是,虽然这些方法是实用的,并给出了很好的结果,但它们有一些缺点:

它们能够在一个线性权重上执行(比如一个卷积或者一个全连接的层),忽略了任何非线性的内容它们是贪婪,自认为聪明地分解层,忽略了不同层之间的相互作用目前还要试图解决这些问题,而且它仍然是一个活跃的研究领域。


1. 截断SVD用于分解完全连接的层

SVD概况

奇异值分解使我们能够分解任何具有n行和m列的矩阵AS是一个对角矩阵,其对角线上有非负值(奇异值),并且通常被构造成奇异值按降序排列的U和V是正交矩阵如果我们取最大的奇异值并将其余的归零,我们得到A的近似值具有作为Frobenius范数最接近于A的秩t矩阵的性质,所以如果t足够大,是A的良好近似。

在全连接层上的SVD

一个全连接层通常是做了矩阵乘法,输入一个矩阵A然后增加一个偏差b我们可以取A的SVD,只保留第一个奇异值这不是一个完全连接的层,而是指导我们如何实现它作为两个较小的第一个将有一个mxt的形状,将没有偏差,其权重将取自第二个将有一个txn的形状,将有一个等于b的偏差,其权重将取自。权重总数从nxm下降到t(n + m)。

在卷积层上张量分解

二维卷积层是一个多维矩阵(后面用-张量),有四个维度:

cols x rows x input_channels x output_channels.

遵循SVD的例子,我们想要以某种方式将张量分解成几个更小的张量。卷积层转换为几个较小近似的卷积层。为此,我们将使用两种流行的(至少在Tensor算法的世界中)张量分解:CP分解和Tucker分解(也称为高阶SVD或其他名称)。

2. 1412.6553 使用微调CP分解加速卷积神经网络

如果CP分解能够用于卷积层的加速,正如我们会看到的,这将卷积层纳入类似移动网络的东西。他们使用它来加速网络的速度,而不会明显降低精度。在实验中,这个在基于VGG16的网络上获得x2加速,而不会降低准确度。使用这种方法需要非常仔细地选择学习率,微调以使其工作,学习率通常应该非常小(大约)。

一个秩R矩阵可以被视为R秩和1矩阵的和,每个秩1矩阵是一个列向量乘以一个行向量SVD为我们提供了使用SVD中的U和V列来写矩阵和的方法如果我们选择一个小于矩阵满秩的R,那么这个和就是一个近似值,就像截断SVD的情况一样。CP分解让我们推广了张量。使用CP分解,我们的卷积核,一个四维张量公式,可以近似为一个选定的R我们希望R对于有效的分解是小的,但是对保持近似高精度是足够大的。

CP分解的卷积正向传递

为了传递图层,我们使用输入进行卷积这给了我们一个办法来解决这个问题:

首先做一个wise(1x1xS)与卷积。这减少了从S到R输入通道的数量。下一步将在较少数量的通道上完成卷积,使其更快。

其次,用在空间维度上执行分离的卷积。就像在移动网络中一样,卷积是深度可分的,分别在每个通道中完成。与mobilenets不同,卷积在空间维度上也是可分的

再次,做另一个逐点卷积来改变从R到T的通道数量如果原始卷积层有一个偏差,在这一点上加上它。

注意像在移动网中的逐点和深度卷积的组合。在使用mobilenets的时候,你必须从头开始训练一个网络来获得这个结构,在这里我们可以把现有的图层分解成这种形式。与移动网络一样,为了获得最快的速度,需要一个有效实现深度可分离卷积的平台。

PyTorch和Tensorly卷积层CP分解

图7:用PyTorch和Tensorly卷积层CP分解

3. 1511.06530 用于快速和低功率移动应用的深度卷积神经网络的压缩

Tucker分解也称为高阶奇异值分解(HOSVD)或者其他名称,是对张量进行奇异值分解的一种推广。

它认为SVD的推广的原因是

的分量通常是正交的,但这对于我们的目的并不重要

被称为核心矩阵,并定义不同的轴如何相互作用

在上面描述的CP分解中,沿着空间维度

的分解导致空间上可分离的卷积。无论如何,过滤器是非常小的,通常是3x3或5x5,所以可分离的卷积并不节省我们大量的计算,而且是一个积极的近似。

Trucker分解有用的性质是,它不必沿着所有的轴(模式)分解。我们可以沿着输入和输出通道进行分解(模式2分解):

卷积正向传递与Tucker分解

CP分解一样,写一下卷积公式并插入内核分解:

图8:卷积公式内核分解

这给了我们以下用Tucker分解进行卷积的配方:

1.与进行点对点卷积,信道从S减少到的数量。

2.用进行正则(不可分)卷积。这个卷积代替了原始层的S输入通道和T输出通道,具有输入通道和输出通道。如果这些等级小于S和T,这就是减少的原因。

3.用进行点对点卷积以回到原始卷积的T个输出通道。由于这是最后一次卷积,所以在这一点上,如果有偏差就加上偏差。

我们如何选择分解行列

一种方法是尝试不同的值并检查准确性。尝试后的启发是,效果很好。

理想情况下,选择行列应该是自动的。

使用变分贝叶斯矩阵分解(VBMF)(Nakajima等,2013)作为估计等级的方法。

VBMF很复杂,不在本文的讨论范围内,但是在一个非常高层次的总结中,他们所做的是将矩阵近似为低秩矩阵和高斯噪声之和。在找到A和B之后,H是等级的上限。为了将其用于Tucker分解,我们可以展开原始权重张量的s和t分量来创建矩阵。然后我们可以使用VBMF估计和作为矩阵的秩。我用这个在Python上实现的VBMF,相信它可以工作。VBMF通常返回的秩,非常接近我之前,仔细和乏味的手动调整得到的结果。这也可以用于估计完全连接层的截断SVD加速的等级。

PyTorch和Tensorly卷积层Tucker分解


 

图9:用PyTorch和Tensorly卷积层Tucker分解

总结

本文中,我们讨论了几个张量分解的方法来加速深度神经网络。截断的SVD可用于加速完全连接的层。CP分解将卷积层分解成类似移动网络的东西,尽管它更具侵略性,因为它在空间维度上也是可分的。Tucker分解减少了二维卷积层操作的输入和输出通道的数量,并且使用逐点卷积来切换2D卷积之前和之后的通道数量。

同时,也明确了我们能够用张量方法训练相当一大批隐含变量模型,比如文档的主题模型,网络中的社群模型,高斯混合模型,混合排序模型等等。这些模型表面上看起来毫无联系,然而他们通过把类似于条件无关这种统计学属性转化为张量上的代数约束之后,就达到了形式上的统一。在所有这些模型中,分解合适的高阶矩张量(往往是三阶或四阶的统计相关性)就能够稳定地估计模型参数。我们更进一步地证明了,这种算法只需要很小的样本量以及计算量就能工作得很好了。(这里很小的样本量,精确来说,是和样本点特征数量的低阶多项式同阶)

金准数据 全球工作效率统计分析报告


近期一项针对各国工作效率的调查发现,秘鲁、瑞典、印尼是工作效率最高的国家。而捷克、芬兰和中国是任务完成度最高的国家。不过,工作效率越高,对所有立项任务的完成比例越低,两者能兼顾的国家并不多。

如果全球各国进行一场工作效率的比拼,哪个国家效率最高?哪国效率最低?中国人效率算高吗?大家印象中效率高的德国、日本是否真的效率很高呢?



近期经过对Redbooth最活跃40个国家和地区的用户调查分析,研究过去三年中,所有行业的生产和任务完成情况,来考察各国的生产效率是否存在差异。


金准数据对研究结果分析认为,南美洲的秘鲁是工作效率最高的国家,中东的阿联酋是工作效率最低的国家。捷克、芬兰、中国、以色列的任务完成度最高,而俄罗斯、印度、菲律宾和秘鲁的任务完成度最低。


金准数据对研究结果分析认为,南美洲的秘鲁是工作效率最高的国家,中东的阿联酋是工作效率最低的国家。捷克、芬兰、中国、以色列的任务完成度最高,而俄罗斯、印度、菲律宾和秘鲁的任务完成度最低。


与此同时,工作效率最高的国家,往往任务完成度最低,如秘鲁;而工作效率处于平均水平的国家,其任务完成度则更高。像中国这样“工作效率高且任务完成度高”的国家,全球罕见。


一、秘鲁工作效率最高,中国亦全球领先



金准数据依据Redbooth平台的数据统计,所有国家中,完成一项任务时间最短的国家是秘鲁,平均只需要10.2天,瑞典和印尼紧随其后,跟别需要13和13.3天。中国排名也不错,位列第四。


在工作效率排名靠前的国家中,除了瑞典之外,绝大部分都是新兴国家和发展中国家。


而全球工作最慢的是阿联酋,完成一项任务平均需要23.8天。而大家印象中工作效率高的德国和日本,排名却不高。德国排名倒数第二,日本也排在最后几位。


对于德国而言,近期刚通过的28小时工作制让工作时间缩短,加上兼职目前在德国盛行,所以同一个公司内完成一项任务或项目的时间会被拉长。此外,瑞士、比利时、丹麦、葡萄牙等一众西欧国家的工作速率最低,再次印证西欧国家是适合生活、度假和养老的国度,工作节奏较慢。



二、工作效率越高,任务完成度越低

任务能在最短的时间内完成,只是工作的一个方面。另外,还需要看工作的完成度。


金准数据还对所有任务的完成度百分比进行了考察,最后发现“工作效率越高的国家,往往在所有人物中的完成比例越低”。也就是说,任务完成得越快,可能就会放弃、牺牲掉其中的一些任务。而工作效率普通的国家,往往对任务的完成度也高,“慢工出细活”。


当然,这里面也有例外。中国是全世界罕见的任务完成速度快,且任务完成率高的国家。


通过下表可以发现,在所有开启了的任务中,完成度最高的国家是捷克和芬兰,在所有立项的任务中,有84.5%和84.4%的任务能得到完成;而中国排名也高居第三,所有任务中,有81.3%能够最终完成。



而下表中,是任务完成比例最低的国家排名。俄罗斯排名垫底,仅有59.3%的任务能最终完成。而印度、秘鲁则都是工作效率较高,但任务完成度低的典型例子。


金准数据根据数据制作了图表,将工作效率和任务完成度表进行交叉对比,纵轴表示各国完成工程项目的比例,横轴表示各国完成任务的平均天数。可以发现任务完成比例高的国家,大体上都是工作效率中等偏下的国家;而工作效率高的国家,往往任务完成度偏低。这再次证明慢工出细活,速度和效率在一定程度上的“不兼容”。


值得注意的是,中国在工作效率上排名全球第四,而在任务完成度上则高居全球第三,是极为少见的能将高工作效率和高任务完成度结合起来的国家。


由于任务完成度中没有美国的数据,故而表格中未予显示。


这份调查在一定程度上反映了全球各国的工作风格和节奏。除了中国之外,将工作效率和工作完成度结合较好的国家,还有南非、智利、乌克兰、墨西哥、土耳其等国,这些国家或许能成为“走出去”战略的目的地。


除了工作效率、任务完成度外,该项研究中,还引入了“各国七天任务完成比例”。秘鲁排名最高,达到64%;阿联酋排名最低,为33%;中国依旧位列高位,为55%。




需要指出的是,这项报告是基于全世界数百万项在线工作完成。Redbooth特别指出,每年还有数十亿项工作是通过在线和离线完成。因此,这些研究结果应该被视为对世界工作风格的窥视——而不是整个图景。


同时,金准数据提出Redbooth研究对这组数据的局限性。Redbooth是一个基于网络和内部部署的工作场所协作工具和交流平台,致力于帮助团队、公司保持项目进展顺利,令工作更加智能化。


这个调查结果限于使用计算机管理系统的企业,而且是Redbooth掌握数据的企业。其研究结果基于使用软件的群体,其各国用户的成分和群像涉及并非所有行业、工种。能用这种项目管理软件的企业有限,像建筑、软件、军工、科研等企业可能使用,还有很多企业并不会购买软件。


金准数据进一步指出,研究结果与产业分工有一定关系,不能简单用任务完成度和工作效率衡量其效用价值。如果客户一个月打了10次电话,求助IT人员解决10个问题。其中9个只花5分钟就解决了,但最后一个很难,花费一个月的时间也没完成。同样,如果请裁缝给自己量体裁衣,一个月做好。如何比较他们之间的工作效率和任务完成度?IT人员工作效率高,但完成度低;裁缝工作效率低,但任务完成度高。这些行业分到各国,区别就会很明显。


即便如此,金准数据相信这组数据依然值得作为重要参考,在一定程度上反映了中国生产率的进步。




金准数据 BI助力中小企业的决策支持

一、商业智能概述

1.现代商业智能可实现商业经营的智能化与自动化

商业智能(BI,BusinessIntelligence)概念的提出可追溯至1958年。商业智能通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具。这里所谈的数据包括来自企业业务系统的订单、库存、交易账目、客户和供应商等来自企业所处行业和竞争对手的数据以及来自企业所处的其他外部环境中的各种数据。而商业智能能够辅助的业务经营决策,既可以是操作层的,也可以是战术层和战略层的决策。过去的商业智能不能给出决策方案,也不能自动处理企业运行过程中遇到的问题。借助于人工智能与其他相关学科的技术进步,现代商业智能已能在特定场景中实现商业经营的智能化与自动化。因此,本报告聚焦于将人工智能技术用于商业智能决策,试图对人工智能在商业落地的真实现状进行说明,凸显AI技术(不包括智能语音、计算机视觉等感知智能)在现阶段应用的价值。

AI增强的决策支持系统(Decision Support System,DSS),服务于企业中需要决策的各级人员,应该具备实时、闭环、自动进化、自动识别问题、全局优化等特征,目的在于提高企业决策的效率和质量,增强企业在数字经济时代的竞争力。

智能商业领域努力的终极目标——为构建一个支持决策的优化模型需要做出关于决策变量的决策。AI的应用可能使优化模型构建和演化变得自动化,也就是说,模型本身也成为了优化的决策变量,这也意味着基于机器学习的模型的自动适应和自动演化成为可能。这样的机制才是真正的Intelligent Business,我们努力的终极目标。



图1:传统Bi为商业经营的智能化与自动化奠定基础


2.大数据为商业智能的发展提供土壤


互联网、移动互联网高速发展,海量、高维度且可实时接入更新的数据随之而来,为机器学习等前沿技术在各领域中的探索及落地提供可能,进一步拓展了被服务人群且显著提升服务质量。另一面,产业缺乏通用标准约束,数据在采集及流转过程中污染程度不一,数据加密不规范引致的数据泄露时有发生,数据孤岛亦成为企业业务发展的掣肘(如金融方面,企业多为基于自身平台积累的独有数据做征信,评分适用范围将大大受限),通用标准的建立需要政府及产业界的共同努力。


2:大数据对商业智能的贡献

3.商业智能与大数据

智能技术的运用一方面将拓展大数据的应用场景,从帮助业务人员认知到实现企业最优决策,另一方面,自然语言处理的进步也正在解决人机交互的部分问题,自然语言查询、自然语言生成都将进一步释放商业智能的效率和价值。


3:数据化智能决策


4.商业智能应用场景

类比人类智能,人工智能可分为赋予机器语音、图像等感知能力的感知智能和赋予机器思考能力的认知、决策智能。认知能提升感知(如对语义的理解判断将提升机器的语音识别率),感知也会辅助决策(如智慧商超中机器视觉对客流属性、消费行为的观察、记录可辅助商超做出营销决策),本报告聚焦于认知智能在商业场景中的应用情况。


4:认知智能在商业场景中的应用



5.中国商业智能政策环境

从2015年人工智能进入爆发期以来,国家陆续提出多项意见与规划,特别是2017年“一带一路”会议、全国两会均将人工智能列入未来发展规划中,以及2016年国家将人工智能列入“科技创新2030项目”以及“十三五”重大工程,使得人工智能在中国政治、经济、学术等领域成为重中之重,引来中国人工智能最好的时代。


5:中国商业智能相关政策

6.中国商业智能经济环境

经济增速温和,跑马圈地粗旷经营的红利期已过,精细化运营的需求正在爆发。中国凭借工业化发展促使经济快速增长,2010年之后工业化进程逐渐到达顶峰,随之而来的是劳动力和财力逐渐向生产价值较低的生产部门转移,生产总值的降低导致了经济增速的下降。随着经济增速下降,无法在短时间内找到新的经济增长点,内部问题集体产生了爆发,产能过剩,高杠杆,房地产高库存和金融风险等问题扑面而来。这就意味着中国面临着一次重要的经济转型,摆脱传统的高污染低效率的粗放型发展模式,同时,现今政府多次强调供给侧结构性改革,从质和量上提升经济增长,在政策的支持下,高附加值、知识和技术密集型的产业将会重点培养,结合高科技技术,提升企业精细化运营、降低运营成本、增加企业受益。


6:2011-2016年中国GDP及实际增长率


7.中国商业智能技术环境

论文成果达到国际一线水平,企业积极应用创新性成果。


AAAI(The Association for the Advancement of Artificial Intelligence)是人工智能领域顶级的综合性会议,会议论文涉及机器学习、自然语言处理、搜索、规划、视觉、知识表达等人工智能各分支的学术探讨和应用研究。2017AAAI大会收到论文2571篇,创下新高,中国学者的论文提交量与录用率均达到国际一线水平,与美国持平。收录论文不仅有来自高校学者,还有来自百度、腾讯、华为、360、今日头条等企业研究人员,如百度的《Collaborative Company ProfilingInsights from an Employee’s Perspective——从员工角度出发,尝试利用AI让企业人力价值最大化。

国内企业与高校间的合作也愈发紧密,腾讯即有与香港科技大学的实验室合作,高校可利用企业的海量数据与测试平台,企业则可将创新性成果落地实践。需要指出的是,尽管目前AI的商业应用中国并不落后甚至在某些维度领先美国,但在原创性研究、创新土壤、人才储备方面,中美仍有较大差距。


7:AAAI2013-2017年论文提交及录用情况统计图


8.商业智能产业链

本报告侧重于智能技术在商业场景中的应用,即产业链的中游和下游。关于产业链的上游,传统IT厂商和云服务厂商可为技术、产品及服务提供者赋予计算、存储等基础设施支持,ERPCRM等信息系统可帮助企业有效记录其资源及业务数据,数据整合者的第三方数据则可丰富智能分析的数据维度。


8:2017年中国商业智能产业链


图9:2017年中国商业智能产业图谱

9.商业智能应用之供应链

通过大数据与优化技术提升供应链系统效率与柔性。

物流系统分为多层,包括入库前的仓库地址选择、入库时的策略以及销售预测、入库后的库存优化、仓储优化、清仓以及出库时货运分配、配送路线规划等。其中,仓库的选择和物流的配送是供应链管理的核心,在某地区开展新业务时,如何设定枢纽的数量、枢纽位置等对最终运送的成本有着很大的影响;配送路线规划涉及到我们在交通出行领域中谈到的路径优化与车辆调度问题,通过结合实时需求、时间窗口、承重限制等因素,对送货路线进行制定,最小化成本与时间,实现物流智能化高效运营。



10:供应链管理主要流程示意图

10.商业智能应用之金融风控

金融的本质在于给风险定价,对于风险及时且有效的识别、预警、防控一直是金融机构的核心。金融风控强调数据与技术,智能风控企业结合高维度的大数据,利用决策树、神经网络等机器学习技术,针对信贷评级、授信、贷后预警,反欺诈等场景提供解决方案,传统金融机构由过去的以经验或小量数据对风险进行把控,到现在以大数据及技术进行风控,实现金融风控升级。但同时,精细化运营全覆盖也是风控市场需考虑的关键点,即从系统的第一层出发,做全流程的金融风控,识别真正符合金融产品的优质客户,当潜在用户的信用存在风险时,应从营销端就避免引入此类风险用户。


11:商业智能之金融风控应用示意图

11.商业智能应用之智能投顾


智能投顾,顾名思义即人工智能+投资顾问。传统的投资顾问相当于私人银行中的客户经理通过与客户的深度沟通,结合客户个人的风险偏好和理财目标,传达给后台技术人员制定理财配置模型,再由客户经理将此方案给到客户;智能投顾可被理解为将私人银行的后台标准服务线上化。相比传统投顾,智能投顾拥有可简化流程、适合全民理财、可定制短//长多周期投资方案、可进行风险预警等优势,同时也面临客户对机器的弱信任感问题、现阶段政策以及所需客户财务状况全面性等限制与挑战。


图12:商业智能之智能投顾应用示意图

二、中小企业商业AI建设

1.中小企业商业AI建设的必要性

DT时代,大数据的商业价值愈发凸显。越来越多企业试图从数据背后的价值挖掘中寻求更大的变现空间。市场上并不乏SAP、IBM、Oracle等提供类似工具的强势厂商,但因为这些产品价格昂贵,使用门槛高,很多中小企业往往难以承受,买单的大多是央企、国企等大型客户。其次,中小企业主个人意志主导决策,尚未认识到数据的重要性,又碍于企业AI建设投入大、能力不足、数据积累少,因此金准数据获取了大量中小企业客户的青睐。

目前一些大型企业已构建自己的商业AI系统,分为三个层级:第一个层就是通过核心业务系统来实现基本业务的自动化;第二个层就是通过管理信息系统(ERP、CRM、SCM等)实现企业上游、中游、下游管理的流程化;最终目标是实现通过决策支持系统帮助企业实现战略决策、战术制定和战斗计划、执行、监控、分析、调整的科学化,为企业的盈利和风险防范打下坚实的基础。而金准数据专为中小企业量身定做了简单有效、价格合理的商业智能服务,为企业家的决策提供支持,助力中小企业的发展。

2. 中小企业商业AI建设的意义

随着企业和互联网的发展,数据成几何倍数增长,通过商业AI,能将企业的所在商业历史数据和不断增加的增量数据进行实时的数据分析,数据挖掘,市场预测,进而作出领先竞争对手的正确决策,给企业带来巨大利益。同时商业AI的过程也能大大降低企业生产过程中的资源浪费,减少企业成本,提高人员价值。随着商业AI的飞速发展,由大企业渗透到国内中小企业已经是大势所趋,缺少了商业AI,企业无法在市场竞争越发激烈环境中生存。

当前大企业的商业AI是做企业和非企业的结构化和非结构化数据进行分析研究,监控企业的生产经营、财务状况、营销能力、人才利用等的状况,探究存在的问题和问题产生的根源。而金准AI是利用全网全维度的数据服务分析,对企业所在行业、地区进行全方位的AI支持,发掘合作伙伴。这样可以模拟企业发展的最佳盈利模式,协助企业检查企业运营执行的状况。协助企业制定、调整企业发展的战略目标、战术目标和战斗目标。

三、金准数据从数据到决策,为企业提供最优解决方案

1.金准数据对商业智能(BI)模式的探索

金准数据认为现代商业智能框架与传统的BI模式在单体层面上基本类似,都是有一个数据层,一个模型层,上面有应用层,但是这一代跟上一代有什么不一样的地方呢?

首先它不再是一个企业内部的局部优化,它要考虑自己在供应链上下游的情况,也要考虑不同供应链之间的关系,即要考虑一个完整的产业生态网状结构的关系。

其次从数据层面,处于现在这样一个大数据的时代,企业所能接触到的数据的丰富程度是空前的。以前更多的是挑战打通内部的数据孤岛,现在除了内部数据,还有供应链上下游企业之间点对点的数据交互,还有更大的云化的外部数据。

在传统的决策支持系统里,因为没有明确的相关性,这些外部数据的利用率很低。但是外部环境对企业经营可能有更大的影响,外部数据隐含着很多相关性,利用现在的大数据技术,可以为企业决策带来更多的数据信息,通过AI的方式把里面有用的信息挖掘出来,应用到整个决策支持系统里面。

2.韦特大脑:企业AI分析平台

韦特大脑通过人工智能算法对互联网公开信息的抓取分析和深度学习,完成对企业和个人信誉完成的三阶段评估,即判断一个企业是否真实存在以及判断该企业的合规性,了解企业工商基本信息,对于此类企业主题资格审核范畴;判断一个企业的经营发展状况,和互联网关联的紧密程度,对于此类投资项目初选范畴;以及判断企业当前的涉诉、舆情舆论、行业口碑、竞争压力,对于此类重大项目合作、收购等决策支持范畴。在获取企业的网络招聘数据、企业的基本信息数据、企业的新闻和推广数据后,韦特大脑在这些数据上进行人工智能分析,可以得出多种分析成果。这将大大节省调查成本和时间,因为它能降低企业审核自己数据的成本,随着新的数据到位,企业可以建立人工智能模型。

(一)企业和产业链AI分析

企业AI分析平台利用数百项AI专利技术,汇集、分析了36个产业链、8000个行业、40000个细分市场、600多个城市、2800个区县、2500个高新园区、30多万条街道、50多万个写字楼的3000多万家公司法人企业和7000万小微企业,包括财务数据、工商数据、法院数据、行政处罚数据等千余项指标。

通过对上内容的不断深度学习,形成了金准数据独有的产品:“产业链大数据”。该大数据区别于传统产业链,AI分析后,采用最先进的产业链划分体系,建立基于经济圈和投资圈的产业链关联关系,利用产业链大数据能够密切关注整个产业链的运行状况,了解企业上下游企业的信息,及时全面掌握有关产业链中相关企业信息,能够密切关注企业外部环境的发展态势,并对以企业为中心的商业生态进行重塑。




(二)企业财务AI分析

企业AI分析平台通过独有的AI专利技术,深度融合900万家企业最新真实财务数据,遥遥领先于行业内其他平台。AI将财务数据进行科学系统的分析、最先进的数据处理技术,全面衡量企业经营状况和信用风险。覆盖70多万个网络信息渠道,囊括最主要的21个核心省份城市。通过数据识别、数据审核和机器自主学习等前沿技术进行企业标注。

(三)失信企业AI监控

企业AI分析平台致力于打造全国企业信誉信息防护网,立体、实时地预警失信企业。数据来源体现出权威、及时、融合、深度等特点,涵盖工商、法院、税务、海关、质检、环保等政府部门失信数据的同时,还深度挖掘失信企业的关联企业网,真正实现让失信企业无所遁形。

(四)企业数据可视化AI分析

企业AI分析平台在提供精准的数据检索服务的同时,可以为用户分析企业的情况,其中包括企业星云图谱、资本关系图谱、成长风险综合评估、行业地位分析等,对目标企业进行全方位的分析和定位。

企业AI分析平台的特色库中的企业覆盖各行各业,根据企业的不同特性,通过特定的算法为客户提供了:拟上市企业库、新生企业库、黑色企业库、PE/VC库、国家各类计划企业库和集团企业星云图,还可以根据行业、地区等条件进行精确查找。

韦特大脑在研发人工智能大数据中发现,如掌控不好实时变化的数据会给用户在使用中带来困惑。例如,一家企业在招聘网站上标注的面试地址和其工商注册地址信息不一致。这会仅仅是企业搬家了这么简单吗?如何判断这类工商信息和互联网信息的不符?就需要更大范围的人工智能大数据搜索,通过工商数据和公开的网络数据对比发掘企业的真实状态。

为此,韦特大脑还介入了全网信息监控平台,关注12000万个微信账号、10亿多个微博账号,并关联各大社交网站客户端,实时收集相关评论和数据源,以便于客户在搜索个人和企业信誉信息时第一时间获取到全面客观的信息。

作为企业决策支持的助手为企业做出人工智能预判也是韦特大脑的“杀手锏”。众所周知,识别之外,判断决策才是最具价值的人工智能应用。韦特大脑实时浮动的信用评估则会对企业起到督促刺激的效果。不断更新的信用内容还包含企业交易行为、金融行为、上下游贸易伙伴关系和投资情况等商业信息,能够让金融机构或者合作企业根据企业当前的信用状况作出决策。

结语

金准数据可为精细化运营蓬勃发展的中小型企业提供简单有效、服务性价比高的商业决策服务,目前名为韦特大脑的企业AI分析平台已经上线。金准数据致力于人工智能技术应用于商业决策,实现商业经营的智能化与自动化,运用商业智能帮助企业实现数据驱动认知到数据驱动决策的转变。在利用运筹学的思想将商业活动中的实际决策问题转化成数学模型之前,通常需要先利用统计学或机器学习对采集到的海量数据进行规律性分析——融合运筹优化及机器学习技术、为客户提供全链条服务正是金准数据的一大优势,因此金准数据也在同步进行机器学习引擎的开发。

2018年十大科技趋势预测——基于BAT的AI生态时局

前言

人工智能在2016年还处于概念热炒阶段,2017年开始沉淀下来出现应用级产品,2018年将进入应用爆发期,出现大量真正的智能应用。金准数据统计分析,未来少数大企业将自行研发算法;多数企业将引入人工智能技术的套装软件与服务规划企业资源、优化管理流程;普通消费者将会越来越多使用智能家居机器人、智能语音盒子等人工智能产品。

金准数据预测,2018年有四项描述“数字世界与物理世界混合”的战略科技发展趋势,将继续颠覆人们的生产生活习惯。它们分别是数字孪生、从云到边缘、会话式平台和沉浸式体验。

数字孪生是指以数字化的方式模拟再现真实的运营环境,人工智能和物联网的发展使其成为现实。未来,企业、政府等机构可通过模拟运行来“预知”一项决策的实施结果,并以此进行优化,提升决策的有效性。

从云到边缘描述的是未来技术架构的思路。“近几年云计算炙手可热,但事实上我们看到云并没能代替一切,传统服务器、手机等智能硬件仍有其不可替代的特长,”金准数据认为,面对海量信息,处理、内容收集与交付均在临近信息的源头完成,需要决策的是哪些数据由前端及时处理,哪些上传至云端数据中心,“不要再相信所有事情都发生在云里头。”

会话式平台和沉浸式体验为我们畅想了未来人机互动的生活方式。金准数据指出,一个重大模式的转变将是“从人向机器诠释意图、发起指令,转变为机器主动向人提出建议”,比如家居智能物件将依据对主人生活习惯的分析来自动运行家电,汽车会主动提醒车主进行何时该进行保养维修等,智能手机甚至可以通过人脸识别分析使用者的情绪,提出从娱乐到订餐等广泛的建议。

金准数据预测的2018年十大科技趋势还包括事件驱动、区块链以及新的信息安全观念。

金准数据预测,以场景、事件驱动的商业模式很可能在2018年出现,与既有的指令驱动模式相比,该商业模式更为主动。

金准数据认为,在2017年炙手可热的区块链,其落地性到底有多强,2018年可能见分晓。

在信息安全方面,金准数据强调,未来的决策者需具有“持续渐进性的风险和信任机制”,以便更好地利用机会并管理风险,从而确保安全性能够跟上数字化业务的速度。

基于BAT的AI生态时局,金准数据预测2018年十大科技趋势,中国企业在场景应用、商业模式领域实现突破可能更快,无论在数量和创新上都有望继续领跑全球。

一、BAT时局详述

第四次工业革命是人工智能全面发展的时代,2017年人工智能正走在最关键的路口,很多AI创业公司在各自的领域取得了突破,但具备强大的AI技术储备,并且有能力渗透到几乎所有领域的,目前来看主要还是BAT三家。这场AI“附能”的革命考验的是平台、技术、场景、生态等多方面的综合实力,百度的All in AI,腾讯AI in All,阿里达摩院BAT的AI生态布局揭示了2018年金融科技发展趋势。

BAT三大巨头在人工智能上的布局已初见轮廓,核心在于组建团队、研发项目、构建生态。

1 BAT的AI生态时局图


1. 百度


2 百度的AI生态时局图

百度在AI领域的投入始于2013年1月深度学习研究院(IDL)的创立。接着建成了五大实验室,除了深度学习实验室之外,还有硅谷人工智能实验室、大数据实验室、增强现实实验室和深度学习及应用国家工程实验室。这些实验室的研发成果历经5年的整合,逐渐形成了一个平台体系百度智能云和百度大脑。智能云提供计算的基础设施和数据的获取、分析、标注能力,而百度大脑,整合了机器学习、深度学习算法,再将AI对语音、图像、视频、AR/VR的感知能力和自然语言处理、知识图谱、用户画像等认知能力开放出来,就形成了百度AI开放平台。

根据百度最新公布的数据,百度大脑现在拥有80多项核心AI能力,超过37万名开发者和合作伙伴,每天被调用2.19亿次。这些调用,来自百度内外。

对内,百度将AI能力输送到百度现有的各个产品之中。主业搜索自不必说,从一开始就受惠于AI技术的进步,包括手机百度、爱奇艺等应用也在AI的驱动下不断提升,2016年推出的信息流业务也在迅速发展。对外,百度走上开放平台的道路,主推DuerOS和Apollo。同时尝试开拓金融、机场、新零售等场景,积聚力量,构建自己的下一个生态。

不过总体来说,无论是从“All in AI”的技术投入来看,还是从所有能力汇总于百度大脑、全力推进Apollo、DuerOS两大平台的布局来看,百度似乎在把自己的AI力量集中起来,向着最重要的行业,单点突破致力于实现AI技术的产品化和商业化。

2. 阿里

3 阿里的AI生态时局图

阿里AI研究始于2014年成立的数据科学与技术研究院,也就是iDST。而阿里大部分AI基础研究成果出自这里,比如最近机器阅读理解方面取得突破的阿里团队,就来自iDST。当然阿里内部体系众多,展开AI研究的部门也不少。例如在“双十一”期间,商品推荐、客服、海报宣传、运营维护等方面均有AI技术的加持。蚂蚁金服也在与金融机构的合作中,把AI技术作为一个重要的亮点。

在整个互联网行业涌向AI的浪潮中,阿里也在2017年推出“NASA计划”和承载它的实体组织达摩院。达摩院的研究领域可谓广撒网,涉及量子计算、机器学习、基础算法、网络安全、视觉计算、自然语言处理、人机自然交互、芯片技术、传感器技术、嵌入式系统等,可以看出,AI在其中占据了半壁江山。达摩院的主要任务,是在全球范围内建实验室招揽人才,和高校建立合作。

另外,阿里还有一个人工智能实验室A.I. Labs,它不止是一个研究机构,还承担着基于AI技术打造平台、推出产品的职责。目前,他们除了天猫精灵智能音箱和搭载的AliGenie操作系统、AliGenie语音开放平台之外,还推出了AR开放平台和AR内容平台。从2017年末开始,自动驾驶也成为了A.I. Labs发力的领域之一。

和自带产品开发职责的A.I. Labs不同,iDST的研究成果走进现实世界,依靠的是他们打造的一个个“大脑”。这两年来,阿里云相继推出了ET城市大脑、ET医疗大脑、ET工业大脑、ET环境大脑、ET航空大脑,将AI能力与大数据和云计算结合起来,在各个垂直市场跑马圈地。

阿里最近,在努力将这些大脑们整合为一个统一的平台阿里云ET大脑。2017年最后一场云栖大会上,ET大脑正式发布,所布局的领域也不再限于原本的城市管理、医疗、工业、环保、航空,同样走上了“广撒网”之路。

3. 腾讯


4 腾讯的AI生态时局图


腾讯的基础研究基于AI Lab、优图实验室和微信AI实验室三大机构,优图专注于计算机视觉技术,而AI Lab和微信AI在研究方向上虽然叫法不同,但多有重合,都是AI实验室标配的机器学习、自然语言处理、语音识别和计算机视觉。

根据各个实验室列出的合作伙伴和案例,这些实验室的技术,大部分都输送到了腾讯各条产品线之中,成了微信里的语音转文字、视频音乐新闻的推荐和排序、QQ的高能舞室、天天P图的军装照……

同时,腾讯的AI技术也同样寻求着在更多垂直领域的落地应用,其中最引人注目的,是医疗平台腾讯觅影。在金融、安防、政府政务、智慧零售等等领域,腾讯也都将AI技术与自身的社交、支付、地图、小程序等等技术结合起来,推出了垂直解决方案。

另外,腾讯也有类似于百度大脑的“AI开放平台”,在深耕的垂直领域之外,将自己的AI技能开放出来,供应给开发者。不过,目前这个“开放平台”的用户案例,依然是以腾讯内部产品为主。与此同时,腾讯在自动驾驶和对话式AI平台上,也分别投入了不止一支团队,开始造平台、积累合作伙伴。


二、BAT在人工智能技术落地场景梳理

人工智能的应用场景众多,BAT三大巨头在人工智能技术落地场景的规划不尽相同。

5 BAT在人工智能技术落地场景


1. 对话式AI

人机交互的重大革新、下一代服务入口、下一个Android、家庭的控制中心……种种期待,让用于智能设备的对话式AI成了BAT争夺最激烈的领域。

百度有DuerOS,阿里有AliGenie,腾讯则至少有两个:腾讯云小微和移动互联网事业群(MIG)的叮当。

如果我们以智能音箱销量来评判对话式AI系统的发展,很会做生意的阿里似乎冲在最前。2017年7月,阿里AI Labs初次亮相,发布了一款智能音箱:天猫精灵X1。这款音箱,双十一降价促销,当天卖出了100万台。

但是,卖音箱只是手段而非目的。天猫精灵背后的终极目标,还是一个关于AliGenie开放平台、生态系统的梦想。

这个生态系统的梦想,BAT都有。

6 对话式AI


百度虽然直到去年底才推出渡鸦raven H智能音箱,但最新的数据显示,DuerOS开放平台发布半年时间里,已新增130余家合作伙伴,落地硬件解决方案超过20个,每月新增5款以上搭载DuerOS的设备,覆盖家居、车载、移动各个场景,机顶盒、电视、冰箱、音箱、机器人、车载、手机、耳机等各类设备。

7 对话式AI应用场景


为了守住这个领域,百度除了在北京和硅谷建设AI庞大的团队之外,还收购了两家创业公司:做语音交互和自然语言理解的Kitt.ai,和后来推出了raven H音箱的渡鸦。

内部竞争还未分胜负的腾讯势头也很猛。公开亮过相的两个团队里,叮当的发展速度似乎更快一些。2017年4月,它作为一个“语音助手”以App的形态发布,12月20日,发布了首款合作硬件1More耳机。截至目前,叮当虽然没有推出名为“硬件开放平台”的东西,但他们的“生态伙伴计划”也的确很见成效,做机器人的优必选、做音箱的哈曼、造车的广汽、做手机的魅族、努比亚等二十多家硬件厂商,都在腾讯叮当的合作案例名单之上。

相比之下,腾讯云小微的硬件开放平台和技能开放平台仍处于内测状态,除了和华硕一起造的机器人之外,没有太多关于合作伙伴的声音传出。值得一提的是,他们似乎在硬件之外,开辟了一条退路:智能客服。

智能音箱先行的AliGenie同样不是天猫精灵专属,它的硬件接入平台页面上,也展示着十多家合作伙伴。另外,AliGenie还推出了垂直行业智能语音解决方案,想在家居、移动硬件之外,为对话式AI开辟出新场景。

2. 金融

阿里旗下的金融巨头蚂蚁金服和阿里云都在尝试赋能金融机构。

2017年1月以来,蚂蚁金服开始逐渐转变自己的定位,尝试用自身积累的技术能力来赋能、服务金融机构。夏天,蚂蚁金服在理财和保险领域,向金融机构开放了“理解用户”、“优化投资策略”和“用户与金融产品匹配”三个层面的能力,后来,AI客服能力、智能图像定损技术等等也相继开放。然而这还并不是蚂蚁金服AI布局的全貌,蚂蚁AI技术将成熟一个,开放一个。

2017年底,阿里云又发布了ET金融大脑,要帮合作伙伴风控、营销和客服方面提高效率。

相比之下,腾讯向金融行业合作伙伴提供的技术就显得比较表面,没有涉及风控这样的专业垂直应用,而只是将更为通用的身份检测、客服等能力注入其中。

虽然百度金融这一年来在to C市场上声量不大,但这家“All in AI”的公司,在金融上也要将“智能化”坚持到底。截止2017年底,百度金融已经赋能近400家机构,为机构客户提供解决方案,为它们提供安全防护、智能获客、大数据风控等服务。百度金融据说还在谋划更为独立的未来。

3. 医疗

医疗领域,百度在医疗事业部部分团队转入AI体系之后就悄无声息,但腾讯和阿里都在抢占布局。

首批国家新一代人工智能开放创新平台中,腾讯就以医疗影像平台“觅影”入选。腾讯觅影发布于2017年8月,最先推出的是早期食管癌筛查。后来,觅影又相继推出早期肺癌筛查、糖尿病性视网膜病变筛查、乳腺癌早期筛查等医疗影像技术,还基于自然语言处理推出了AI辅助诊疗、病案智能化管理产品。

8 AI医学影像


腾讯觅影结合了AI lab、腾讯优图、TEG架构平台部等团队的AI技术,由互联网+合作事业部牵头建立。推出至今不到半年,腾讯觅影已经有了西门子医疗、兰州大学第二医院、深圳市南山人民医院、中山医院等十几家合作伙伴。

马化腾此前表示,医疗与AI是非常好的落脚点,未来腾讯在医疗方面会做更多的事情。

阿里入局AI医疗其实比腾讯还要早。2017年3月底,ET医疗大脑首次亮相,宣称具有虚拟助理、医学影像、精准医疗、药效挖掘、新药研发、健康管理等功能。


与腾讯思路不同的是,ET医疗大脑的技术并非都出自阿里内部,而是聚集了不少合作伙伴一起提供服务,比如做皮肤检测的宜远智能、分析病历的惠每医疗等等。

目前的阿里云ET医疗大脑,能够提供影像智能诊断、智能病历诊断、语音医嘱录入、医疗意图识别、辅助管理决策、家庭慢病管理、DNA序列分析等功能。阿里在医疗方面,还跟华大基因、上海华山医院、浙江卫计委等机构展开合作。

另外,阿里去年也在医疗方面有一些投资布局,包括嘉和美康、Prenetics等。腾讯的动作也不少,去年已经披露出来的医疗相关投资包括:VoxelCloud、Grail、企鹅医生、Practo等。

4. 零售

不管是新零售还是旧零售,不管是线上还是线下,阿里在这个领域都有天然的优势。先梳理一下AI给阿里自身业务带来的变化。机器人客服“阿里小蜜”,双11当天承担95%客服咨询;机器智能推荐系统,双11当天产生567亿不同的货架;AI设计师“鲁班”,双11期间,设计4.1亿张商品海报;华北数据中心运维机器人:接替运维人员30%重复性工作……

AI之于百度的搜索业务一样,AI之于阿里的电商业务也具备天然的赋能加成。除了上面提及的进展,蚂蚁金服还基于AI技术推出客服机器人“小蚂答”,以及AI助力的车辆定损服务“定损宝”等。

阿里还搞出了无人零售咖啡店。无人商店,是一个未来非常有意思的趋势。

此外,阿里在新零售思想的指引下,还大举投资了一批线下零售相关企业,包括:企加云、大润发、东方股份、新华都、易果生鲜、银泰、bigbasket、联华超市……

可以想见,阿里在零售方面的生态布局,一定会成为其AI技术应用的重要场景。

零售不是腾讯的强项,不过腾讯也提出了“智慧零售”的概念。腾讯COO任宇昕对此解释称:腾讯希望的是通过’去中心化’的方式,把平台能力开放给广大品牌商、零售商以及商业地产等合作伙伴。

腾讯表示将提供场景、大数据、AI技术支持,以及腾讯全产品线,帮助商家量身定做解决方案,帮助线下门店实现数据化和智能化,让消费者与商品之间,实现跨场景的智慧连接。

现在已经有一些案例出现了。例如在深圳、广州的一些服饰连锁零售店里,腾讯的AI技术提供了人脸识别、客户画像、精准推荐等技术支持。其他方向还包括餐饮连锁、快消等等。

零售更不是百度擅长的方向,不过百度在这方面也有所行动,正在寻找合适的合作伙伴准备赋能。有意思的是,已经离职的前任百度研究院长林元庆,创业服务的第一个大客户,就来自零售领域。


三、2018年初人工智能技术新进展

2017年围棋人机大战,柯洁第二次挑战阿尔法狗再度败北2017年,人工智能参加了高考,数学成绩高于同场竞技的清华、北大学霸2017年科大讯飞的医疗程序参加了临床执业医师考试,并超过临床执业医师合格线……人工智能在2017年的热点事件数不胜数。

进入2018年以来,分别于1月份和2月底举行的“2018拉斯维加斯消费电子展(CES)”及“2018年世界移动通信大会MWC”引人瞩目,两个展会展示了全球人工智能和移动通信技术开发应用的最新进展,显露出世界最新技术发展方向和潮流,预示着全球新技术和经济发展引擎将要开启。

2018年初人工智能相关企业如雨后春笋般涌现,几乎遍及所有技术领域。无论是业界巨头还是初创企业,几乎都在将人工智能武装到牙齿。其中,通过自然语言实现人机交互,以及通过人工智能构建信任和消除偏见,可以说,这是业界目前最热衷投入解决的两个问题。金准数据分析认为,2018年,掌握数据的企业和机构、提供更主动服务的商业模式,有望为人们带来耳目一新的人工智能应用。

在今年1月份的拉斯维加斯消费电子展上,百度针对自动驾驶技术推出了“阿波罗2.0”平台,其云端服务、软件平台、参考硬件平台以及参考车辆平台四大模块全部开放,合作伙伴已超过了90家。

在世界移动通信大会上,中国移动与诺基亚举行战略合作协议签约仪式。双方将在智慧城市、智慧交通、视频智能分析、下一代网络等方面深入合作,共同培育良好生态环境,推动产业持续发展。

由于AI技术覆盖领域广泛,全世界都在加快向AI技术投资的步伐,人工智能作为引领未来的战略性技术,已经成为世界各国提升国家竞争力的重要利器。

金准数据调查发现,截至2017年6月份,全球人工智能企业总数达到2542家。其中,美国最多,达1078家;中国第二,486家。中国人工智能企业诞生于1996年,2003年进入平稳期。相对而言,中国在基础元器件、基础工艺方面与国外还有差距。

金准数据调查显示2030年人工智能每年将为亚洲贡献经济价值高达1.8万亿美元至3万亿美元,将对金融服务、医疗保健、制造、零售和交通等行业产生巨大影响。

人工智能+工业机器人、人工智能+服务机器人、人工智能+特种机器人、人工智能+家居、人工智能+工厂、人工智能+手术、人工智能+无人超市……从“互联网+”到“AI+”,人工智能默默地填充、改变着人类的学习娱乐、生产生活。

四、2018年科技领域10大趋势预测

语言交互、计算机视觉、物联网、区块链……前方,将是一个无比繁荣、无比高效的未来——智能时代。

除了人工智能,2018年大数据、云计算、5G还有区块链都持续成为科技领域热词,那么2018年科技领域将会有那些新的进展?金准数据总结预测了2018年科技领域的趋势。

1、语言交互——从信息传递到情感沟通

人机语言交互的极致体现莫过于电影《her》中宅男爱上了电脑对话程序“萨曼莎”。沟通,是人最紧迫又最困难的事。为了解决问题,人类一直在社交层面努力。在近几年,人机交互领域的创业呈现爆发性增长。

人机交互技术(Human-Computer Interaction Techniques)是指通过计算机输入、输出设备,以有效的方式实现人与计算机对话的技术。其中语言交互是重要的人机交互手段。

在语言交互上,2000-2016年,全球累积新增自然语言处理企业数量达到543家,其中319家企业于最近五年(2012-2016年)产生,占总数的58%以上。全球计算机视觉累积融资规模达到18.1亿美元,其中61%以上的融资规模发生于2012-2016年。

巨大的融资规模和企业数量落地到不同的应用领域。目前,Siri和Alexa是最受欢迎的人机交互工具,但还处于基础阶段。未来,语言交互的应用场景将从生活服务到医疗健康领域无所不在。《her》的场景并不是痴人说梦,今天的微软小冰已经开始在向情感对话领域探索。在2018年,语音交互将进入落地应用的爆发元年。

2、计算机视觉——比人类更专注的眼睛

现在计算机视觉系统已在视觉方面超越人类。例如机器可以在众里寻他——识别出在逃的犯罪分子,还能够帮助父母寻回走失的孩子,机器甚至还能做到根据你的表情识别出你的情绪,进行情绪分析。

金准数据指出2000-2016年,全球累积新增计算机视觉企业数量达到802家,其中520家企业于最近五年(2012-2016年)成立,占总数的65%以上。全球计算机视觉累积融资规模达到22.8亿美元,其中超过80%的融资规模发生于2012-2016年。

2018年,计算机视觉的应用场景将会继续扩大。算法在提高的同时,更具挑战性的应用也会被提出来。人脸,车牌/车型以及物体分类跟踪是当前比较受关注的应用,很多明星企业也主要在做这个领域,但其实这只是一小部分而已。还有其他更有价值的领域,比如产品缺陷检测,雷达图像分析,医学图像分析(例如癌细胞早期筛查)等。

3、大数据——亟待挖掘的金矿

2017年“智慧城市”的概念随着雄安新区建设的号角吹响变得异常火爆,而大数据则构成了“智慧城市”的大脑回路:通过实时监测交通流量,及时发现堵情,优化信号灯配时方案,交通管理更加高效家庭收入状况统一入库,一键查找核对便可识别骗保情况,扶贫救助也变得更加准确。

2018年,大数据将从城市管理的“高级参谋”逐渐化身日常生活的“贴心管家”。集纳个人医疗信息汇编电子健康档案,随用随取便于异地会诊把公共服务网点位置搬上数据“活地图”,按图索骥即可便捷到达通过分析学生学习过程数据并灵活调整教学计划,因材施教将更加精准。

数据量随着移动互联网变得愈来愈大,各行各业如何更好的挖掘数据将成为2018年最重要的议题之一。但是我们不能忽视的是,当数据量巨大时,个人数据隐私的保护。

4、智能应用与分析——企业决策的法宝

在今后几年里,几乎所有的应用与服务都将采用一定程度的人工智能。其中某些应用将成为真正的智能应用,如果没有人工智能与机器学习,这些应用程序将无法存在。

智能应用在人类与系统之间搭起了一座全新智能桥梁,有望改变工作的本质以及工作场所的结构。例如,利用大数据分析工具,便利店可以轻松知道什么货品最畅销,从而及时补足货品。

增强分析是一个格外具有战略意义的、逐渐发展的领域。它面向广泛的商业用户、运营工作者和民间数据科学家(citizen data scientist),利用机器学习自动完成数据准备、洞察发现与分享。

2018年,智能应用与分析应用将持续推进,将有20%以上的企业利用智能应用与分析进行重要的企业决策,包括企业资源规划(ERP)的各个方面。有人甚至认为,人工智能取代脑力劳动者的时代到来了,但是在探索智能应用时,我们应将它作为增强人类活动的一种方式,而非简单地替代人类。

5、虚拟现实——科幻走进现实

在科幻电影《盗梦空间》中,一群贫民窟的贫困者将自己完全沉浸在虚幻的现实中不肯醒来,虚拟现实技术正将这些超现实场景带入生活。2017年里,VR取得了长足的进步,但2018年可能是其开始产生广泛影响的关键一年。

2018年VR将会走多远科幻小说的场景如何成为现实?金准数据预测,到2021年,全球VR产业估值将达到600亿美元。

2018年可能是VR进入主流的开始,因为头显进入了第二代,将会变得更便宜,更轻。在视频游戏社区中,头显也将越变越小,更易于使用。2016、2017年以前,Oculus rift、HTC Vive和PSVR的价格在400美元至800美元之间,这无疑是VR被广泛采用的障碍。

6、5G——再也不担心流量费的时代要到来

5G是目前通信产业中最重要的技术革新,在产业界的努力下正快速的向我们走来。它将提高至少十倍于4G的峰值速率、毫秒级的传输时延和千亿级的连接能力,开启万物广泛互联、人机深度交互的新时代。

2017年基础电信运营商的5G试点已经开始落地。中国电信近日对外披露,5G试点是与全球领先的网络设备与芯片公司深度合作,进行5G技术创新方面合作探索的最新进展。试点除了端到端验证5G 关键技术、网络性能和商用组网的能力外,更将联合垂直行业和创新企业,同步开展5G技术与行业应用结合研究和试验。

2018年世界移动通信大会上,发布了数十种与5G相关的公告,包括设备、调制解调、计划、频谱和试验。越来越多的公司开始推广自己的5G商业计划,并且已经有很多公司开始了5G网络测试。英特尔已经与戴尔、惠普、联想和微软合作,利用英特尔XMM 8000系列商用5G调制解调器Windows PC实现5G连接。英特尔在MWC展示了其第一款支持5G技术的2合1概念PC,该款PC采用第8代酷睿i5处理器和早期的5G调制解调器,预计在2019年下半年,这种由5G连接的PC将推向市场。

澳大利亚运营商Telstra在本届大会上宣布了其5G试点计划,旨在到2019年底之前为主要城市和地区提供包括sub6GHz和mmWave频谱的5G。

美国Sprint公司则宣布首先将5G网络带到洛杉矶、华盛顿特区、亚特兰大、芝加哥、达拉斯和休斯敦,这6个城市将从4月份开始体验“类似5G的能力”。

与此同时,一大批中国企业向世界展示5G的“中国实力”,在这一前沿领域,中国企业正掌握越来越多的核心技术。其中,作为端到端5G解决方案的一部分,华为推出了首款商用5G CPE,这是一款支持3GPP 5G标准的终端设备,采用华为开发的巴龙5G01芯片组。据华为方面称,这是全球首款商用3GPP 5G芯片组,下载速度高达2.3Gbps。巴龙5G01使华为成为第一家通过其网络设备和芯片级功能提供端到端5G解决方案的公司。中兴通讯将在2018年底或2019年初推出5G智能手机和平板电脑,明年上半年在商用5G网络上部署网络产品。中国移动表示,将在2018年建设世界规模最大的5G试验网,并正式公布了2018年5G规模实验计划——将在杭州、上海、广州、苏州、武汉五个城市开展外场测试,每个城市将建设超过100个5G基站;将在北京、成都、深圳等12个城市开展5G业务和应用示范。

金准数据分析认为,2018年国内和全球的5G网络建设有望加速,整体市场空间也将快速打开。通信行业将步入新周期,产业发展出现承上启下态势,资本市场处于预期升温阶段。而随着5G技术的逐步成熟,5G的发展上了一个新台阶。

7、云计算——应用程序架构的未来

云计算是一种业务模式,服务提供商在定制的环境中处理客户的完整基础架构和软件需求。随着云计算的发展,云服务和解决方案也将随之增长。软件即服务(SaaS)预计到2020年将以18%的年均复合增长率增长,平台即服务(PaaS)的采用率将在2020年达到56%,而2017年为32%。2018年基础设施即服务(IaaS)的全球市场规模将达到175亿美元。

随着企业云服务的采用,云文件共享服务将会增加,而消费者云服务也将会随之增长。在云计算领域,亚马逊领先于微软、IBM、谷歌及其他技术巨头。2022年,亚马逊AWS营收将达到430亿美元。

2018年将是机器学习和人工智能在人们管理的云计算复杂性发挥其作用的第一年。就像高速算法交易改造股票市场一样,高速算法自动化转换管理也是如此。人们将开始看到机器驱动的知识和自动化驱动人们的监控、事件管理、成本管理,以及配置管理。其最终结果是:降低成本,提高安全性,改进服务等级协议(SLA)和更好的性能。

虽然这个转型将需要十年时间,但2018年将达到一个临界点,其中云计算2.0将最终被人们接受为应用程序架构的未来。人们开始告别虚拟服务器。

8、物联网——人也将成为网络的一部分

物联网(IoT)的扩张已经把数不胜数的大数据新来源添加进了数据管理的版图,它将成为2018年及若干年之后主要的大数据趋势之一。笔记本电脑、智能手机、传感器甚至内衣都为物联网带来了大量数据。

金准数据统计分析,物联网将扩大个性化设备的范围和数量。2016年有66亿台设备。到2021年,将有225亿个设备——这是3.4倍。

2018年,消费者和企业主将受益于越来越多的传感器和来自各种消费类设备的数据。物联网能收集信息,使企业可以更有效地把产品推销给潜在客户。懂技术的公司已经开始投资基于传感器的数据分析,这将使他们可以追踪其商店内人流量最大的区域。

在医疗领域,新的可穿戴技术能追踪用户的健康状况,使医院和诊所得以改善医疗质量。物联网设备可以提醒患者服药、锻炼和注意血压的剧烈变化。或许未来,我们的身体器官也可以联网,成为网络的一部分。

9、网络安全——新的战场

2017年WannaCry敲诈勒索病毒在全球爆发,网络安全引起广泛关注。在2018年,随着云计算占比增高,海量的云数据泄露也将随之成为数据安全重灾区,这主要是因为企业公司尚未充分意识到云端数据保护的复杂性。

仅在2017年,已有超过990亿条记录因为数据泄露而遭到曝光。黑客入侵是目前最普遍的原因,紧随其后的是缺乏安全保护、监守自盗和硬件遭窃。基于云端的安全配置误操作也常常导致数据的泄露。

医疗和金融服务公司是重大泄露发生的主要场所。这两个至关重要的行业领域内的易受攻击性和受利用性将在2018年进一步增长。

在网络安全方面经常出现这种情况,而由技术进步而放大的人类智慧将成为攻击者和防御者之间对抗的制胜因素。2018年企业必须利用新技术来推动业务运作,提供更好的安全保护。

10、区块链——超出金融范畴的应用

2017年,区块链及相关行业加速发展,全球正在跑步进入“区块链经济时代”。在全球范围内,会出现更多的成熟应用。区块链带来了效率提升和成本降低的技术手段,为经济社会发展和治理提供新的思路。围绕区块链体系,能够创造出丰富的产品和服务,人们可以在相互无信任的情况下,无地域限制地进行大规模协作。由此,一个全新的经济时代展现在公众面前。

区块链的具体应用远远超出现金和货币的范畴。它提供一种途径让彼此并不认识的人来创建大家都能查看的资产记录。它是真理捍卫者。这就是洪都拉斯的政府看上区块链技术的原因,那帮政客已寻求美国初创公司——Factom来提供基于区块链技术的土地登记原型。希腊也对这想法表达出兴趣,它没有合理的土地登记,全国只有7%的土地拥有正确的记录。

区块链的其它应用,从防范钻石窃贼到精简股票市场都有用武之地:纳斯达克交易所很快将开始启用基于区块链技术的股权交易平台,来记录私有公司的交易。英国银行向来保守,不爱接纳新兴科技,但这次似乎也有所触动:去年年底该银行的一份研究报告中指出,分布式账簿是对金融行业有着“深远影响”的“显著创新”。

2018年,上述10大技术将更加深刻的影响我们的生活。

英国AI发展现状及对我国AI发展的启示


人工智能(AI)的出现和发展可以给英国带来巨大的社会和经济效益。借助人工智能,计算机能够比人类有更高的准确性和速度进行信息分析和学习。从药物研发到智慧物流,人工智能技术的融入,提高了效率、完善了性能,为绝大多数的行业甚至是各行各业都带来了可观的收益。其实,人工智能可以理解成是一种软件,通过更好地抓取和利用信息从而帮助做出更准确和高效的决策,并将其整合到现有的流程中,实现实时的改进,帮助扩大规模,并降低成本。


据估计,截至2035年,人工智能将给英国经济增加8140亿美元(约合6300亿英镑)的额外收入,届时,GVA年增长率有望从现有的2.5%飙升至3.9%,我们的愿景是让英国成为世界上最适合发展和部署人工智能的国家,从起步、发展到繁荣,实现技术所能带来的最大便利。




基于纯粹强化学习的AlphaGo Zero颠覆了很多对人工智能(AI)的既有认知,也让很多第三波人工智能浪潮泡沫论者闭了嘴。2030年,人工智能将带来15.7万亿美元的经济增长,包括生产力的提高(6.6万亿美元)和应用市场(9.1万亿美元)。



最近英国发布的人工智能政府报告——在英国发展人工智能,基于人工智能发展现状和英国的历史优势探讨政府、产业界和学术界需要采取的相关措施,并分析可能的应用和市场前景。

英国的AI政策盘点

英国AI政策盘点

英国大概是欧洲推动人工智能最积极的国家了。而最近发布的这份报告《在英国发展人工智能产业》(GROWING THE ARTIFICIAL INTELLIGENCE INDUSTRY IN THE UK,以下简称报告)更是直指AI产业化,指出AI将为英国提供8140亿美元(约为6300亿英镑)的经济增长,推动GVA年增长率从2.5%增至3.9%。该报告称,英国目前是人工智能的领导者之一,希望能继续保持该优势并将英国建成全球最适合人工智能企业发展的地方。


众所周知,人工智能的一大潜力就在于优化效率,其用例包括供应链的存储和分销网络(亚马逊仓储)、建立新的业务模型、帮助公司和个人员工提高工作效率、减轻大数据集搜索的负担(沃森专家系统),可用于消费电子、医疗、安防、金融等诸多领域。这种生产力的推进,是政府重视AI的根本原因。


AI用例

报告根据已发表的文献指出,2024年,全球人工智能市场价值可能超过300亿美元,对于部分行业,AI可以带来30%的生产效率提高,节省25%的成本;2030年,人工智能可能为全球经济贡献1570亿美元,包括生产力的提高(increased productivity6.6万亿美元)和应用市场(consumption-side effects9.1万亿美元)。


政府和产业可以怎样为AI创造发展环境

报告强调,当下是英国针对人工智能采取必要行动的关键节点。一方面,作为图灵的故乡,虽然英国的人工智能在全球,特别是欧洲有领导者的优势,但产业发展初期,这份优势未必能够保持,产业界需要提高竞争力;另一方面,人工智能技术已经为广泛应用做好了准备,基于计算能力的显著提高、越来越多可用的大数据、新算法和相关应用程序,过去五年相关的投资、双创井喷式增长。至于AI引起的就业挑战,与其他政府一样,英国认为这是不可避免的一个问题,需要政府和市场合作,发展新工种和新的工作方式,提供就业和再就业培训。


英国现有的AI优势


1.庞大的数字产业

人工智能是数字化的一个发展,并且已经在数字技术部门和垂直领域进行了应用尝试,预计未来将延伸至各个领域,如自动化的网络安全系统。2015年英国数字科技行业规模达1700亿英镑,比前5年增长了22%年,现在有1640万个数字技术工作岗位。


2.硬件趋势明朗

人工智能主要是通过GPU和深度学习算法来实现并行计算,当然,定制芯片也是一大方向。计算能力越来越强,算法越来越优化的趋势将进一步发展。


3.数据量呈指数增长

数据的快速增长也孕育了人工智能。自2000年以来,全球产生的数据量呈指数增长,大部分来自于互联网和移动个人设备。思科认为,2016年到2021年,数据量将增长7倍。有报告指出,2015年到2020年间数据将使英国受益241亿英镑。


4.企业环境与人才优势

英国被认为是世界上最具创新力的企业生态之一,具有多家大型企业和诸多活跃的小型企业,以及相关客户和研究专家。从全球的人才和投资竞争来看,英国AI商业活动具有优势。



英国AI创业、投资环境优势明显

2016年英国人工智能领域的投资占整体数字技术领域的3%,有226家处于早期发展阶段的独立企业。Coadec报告指出,在过去的36个月里,几乎每周都有AI创企都在英国建立。目前200多家创业公司和中小型企业聚焦于用AI解决特定领域的问题,特别是NHS/英国国民健康保险制度。此外,大型企业(Ocado、通用电气等)也在尝试AI优化服务和企业运营效率。


五大被美国科技企业收购的英国AI公司

值得警惕的是,现在有很多美国大型公司处于研发需求等考量收购了英国创企(SwiftkeyDeepMindRavn等),即便很多被收购的公司人才、资料依旧留在了英国,但毕竟是收购,未来可能会发生资本、技术转移,从而离开英国。因此,保住既有人才技术的同时吸引全球专业投资才能使英国发展成为AI行业的最佳环境。


英国AI公司举例

从地理上的集群效益来看,大部分的AI公司集中在伦敦;剑桥催生的AI创企比较多,包括EviVocal IQCytoraSwiftKeyDarktrace,因为研发紧密且能够获得本地资金支持,亚马逊和苹果等国际科技企业也在该地区;爱丁堡也在很重视数据分析和人工智能方面,诞生了SkyscannerCodeBase,亚马逊的机器学习研发中心也在那边;牛津自不必说,有深蓝实验室和DeepMind;布里斯托企业优势明显,有惠普、甲骨文、BAEFive AIGraphcore等。


英国AI企业、机构的地域性分布示意

对于公共部门而言,人工智能是一个非常有效的提高主流公共服务效率的工具(政府数字服务/GDS),可以用于税收、福利、签证、护照和其他政府执照方面,甚至与养老金监管机构合作,帮助商业部创新合作渠道(小企业研究计划/SBRI),建立完善的、更安全的、自动化的考察系统以解约申请花费及时间,建立更智能的、响应更快的政府体系。


总的来看,报告认为,人工智能将积极的,大规模的,在各个领域影响英国经济的未来。当然,不同领域和不同地区的发展速度会有所不同。根据埃森哲,人工智能将在2035年前渗透各个环节,为英国增加8140亿美元的额外收入,GVA的年增长率将从2.5%提高到3.9%。根据普华永道,人工智能将使得英国的GDP2030年上升10.3%,相当于2320亿英镑,包括生产力的提高(1.9%)和应用市场(8.4%),成为最大的商业机遇之一。

英国如何支持AI


英国第一年AI本科课程(目前及未来预计)

1、为工程和物理科学研究委员会提供研究资金。包括143项相关研究拨款,覆盖智能技术和系统,使AI成为可接受的、可用的、合乎道德的技术。

2、针对数据科学的研究,包括阿兰图灵研究所,以及剑桥大学、爱丁堡大学、牛津大学、伦敦大学、华威大学组成的EPSRC协会,总共投资4200万美元。

3、建立独立的、非盈利的、无党派的开放数据研究所(ODI)。

4、皇家统计学会联合来自商业、工业、政府和学术界的代表举行会议支持整个英国的数据科学社区。

5、Digital Catapult联合跨国公司、投资者、创业公司、政府部门支持数字研发的商业化。

6、科技行业代表机构TechUK联合IBM对人工智能在医疗保健领域的应用进行讨论。

7、电子系统和技术行业机构NMI、面向未来智能的莱弗休姆中心、全党派的人工智能议会小组、科技城英国(Tech City UK)等纷纷寻求人工智能生态方案,推进技术发展和产研转化,开拓全国范围的就业计划等。

四点建议


AI人才段位示意

报告指出,要发展人工智能,首先是增加数据访问渠道,包括开放更多的数据,提高机器的可靠性,设置敏感数据不进行公开(数据信托);此外,需要提高相关技能支持,使英国成为吸引国际AI人才的地方,重视计算机、数据科学和机器学习等,也均衡其他层次的人才配比。以下是报告提出的发展AI产业的四点建议:



一、关于增进数据访问的建议。

1.为方便持有数据的组织与希望使用数据开发人工智能的组织之间的数据共享,政府和行业应通过一个程序来开发和建立数据信任,即通过验证的、可信的框架和协议,来确保数据交换是安全的和互利互惠的。

2.为提高开发人工智能系统的数据可用性,政府应该保证一定数额的研究资金用于AI数据开发,同时确保以机器可读的格式发布底层数据,并提供明确的版权信息,且尽可能地对外开放 。

3.为支持文本和数据挖掘,并将其视为一种研究的标准和不可或缺的工具,英国应规定一种默认设置,即对于已发表的研究来说,读取数据也就是挖掘数据的权利,并且这不会产生替代原始作品的产品。在评估如何支持文本和数据挖掘时,政府应该将人工智能的潜在数据包括进来。


二、关于提高技能的建议

4.政府、企业和学术界必须充分认识到人工智能行业各类人才的价值和重要性,并应共同努力,打破成见,扩大参与。

5.企业应出资赞助大学AI硕士学位课程的开设,且预计首批学员规模达300名。

6.对于除计算机和数据科学专业之外的毕业生,学校应与用人单位以及学生本身,一起探讨人工智能专业毕业生的潜在需求。

7.政府应与全英知名大学共同打造至少200个人工智能博士学位。并且,随着英国教育的发展和吸引的越来越多的学术人才,这个数字还会持续增长。

8.高等院校应鼓励设立与发展AI MOOC、线上人工智能课程和持续的专业技能培训,为那些具有STEM资格的人提供更多的专业知识。

9.英国人工智能协会国际奖学金项目应与艾伦·图灵研究所合作创立图灵人工智能奖学金。这应由一个专门的基金来资助支持,以确定和吸引最优秀的人才,并确保英国向来自世界各地的有资历的专家开放。


三、如何最大程度的推动英国人工智能研究发展的建议

10.艾伦·图灵研究所应该成为人工智能和数据科学研究的国家性质的研究基地,并将其扩展到目前的五所大学之外,将其重点放在如何大力发展人工智能。

11.大学应该使用清晰的、可访问的以及可能的公共政策和实践来授权知识产权,并建立相应的公司。

12.艾伦·图灵研究所、工程与物理科学研究委员会(EPSRC)、科学技术设施委员会(STFC)和联合信息系统委员会(JISC)应建立协同合作,共同协调人工智能研究计算能力的需求,并因此为英国研究界进行相应的沟通协商。


四、关于支持人工智能应用落地的建议

13.英国政府应与企业和专家合作,建立一个英国人工智能委员会,帮助协调和发展英国的人工智能。

14.信息专员办公室和艾伦·图灵研究所应共同制定一个框架,来解释人工智能的流程、服务和决策,以提高透明度和问责制。

15.国际贸易部应扩大其目前对人工智能企业的支持计划。

16.英国经济如何成功利用人工智能技术来面对当下的机遇和挑战?TechUK应该与英国皇家工程院、Digital Catapult以及业界的关键人物合作,共同为其制定切实可行的指导方针。

17.借助政府数字服务的专业知识、数据科学的伙伴关系以及与其他部门的数据打交道的专家,政府应制定一项行动计划,为公共部门做好准备,并推广应用人工智能技术,用于改善公民运作和服务的最佳实践。

18.政府应确保产业战略挑战基金(ISCF)和小型企业研究计划(SBRI)所面临的挑战,旨在吸引和支持人工智能在整个挑战领域的应用,并为人工智能领域的公共部门数据提供资金支持。




金准数据认为,比之中美,英国的学院氛围更为明显,包括阿兰图灵研究所,以及剑桥大学、爱丁堡大学、牛津大学、伦敦大学学院、华威大学等为国家AI发展献力不少,大中小型企业也都很积极的进行AI尝试,产研转化模式成熟,资本和双创活动都很活跃。


中国人工智能正处于爆发期

中国人工智能产业起步虽然晚,在产业布局等方面还处于初期,但随着技术、资金、市场、人才等多方面因素全线发展,中国人工智能实力已经名列前茅。据iiMedia Research数据显示,中国人工智能产业规模2016年已突破100亿,以43.3%的增长率达到了100.60亿元,预计2017年增长率将提高至51.2%,产业规模达到152.10亿元,并于2019年增长至344.30亿元。


2016年,中国在人工智能领域共开展投融资284次,投融资总额达26亿美元,成为全球人工智能领域第二大“吸金”地。20171-7月我国人工智能行业共发生181起融资事件,其中7月份发生46起,为今年融资次数最多的一个月。从融资金额来看,20171-7月,达到亿元级的融资项目有37次,其中10亿元以上的项目有3次,最高金额达22亿元。


政策利好中国人工智能千亿级市场涌现

我国政府近几年也在持续关注人工智能发展,并针对人工智能制定了多项国家策略。20155月,国务院发布的《中国制造2025》中明确提出“加快发展智能制造装备和产品”。20157月,《国务院关于积极推进“互联网+”行动的指导意见》中将人工智能作为重点布局的11个领域之一。20163月,国务院国民经济和社会发展第十三个五年年规划纲要(草案)》 中指出将重点突破新兴领域人工智能技术等。 20165月,发改委、科技部等4部门联合印发《“互联网+”人工智能三年行动实施方案》,方案提出,到2018年,通过打造人工智能基础资源不创新平台,人工智能产业体系、创新服务体系、标准化体系基本建立,基础核心技术有所突破,总体技术和产业发展与国际同步,应用及系统级技术局部领先。在重点领域培育若干全球领先的人工智能骨干企业,逐步建成基础坚实、创新活跃、开放协作、绿色安全的人工智能产业生态,形成千亿级的人工智能市场应用规模。


人工智能企业和专利数量双增长

根据统计数据,中国人工智能相关专利申请数从2010年开始出现持续增长,于2014年达到19197项,并于2015年开始大幅增长,达到28022项,2016年,中国人工智能相关专利年申请数为29023项。艾媒咨询分析师认为,2010年移动互联网开始发展,技术和数据积累给人工智能研究带来了较大的增长动能。进入2015年,在国 内外人工智能研究和应用场景不断进步的基础上,中国人工智能相关研究开始进入高速发展阶段。这说明,中国人工智能研究水平正在处于不断提高的阶段,目前已取得一定阶段性成果,有望持续发展,预计2018年专利申请数将持续增长。



中国AI发展的四个驱动力:人才、数据、基础设施和计算能力。目前中国在人才、数据和基础设施等方面已经具备了全力发展AI的实力。


人才是AI发展的根本

相对来讲,AI是科技发展的一个新兴领域,对人才的需求将是未来一段时间内的首要问题。美国科技巨头在全球范围内开设实验室以招揽人才,而中国在这方面也不落下风。已有多家中国科技公司开设了海外研究院,如百度在硅谷建立了AI实验室,腾讯在西雅图建立了AI实验室,还在麻省理工学院举办了创业创新大赛的人工智能专场。


数据优势得天独厚

数据方面,中国有着得天独厚的优势。中国人口基数大,网民数量领先全球,这就带来了数据收集方面的优势。据报告,中国的互联网巨头都已建立了完整的在线生态系统,并越来越深入人们日常生活的方方面面,以此获得了海量的数据。目前,全球范围内的数字信息有13%是来自中国的,预测这一数字将在2020年增长至20%-25%

基础设施平台是AI发展的舞台


基础设施方面,中国的互联网巨头们都已搭建了完善的平台和生态系统,这是人才引进和数据收集的前提,也随着人才的争夺和数据的竞争而加速完善。如百度去年9月推出的的深度学习开源平台PaddlePaddle和今年推出的阿波罗计划,都是为人工智能的发展所搭建的平台。


芯片是唯一的短板

而计算能力是目前中国AI发展的制约因素。中国在芯片方面对国外厂商的依赖很严重,不过中国的半导体产业的发展正在加速。预计中国未来可能减弱甚至摆脱对国外厂商芯片的依赖。



总结:金准数据认为,比之英国AI的发展,我国的产研转化模式还不是很成熟,但是目前中国在人才、数据和基础设施等方面已经具备了全力发展AI的实力,发展前景广阔。




2017年中国互联网产业发展综述及未来发展趋势

前言:2017年,党的十九大报告多次提及互联网,互联网在经济社会发展中的重要地位更加凸显,中国互联网产业发展加速融合,网络强国建设迈出重大步伐,互联网建设管理运用不断完善,互联网、大数据、人工智能和实体经济从初步融合迈向深度融合的新阶段,转型升级的澎湃动力加速汇集,广大人民群众在共享互联网发展成果上拥有更多获得感,中国数字经济发展步入快车道。

报告梳理了中国互联网产业发展的三次浪潮,探究了其获得快速发展的原因及影响,对新营销、泛娱乐产业、新零售产业、本地生活服务、在线旅游、在线教育、新金融、云计算、人工智能等领域进行了回顾总结,并对互联网产业的未来予以展望。


有容量才能有作为每一轮上涨,都要帮助中国经济解决问题



技术是未来中国的国之重器

中概股的回归是中国完成跨代竞争的标志

技术的进步往往会使世界呈现出跨代发展的格局,工业革命以后,相对而言中国的发展落后于资本主义地区。然而信息技术革命又为世界带来了新的发展机遇,使落后国家弯道超车成为可能,很多第三世界国家的互联网产业直接跨过PC时代,从移动互联网起步。而未来中国资本市场也将容纳更多互联网和技术类上市公司。



功能性独立继续推升中国网站数量

在寡头垄断的市场,功能简单清晰也是创业者的策略之一

BAT等互联网巨头存在的情况下,综合服务平台这一定位将不再适合初创企业,选择BAT布局中的薄弱领域,以这一领域用户所需功能进行创业,成功概率有可能更高。



未来中国资本市场扩容压力较大

2020年,信息技术行业将有4万亿市值的上市压力

按照最后一轮投资结束后,2-3年就会产生上市压力的周期判断。20174300亿的风险投资,在2020年将迎来新的上市节点。按照常规投资总额占持股比重10%的常规来看,资本市场扩容压力在4万亿左右。



经济结构调整后的二次腾飞

实体经济支撑了中国的互联网技术产业



信息技术与商务服务会从其它中拆分

传统八大产业增加值未来复合增速较低



资本市场的火热源自于产业本身

网络经济远高于GDP的行业增速




网络产业复合增速数倍于传统产业

移动购物仍为移动互联网经济主体,未来移动广告增速最快

艾瑞统计预测,从2011-2019年移动互联网经济细分结构来看,移动购物在移动互联网经济中的占比经历了多年的高速增长后将出现回落,而移动广告和移动支付所占比例还将继续提升,此外,移动游戏的占比将伴随着移动游戏市场的不断成熟,趋于相对稳定的水平。


2016-2019年移动互联网经济细分市场的复合增长率来看,增长较快的是网络广告市场和移动支付市场,复合增长率均超过30%。预计未来三年移动广告市场规模和移动支付市场规模将出现大幅增长。





网络经济的强盛源自于用户

宏观层面的人口红利枯竭

2016年,网民和移动网民分别达到7.3亿人和7.0亿人,增速均放缓,其中,移动网民在网民中的占比已经达到95.1%。受人群上网技能和文化水平等多方面因素的限制,经历过多年快速增长后,网络普及过程中的人口红利已殆尽,网民和移动网民数量趋于稳定。受二胎政策的逐步放开影响,伴随着新一代的长成,未来网民及移动网民数量还将出现新波峰。






微观层面人口红利始终存在

创新促进产业发展,同业竞争过度滋生灰产





网基操作终端已产生认知共性

未来PC端将以工作为主平台,移动办公与娱乐需求并存

PC,手机Pad三大网基操作终端中,视频由于本身行业特质问题,使其所占有的用户实用时间普遍比较长。而搜索与电商几乎是现代白领在办公室的主要上网活动,在有PC的情况下,用户行为提高了电子商务使用时长。而手机端秉承了通讯工具的基础属性,又因为人类本身存在大量社交需求,这与手机终端的认知定位相温和,加之其便携的特点,提高了通讯聊天在手机端上的主导地位。而Pad的存在比较尴尬,相比而言,用户对Pad的认知更像游戏机,因此与休闲有关的产品所占时长最高。整体来看,PC的工作主平台作用在移动办公的驱使下,将会被弱化。


工作平台影响PC产业

移动办公彻底普及时,PC电商交易将不复存在



尚未破解的移动商业模式密码

应用分发的流量暴涨,反映出流量变现依旧是主流商业模式


中国互联网产业的三次浪潮

媒体属性的回归,流量变现中流量的概念将被扩大


01新营销

网络营销的新阶段

2017年网络营销关键词:智能与原生

2017年,中国网络广告规模预计近4000亿元,在中国广告市场中占比将超过50%。受网民人数增长,数字媒体使用时长增长、网络视听业务快速增长等因素推动,未来几年,报纸、杂志、电视广告将继续下滑,而网络广告市场还将保持较快速度增长。

网络广告在2017年的关键词为“智能化”与“原生化”。广告主对于网络广告的玩法更加熟悉,广告类型也随着原生广告的发展而不断进化,广告与内容之间的界限愈加模糊。随着网络环境的不断改善,视频成为了人们接受信息更习惯的内容形式,视频类广告也得到较快发展。同时,AI的快速迭代也将在网络营销领域快速得到落地,智能营销成为当前最火热的名词,也为行业注入新的机会点。


新晋者高歌猛进,细分领域风云变幻

信息流广告成主要增长点,蚕食传统展示类广告蛋糕

2017年中国网络广告各形式中,电商广告占比为29.8%,与去年基本持平,信息流广告占比超过14%,继续保持高速增长。搜索广告占比仍将持续下降,预计在2020年将保持在20%左右的份额。

未来更加原生的信息流广告也将具有更多的表现形式,规模仍将不断增长,从而成为未来网络广告增量市场最主要的一员。

family:宋体;mso-fareast-theme-font: minor-fareast;mso-hansi-font-family:Calibri;mso-hansi-theme-font:minor-latin'>的快速迭代也将在网络营销领域快速得到落地,智能营销成为当前最火热的名词,也为行业注入新的机会点。



原生的魅力:快速迭代的花样形态

以信息流为代表的新原生广告:5年内可见的两千亿市场

原生广告的发展随着媒体内容流的不断增多、媒体承载形态的不断丰富而持续扩张。以信息流广告为代表的新原生广告形态,其市场规模从2015年的188.2亿元增长至2016年的373.1亿元,预计在五年内可达2000亿元,复合增长率超过60%,成为原生广告发展的主要推动力。搜索广告虽在人工智能结合中在未来也将稳步增长,但增速将在五年内低于新形态的原生广告。但同时,在如此乐观的市场环境下,原生广告也在未来十年内将迎来相对瓶颈期。其瓶颈主要来自于媒体内容的承载能力(库存量)、用户在有限的注意力时间内对于原生广告的频率接受上限等。


信息流广告一枝独秀

营销SaaS和户外广告潜力巨大



流量固化加速,数字营销进入深水区

亟待挖掘新的流量增长点,并提升流量变现效率

从1997年英特尔在ChinaByte上投放的第一个互联网广告算起,中国数字营销已经走过二十个年头,二十年间,其获得了超高速增长,2017年市场规模突破3800亿,但随着互联网环境的变化,作为广告基石的流量,其固化现象越发明显,数字营销进入深水区,尤其体现在两个方面:1)流量增量放缓;2)流量存量向头部集中。基于此,艾瑞分析认为,数字营销未来发展要解决的核心问题是挖掘新的流量增长点,并提升流量变现效率。注意力时间内对于原生广告的频率接受上限等。



02泛娱乐产业


经济发展为文化娱乐发展提供契机

相比发达国家,中国文娱产业仍有较大发展空间

文化娱乐产业未来发展前景良好,但与发达经济体相比,中国的文化娱乐产业仍处于发展的早期阶段。2016年,中国文化娱乐产业GDP在总GDP中的占比为4.1%,而美国的占比为6.5%。随着中国的人均GDP于2016年超过8000美元,在互联网普及和IP版权意识不断提高的推动下,中国娱乐行业将实现爆发性的增长。

艾瑞分析认为,相比美国发展水平,中国文化娱乐产业仍有较大发展空间,随着经济实力增长,人民物质水平提升,未来中国文化娱乐产业将以高于美国的速度增长。



泛娱乐行业整体进入健康发展期

克服“低俗”、“盗版”等弊病,行业进入良性循环

互联网泛娱乐行业主要是指依托互联网载体,进行生产、传播娱乐内容的平台所处的整体行业,当前主要包括网络游戏、在线视频、网络文学、在线音乐、网络动漫(二次元)、在线直播和短视频形式。

随着互联网环境的进步和移动设备的兴起,网络承担的角色从通讯、办公逐渐向娱乐伸展,而网络娱乐资源的丰富度和传播的便利性,逐渐促使其成为用户娱乐的主流方式。


多内容形式互补,融合成为关键词

市场不断新生,为整体泛娱乐市场带来新的活力

2017年预计中国互联网泛娱乐行业市场规模达到4098.8亿,较上年增速高达41.8%。

过去在线上渠道,出现了许多变现效果良好的新兴行业如在线视频、直播、短视频、二次元市场等,为互联网娱乐市场不断扩充市场空间带来重要贡献,预计未来随着用户行为的持续转移,线上渠道将成为用户娱乐功能的主要承载体。艾瑞分析,未来互联网娱乐发展将由如下原因促进:1)线上娱乐更具灵活性,受时间空间影响较少;2)互联网的出现创造了更多新的娱乐形式,如直播、短视频、网络文学等,丰富了人们的娱乐体验;3)线上娱乐能够通过数据分析等手段提供更加个性化的娱乐内容,从而提升用户体验;4)相比内容和形式更为局限的线下娱乐,线上娱乐给用户更广阔的创作空间及更丰富的娱乐内容。



整体结构向“一超多强”发展

新兴娱乐类型促使用户从“内容消费”向“内容生产”转变

游戏作为互联网泛娱乐领域起步最早的形式之一,拥有强大的用户付费意愿,商业模式相对成熟,在经过前两年游戏用户的快速积累后,逐渐进入存量市场,未来增速减缓但依然为泛娱乐行业中市场规模占比最高的细分行业;在线视频在经过多年布局后,成为互联网用户基础最大的网络服务之一,近年来各视频平台逐渐从媒体角色向内容提供方角色跨进,在广告收入基础上促进用户付费意愿的提高,在高粘性高频率的用户基础上,未来仍有较大发展空间,成为泛娱乐行业中第二大细分行业;此外,伴随硬件成熟,直播和短视频行业迎来新的生机,并大大激发了用户的内容生产热情,促使整体互联网进入“全民内容时代”,未来随着商业化探索逐渐成熟,将有较大的发展空间。



泛娱乐行业普遍“马太效应”显著优质内容的稀缺性使得资本成为博弈的关键


以IP为核心,各行业间边界模糊

与粉丝经济结合成为内容持续运营的关键

经过长期的发展,泛娱乐行业各细分行业间的边界逐渐模糊,行业间的合作与渗透不断加深,生态链逐渐发展成熟。在此趋势下,明星IP和内容IP都成为泛娱乐生态下的核心资源,价值不断凸显。IP可以将文学、影视等不同的内容形式串联起来,满足粉丝的多元化需求,帮助产业打通整个泛娱乐生态链。围绕顶级IP开发一系列商业模式成为主流;结合粉丝经济进行IP的持续运营,帮助整个产业持续性产生价值。




03新零售产业

线上零售平稳增长

2017年中国网络零售市场规模超6万亿元,同比增长29.6%

2017年是中国线上线下融合的实践年,在消费升级以及数据驱动的大背景下,中国网络零售市场活力重现。2017年中国网络零售市场规模突破6万亿元,在社会消费品零售总额中占比达到16.4%,同比增长29.6%,多年以来增速首次回升。艾瑞分析认为,线上线下融合的新业态模式不仅是对实体零售的赋能,也是对线上零售结构的重新调整,更多精准高质量的流量导入使网络零售焕发出新的活力。从垂直领域发展来看,生鲜、跨境、母婴依然是高速增长的热门品类。



“无人”业态引领零售创新浪潮

科技、数据赋能,助力全产业链升级

当前中国无人零售行业主要呈现五大特点:以降低人工成本作为无人零售的主要切入点,在重视消费体验,拓展零售场景的同时通过多种技术手段实现大数据的收集、分析与应用,并最终实现消费流程的全面数据化以及整个产业链的智能化升级提效。艾瑞分析认为,零售产业链的全面数据化是无人零售背后的战略核心,包括客流数据、商品数据、消费数据、金融数据等的全面融合与应用。

艾瑞咨询最新统计数据,2017年无人零售市场(含贩卖机)交易规模保守估计将接近200亿元,预计2020年将突破650亿,三年复合增长率在50%左右。




消费升级,需求端倒逼上游供应链重塑

品质电商发展迅速,品质、性价比、消费体验并重

随着居民可支配收入持续增长,消费升级趋势日益显现:以高品质、高性价比、重体验为发展方向。传统电商中商品质量良莠不齐的问题突出,对用户而言信息甄别成本极高;在此背景下,品质电商应运而生并迅速发展:一方面,通过传递“优选”、“甄选”的品牌形象获得持续增长的消费受众,迎合消费升级的趋势;另一方面,通过需求端逆向传导重塑上游供应链,品控和成本控制同步提升,在更好满足用户消费需求的同时,为传统制造业转型升级提供内在驱动。




线上线下融合催生新型业态以生鲜品类为代表的零售新物种涌现

随着零售业线上线下融合,生鲜品类因其独特属性成为渠道融合模式创新的“试验田”。就品类特征而言,生鲜作为高频刚需品,保质期短易变质,储藏条件要求高,且多为非标品;就行业特征而言,生鲜行业毛利虽然较高,但受制于国内冷链物流发展滞后,生鲜仓储及运输成本高、可控性差,加之生鲜电商起步较晚,定价偏高,线上渠道优势不甚明显;而就消费需求层面而言,生鲜品类消费升级潜力巨大:根据国外经验数据,当人均GDP达到9000美元时,生鲜市场总体需求呈现明显增长;世界银行数据显示,2016年我国人均GDP达到8123美元。据此,艾瑞分析认为,未来三年国内生鲜品类零售(含线上线下)将进入高速增长期。就国内生鲜零售发展现状而言,伴随线上线下融合的发展趋势,以生鲜零售新物种为代表的“门店+餐饮+配送”新型业态将迎来快速发展期。




04本地生活服务

万亿市场极速爆发

本地生活服务行业的互联网进程快速推进

近年来,我国互联网本地生活服务市场快速发展,市场规模迅速攀升,越来越多的消费者逐渐习惯通过互联网来满足自己的日常需求。数据显示,2017年中国互联网本地生活服务行业整体市场规模达11457.4亿元,同比增速高达49.6%。艾瑞分析认为,主要归因于以下几点:首先,智能设备与移动支付的普及为本地生活的互联网化提供了必要的发展环境;其次,O2O对用户生活服务场景的覆盖不断提升,满足了消费者多元化、碎片化的消费需求;此外,众多现象级产品的出现以及大规模补贴的投入培养了用户习惯,用户使用频率不断上升。本地生活服务市场空间广阔,然而互联网渗透仅为12.7%,存在巨大潜力空间。



细分领域体量差别大

高频刚需市场发展速度更快

本地生活服务囊括了居民日常生活的众多消费场景:餐饮、商超、电影、休闲娱乐、美业等等。各细分领域由于发展阶段、消费者规模各不相同,市场份额呈阶梯状分布。餐饮、电影等细分领域由于其高频刚需的特征,用户培育与市场拓展难度相对较小,发展更加成熟。从细分市场构成来看,餐饮在互联网本地生活服务领域中占比最大,2017年占比高达62.2%。婚庆、商超宅配、家政维修等细分领域市场份额连年升高,占领越来越重要的地位。



餐饮O2O规模增势迅猛

是推动互联网生活服务行业高速发展的重要引擎

数据显示,2017年中国餐饮O2O市场规模为7128.2亿元,同比增速高达70.9%,延续了近几年爆发式的增长态势,是推动互联网生活服务行业高速发展的重要引擎。餐饮O2O规模的高速增长一方面得益于近几年懒人经济及补贴刺激下外卖市场的火爆,另一方面,随着移动支付对用户生活场景覆盖度的不断提升,到店餐饮O2O市场规模也在迅速上升。



05在线旅游


流量运营进入提质阶段

产业链下沉渗透是重要解决方案

2017年中国整体网民规模增长率将会进一步降低,以高额数量增长的互联网人口作为红利来进行迅速扩张的在线旅游企业们面临着流量消退的困局。面对这种局面,各家的应对方式各有其特点。透过这些解决方案,延长产业链,扩大产品提供品类,进行场景式营销,提高单客户消费金额是改变流量困局的关键。




行业风口迅速成长

度假成为发展亮点,但机遇和困难并存

2009年以来,中国在线度假市场交易规模占在线旅游市场交易规模的比重持续上升,且其增长率持续超过在线旅游市场交易规模增长率,原因主要有以下两点:第一,随着中国的消费升级,旅游消费者在旅游形式上不再只满足于景区观光,而是产生了更高的需求,如旅游体验和休闲度假等,因此度假交易规模在很长一段时间以来以高于整个在线旅游行业的增长率保持增长;第二,随着在线旅游市场的进一步扩张,行业内竞争激烈,传统的机票酒店预订产品毛利率逐渐下滑,以OTA为首的在线旅游企业急需寻找新的利润增长点,而度假产品以其高毛利率性及多样性吸引了在线旅游企业的关注。但目前,机票酒店规模仍高于度假规模,在线度假市场未来如何进一步成长仍需行业共同探索。




新的高潜领域出现

目的地服务准备起跑

目的地服务的崛起一方面代表着OTA等在线旅游企业对高毛利率产品及服务的追求;一方面代表着旅游消费者的消费意识发生改变,对旅游产品及服务的质量等要求提高。在目的地服务兴起的背后,主要有三种影响因素:一是旅游领域移动互联网化程度的提高,消费者在行程途中通过移动设备及移动互联网进行预订、查询、消费,使得OTA等在线旅游企业急需在旅游目的地铺展服务,通过高质量服务提高自身的客户留存率;二是旅游方式的个性化,消费升级的大环境使得传统的目的地服务难以满足消费者越来越多的个性化需求;三是P2P服务的发展,个人与个人的资源共享及资源交换弥补了大企业在目的地服务领域中的不足,促使目的地服务的升级和健康发展。



06在线教育

中国在线教育市场规模

行业逐渐步入初步成熟期,市场进一步回归教育本质

艾瑞咨询数据显示,2017年中国在线教育市场规模达2002.6亿元,同比增长27.9%。未来几年,中国在线教育的市场规模同比增长幅度持续降低但增长势头保持稳健,预计在2022年其市场规模将达5433.5亿元。用户对在线教育的接受度不断提升、付费意识的觉醒以及线上学习丰富度的完善等是在线教育市场规模持续增长的主要原因。

艾瑞分析认为,中国在线教育经过前两年的野蛮生长和市场检验,部分重要赛道的商业模式已经成熟,现阶段资本市场开始回归理性,而创业者也变得更加谨慎,市场整体开始步入初步成熟期。在这个阶段,市场对教学教研能力更高、技术研发能力更强和运营服务水平更好的企业更具包容性,同时企业需要不断提升用户学习的有效性、服务的完整性和学习体验以提升用户的忠诚度,进而提升企业的盈利能力。




中国在线教育细分市场结构

中小学在线教育市场份额逐年提升,职业在线教育的市场份额在波动中有所提升

艾瑞咨询数据显示,中小学在线教育、高等学历在线教育及职业在线教育将一直是在线教育的市场主体,占整个在线教育市场规模的95.0%以上。艾瑞分析认为,虽然中小学课外培训是一个刚需市场,但是该阶段的学习存在着不可逆性和市场成本高的特点,因此在市场初期阶的占比相对较低。用户不断被市场培养及教育,线上学习的场景属性和体验不断提升,用户对线上教育的接受度不断提升,因此该赛道的市场份额占比不断提升。而职业在线教育的学习内容与工作的相关度比较高,且有效的弥补企业与学校之间、用户与所在岗位之间的需求不匹配,因此用户的付费意识高,付费意愿强,其盈利模式较为成熟,因此在市场中的份额总体较为稳定。



中国在线教育用户规模

2017年中国在线教育用户规模突破1亿,未来将持续增长

艾瑞咨询数据显示,2017年中国在线教育的用户达到10979.9万人,预计未来几年在线教育用户规模将持续攀升。

艾瑞分析认为,中国在线教育的用户规模不断增长主要原因如下:1、在线教育学习平台越发成熟,名师、“大V”等均可通过各类平台在线教学或传递知识,实现教育资源优质共享,吸引更多用户;2、在线教育对学校和辅导机构的服务进一步延伸渗透,传统教育企业不断拓展或转型线上业务,用户覆盖区域不断触达三四线及以下城市,用户转化率不断提升;3、工具及技术支持不断进化,解决了不同的用户需求,吸引更多的用户;4、移动端入口不断普及,用户触达在线教育的门槛降低。



2017年在线教育关键词:变现

两年狂奔之后逐渐回归商业本质,直播成变现法门


用户为效果付费是核心商业逻辑

在线教育的颠覆梦想正式破灭,注重教学和服务才是正道

不管在线教育的梦想多么美好,人类大脑接受教育的过程始终没有改变:教育的效果仍须借由完整的教学体系来实现,即1)需要优质内容,2)需要“教、学、练、测、评”等一系列教学过程,3)需要教学之后的服务和管理,以此克服人类学习进步的惰性。在多数情况下,用户没有能力将碎片化的教育资源整合到一个有效的体系中,也就无法通过单一环节的教育工具或服务预期到自己未来的学习效果,也就无法轻易做出购买决策。只有在少数情况下——用户的自学动力和能力较强(如成人用户准备求职考试),或者学习内容的复杂度不高(如学习一门语言),此时用户有能力将学习资源整合到自己已经建立的知识储备中,学习效果可以由用户主观决定,用户才愿意付费。

2017年,业内机构逐渐意识到“为效果付费”是在线教育的核心商业逻辑,直播赛道的火热也造就了在线教育变现元年。虽然理顺了逻辑,但在线教育的用户体验仍十分粗糙,教育效果仍存在很大的不确定性。注重教学和服务,解决体验粗糙和效果模糊将是各机构下一步的攻克重点。




07新金融


这的确是最好的时代

十年酝酿,中国金融才真正开始线上化

信贷是金融的核心,自2007年P2P登陆中国开始,国内的信贷就开始了漫长的线上化进程。但是碍于体制和理念的原因,中国的信贷线上化,始终停留在“电商”层面,以一种网络兜售信贷的方式试水线上信贷。这种初级又低效的方式持续了很久,然而对传统金融机构的促进却极其有限。导致2007-2017这十年间,中国的线上信贷始终停留在网络信贷的层面,互联网金融无论是非功过,至少都在探索信贷线上化的种种可能。2017年,现金贷的兴起是中国金融孕育出的“怪胎”,

它既保留了传统金融的运作方法和理念,又融入了许多网络金融的技术元素,更为重要的是,现金贷在网络平台出现之后,经过历次改版升级后的电子银行产品也悄无声息的融入了现金贷的功能。至此,更加深入的信贷线上化,才算正式拉开帷幕,金融业真正进入了互联网人常说的“最好的时代”。

信贷业务的全流程存在四个重要的节点,这四个节点有任何一个节点涉及线上,从更加宏观的视角审视,都应该涵盖在中国整体信贷线上化的蓝图中。


逐渐垄断化的互联网金融品牌吸引流量,流量带来垄断


融合的开始

优质资产的供给是互联网金融存在的意义

经历了利用模式和“花样”吸引用户的阶段后,互联网信贷的核心关注点,开始回归金融本源。单纯的互联网金融对运营和利润要求都非常高,所以互联网金融要么选择依托某一种已经具备的线上优势展开金融业务,要么选择将线下业务的某一个环节互联网化,以此达到品牌价值的提升。

从艾瑞的角度看,之所以我们称目前为互联网金融最好的时代,就是看到了互联网金融和传统金融不再互相“敌对”。开始真正从业务上思考合作可能的未来图景。


互联网信贷进入品牌时代

未来互联网环境将生成更多资产,平台背书将更加重要

尽管增速放缓,但即便未来保持平均每年40%左右的信贷余额增速,在互联网各行业中也属于高速成长的行业。因此,未来互联网环境将继续承担“资产工厂”的角色,高速高效的生成新资产。而在这一过程中,坐拥资金的金融机构如何进行筛选将变成核心课题。在没有合作风控,或者资本关系的前提下,平台的品牌积淀将成为资金端选择优质资产的重要考量指标。艾瑞认为,以下三点将成为评价互联网信贷机构品牌实力的指标:第一:成立时间,越长越好。第二,平台转化率,高于同业机构,越高越好。第三,复购率,复购率指用户再次借贷行为。在没有深入合作的基础上,考量以上三个指标,能最大限度的帮助企业鉴别资产质量。




混合信贷的春天

现金贷成为互联网于传统金融的纽带

2017年,P2P借贷余额依旧占据最大比重。因为现金贷的出现使网络小贷这一品类占比下降的速度大幅延缓。在花呗、白条等互联网产品的壮大下,电商消费金融在网贷行业中的地位进一步提升。而且,在趣店等当初明确打出消费分期的企业上市并宣布转型电商之后,网络分期这一品类有可能失去分类价值,在运营模式上与电商消费金融极其类似,统计上有可能合并。在未来银行牌照没有因为监管而独揽大权之前,互联网银行可能会收到压制,但其丰富的想象空间,让我们依然看好。



线上信贷内涵扩大

科技元素在信贷四个环节中的渗透,模糊线上线下的边界

在“线上获客,大数据风控,IT系统构建及贷后管理”四个领域中,不同程度引入金融科技元素后的泛线上信贷领域,2017年交易规模超过10万亿,到2020年复合增长率高达57.36%。如此高增速的背后并非网络信贷单方面的努力,而是传统信贷与金融科技融合达到的效果。换句话说,在互金与传统金融机构的双重推动下,金融科技开始向传统信贷渗透,使得大量传统信贷的交易规模,被纳入到互联网金融的版图中。这也是,线上信贷内涵扩大的主要原因。



信贷线上化的倒计时

成本支出连年攀升,意味着全社会刚刚开始构建基础设施

因为时间的原因,银行线下网点的成本支出的总规模始终比较固定,每年保持3%左右的增幅,这个数字未来的变化非常不固定,因为一方面线上金融产品的发迹,使得线下网点的作用有所降低;而另一方面线下网点的互联网改造又可能带来投入的提升。这两个互相冲突的元素作用力的大小取决于未来银行内部角力的结果,如果互联网部门说服领导,那么相应的投入就会更多。

反观网络信贷这一端,成本支出连年提高,而且未来增速依然会保持较高水平。这是互联网信贷终于产生影响力的标志,意味着社会逐步注重线上基础设施的投入。不过这也给全中国的信贷线上化进程加上了时间限制,如果未来线上信贷的规模增速低于成本支出的增速,那么线上信贷就极有可能胎死腹中。



互联网的流量特质尚未扭转

短期难以成熟的风控和万变不离其宗的获客

按照“获客、风控、系统、贷后”四个结构拆分,中国泛线上信贷成本支出的结构如下。2013年甚至于更早的时候,线上信贷几乎不存在,所以那个时候绝大部分的投入,都集中在从零开始搭建的系统上。但是随着时间的推移以及技术能力超强的延展性,使得系统开支逐渐向系统升级方向转变。投入占比相应减小。取而代之的是更加核心的风控,和互联网基础属性——流入层面的投入。




商业本质的内生危机

“背靠大树”依然是网络信贷最经济的发展方式

在中国整体金融业务开展方式下,传统金融机构依托网点的经营成本,只占全部个人信贷和中小微企业信贷总规模的1%多一点。而线上信贷开展过程中,投入的成本却占到了线上信贷总规模的4.5%左右。所以传统银行信贷3%左右的利差,足以覆盖这1%的成本。因此逻辑上,传统金融的商业本质是成功的,可维系的。但如果互联网金融的内涵与金融无异,亦或者是金融科技想服务于金融,在行业视角上看,其至少需要5%的利差,才能将商业本质跑通。这在长期看来,几乎是不可能的。

因此现在中国市场上,发展较好的网络信贷平台均采用“背靠大树”的方式发展。但本文所述的“大树”并非资本集团,而是在“获客、风控、系统、贷后”四个方面某一方面或某几方面存在的固有优势。这些公司基于这些优势,搭建起来自己的金融帝国,而这种方式追溯到金融本质,就是通过消除网贷某一环节的投入成本,拉低自己利差的基本要求,进而扩大业务规模。




争夺的分立

多样化的资产处理方式,加速传统金融互联网进程


自余额宝之后,网络理财行业发展比较缓慢,主要问题在于模式上的创新难以突破想象力的天花板。并且随着传统金融也对优质资产的渴求,网络金融生态面临“外来”势力的侵蚀。部分互联网金融平台,为求低价连续的现金流,选择将资产向外输出。从宏观大环境上看,这有利于提高我国金融行业的活性,促进线上线下融合。但从网络金融的视角看,一旦全行业完全依赖于传统金融机构的资金供给,有可能进一步抑制网络理财行业的创新能力。


普惠性正在减弱的网络理财

当网络资产逐渐普及之后,金融中介将重新掌握主动权

2017年,中国网络资产规模接近3.5万亿,相比于信贷市场的火爆,网络资管增速有所下滑。部分原因在于,中国互联网金融在理财这一端的普惠性正在跟着网络资产的普遍性而逐渐减弱。普通用户享受网络资产带来的财富增值效应,其渠道在过去两年内均没有大幅度拓宽。虽然网络理财并不完全局限于网络资产,但是在网络资产相对处于弱势的情况下,网络理财的资金补充,是支持整个互联网金融最大的资金源。但是当网络资产逐步普及后,资本的嗜血性和监管要求的双重作用下,大多有能力生成网络资产的机构,均采取了某种金融中介的形式。所以在网络理财这一端,过去一年创新并不明显,导致增速下滑。



国家在有意保护“现金流”

行业结构相对稳定,缺乏创新的古老市场

非常值得一提的是网络股权投资的前景,因为股权众筹在中国遇阻,所以传统互联网金融的发展模式均受到了限制。所谓的“去中介化”在中国金融稳定的大前提下,显得势单力薄。在中国,居民的可投资资产十分珍贵,是维系经济运营,维系传统金融体制正常运转的核心资源。无论是资本市场,还是其它投资市场,居民可投资资产都是保证市场流动性的根源。所以,从国家意志的层面,维持金融稳定,与保护“现金流”不分流有着千丝万缕的联系。未来能够打破现在市场格局的事件依然是创新。



竞争带来的资产争抢

“以贷带存”的发展模式,使得网络资产两极分化

中国现存的市场来看,在传统金融机构擅长的领域,相对已经被充分开发,四大行和其它商业银行的竞争格局比较稳定,很难发生大规模的信贷源转移。而银行间为了生存的竞争压力,无形中向互联网金融传导。对于网络商业生态来说,是一片亟待开发的“净土”,当然陌生的信贷环境势必会考验银行的风险承受能力,但是竞争压力迫使银行不得不直面这种压力,最终达到一种市场均衡。这种奇妙的均衡,让本来需要网络理财作为行业闭环的资金提供方,产生了两极分化。一部分优质资产通过传统金融渠道流入社会,剩下的资产在网络上自行消化。在基金和保险等传统理财产品线上化进程遭遇瓶颈的当下,网络理财生态逐渐形成了,好资产与坏资产的区分。理论上这对于各家互联网金融平台的影响并不大,但是对网络理财生态来说是一种侵蚀,优质资产向传统金融渠道的流出,会限制网络理财行业自身的创新力。




内部的变革

支付公司角色变成“银行”,支付行业内部职能重构

中国第三方支付行业内,移动支付发展势头依旧迅猛。但是伴随着移动支付向线下的拓展,支付牌照所涵盖的七大业务中,各种业务的定位也随即开始改变。

随着政策的变动,聚合支付公司开始向企业服务平台转变,其“雇佣军”角色愈加明显。而银行卡收单与移动支付的连接更加紧密,也给几乎“濒死”的业务带来一线曙光。除非未来支付宝与财付通一家独大,或二者合并,否则短期内移动支付的发展,将受到传统银行卡收单优势企业的制约。


技术脉冲式的促进作用

人口和资本红利殆尽的支付行业,受到技术推动继续增长

用户、资本和技术,是推动互联网产业发展的三个重要动力。其对行业促进的方式也各不相同,用户推动行业爆发式增长,资本推动从业者增多,这两种元素对行业的推动都遵循边际递减效应,随着时间的推移,这二者的促进将逐渐降低。而技术对行业的促进方式则有所不同,由于无法预估下一轮技术的爆发点,所以技术对行业的促进是“脉冲式”的,某一时刻的促进会将行业增速提高,而后自然衰退。而下一次技术推动会产生和上一轮相似的数据表现。因此行业到了以技术为推动的阶段时,增速的变化相对比较跳跃,目前中国第三方支付行业就处在这样一个历史背景中。



贵族的更替

不同支付业务商业职能的变化,促进更多内部合作

移动支付的线下扩张,极大的改变了过去支付行业的商业业态,也几乎颠覆了全社会的支付习惯。过去银行卡收单对支付行业交易规模的贡献始终最高,占比大于50%。而2015年之后,随着社交支付的兴起,银行卡的使用频率骤降,这对银行卡收单行业中的传统业务产生了巨大打击,相当于釜底抽薪。但是也随之为古老的银行卡收单业务带来了新的活力,智能POS和丰富的线下布局,使得他们天生的成为移动支付线下扩张中的良好助力。



贵族的更替

不同支付业务商业职能的变化,促进更多内部合作

在整条线下支付的商业版图中,银行卡收单是在移动互联网新趋势下,发挥独特历史作用的“古老贵族”。近年来,互联网商业领袖及互联网巨头的战略,都不约而同的集中在线下实体经济。但实际上线下商业环境非常复杂,擅长轻资产运营的互联网公司,在进军线下的过程中并没有想象中那么顺利。比如:线下团队管理、绩效、监督、营销和服务等,每一项都和线上有区别。而互联网公司的不足,却是银行卡收单机构的优势,这也造就了中国移动支付线下支付独特的图景,移动支付公司通过两条渠道完成业务,一条是利用自身资源,联合聚合支付公司帮助商户直接转化;另一条是与银行卡收单机构合作。而当银行卡收单机构的智能POS协助完成了移动支付业务后,这笔业务产生的交易规模既计入移动支付,又计入银行卡收单。



互联网金融的终级命题

模式创新是企业生存的根本,但改变世界还是遵循大数原则

2016年,监管机构对互联网金融政策趋严,理论上这对互联网金融全行业不会产生负面影响,因为至今为止,并没有任何一家优质互金平台因为监管趋严而倒闭。业界对中国监管机制的担忧源于两个方面:一方面,中国本身比较“红”,而金融本身又是现代全球国家间竞争的主要战场;另一方面,和传统金融相比,互金在各类业务运营模式上均比较新,所以任何关于合规方面的政策变动,都会让业内非常关注和紧张。而这种“惊弓之鸟”式的发展环境,给互金带来了一种重要变化。

互联网的商业本质是流量转化,而互金行业的模式创新,有最大的可能使企业行为转化为社会事件,进而吸引一大批用户。之后的用户经营,就是改变社会认知的过程,所以说模式创新是互金行业生存的根本,但是遵循大数原则的社会认知改变,才是企业品牌价值逐渐积累的过程。互金行业中一系列宏观环境的变化,使得互金行业进入了“拼品牌”的时代,不同机构间,同样的业务同时推向市场,品牌优势最大的机构所形成的流量转化最大。支付在这个品牌时代中所起的作用最大,原因在于支付是金融业务中,用户需求频率最高的,而用户日常使用最多,无形之中就积累了自身对这个品牌的忠诚度,“熟悉”是这个时代以至未来,互联网金融的终极命题。



08云计算

云计算与人工智能、大数据相辅相成

云服务、大数据、人工智能已经俨然成为行业内“前沿科技”的代名词;而三者之间也密不可分,呈现出相辅相成的发展关系。其中,云计算与大数据的联系最为紧密:在产生海量数据的信息社会中,云计算与大数据共同为数据的存储、提取、处理、利用贡献力量。除此之外,在人工智能、生命科学、物联网等前沿科技中,其数据量之庞大都必须依赖于云计算、云存储等底层云服务。可以说,云服务业已成为各类前沿科技中不可或缺的基础性服务。




云服务的层级将日益模糊

IaaS、PaaS、SaaS界限日渐模糊,跨层融合成为趋势

当前,云计算在企业中的应用越来越广泛,单一的服务模式已经不能满足企业的需要,IaaS、PaaS和SaaS三者间的界限逐渐变得模糊。部分PaaS层服务具有刚需性质,企业希望能够获得包含基础资源、数据库、中间件等在内的完整环境,驱使PaaS和IaaS层相互渗透;为缓解SaaS产品标准化和企业个性化需求间的矛盾,云服务商将PaaS与SaaS层有机结合,提供一体化、一站式的解决方案。IaaS、PaaS、SaaS融合,可以通过跨层服务的方式为企业带来更全面的增值服务和更良好的操作体验,有利于云服务市场的良性快速发展。




数据的价值将不断彰显

云服务的商业模式将围绕数据探索更多可能性

云服务厂商“接管”了企业业务之后,实际上吸聚了海量的数据;而这些数据的价值也越来越受到各级云服务厂商的重视,正推动着不少厂商从提供工具服务(或基础性服务)到提供数据服务的转变。这种转变对SaaS厂商来说显得尤为显著。首先,这里的数据服务不只是停留在财务报表、数据统计与分析之类的静态层面,而是要基于客户的业务数据为其决策提供支持,为客户创造更多价值。更进一步,当厂商拥有足够多的客户、积累到足够大的数据量时(也即拥有了真正的行业大数据能力时),可以挖掘出更多数据服务的可能性,例如精准营销、授信、金融服务等等。可以说,对数据的重视与利用,一方面给整个SaaS行业带来了商业模式的变革,即基于软件自身的数据价值延展出更多增值服务能力,另一方面也是行业发展思路上的转型。在保证用户信息安全的前提下,SaaS厂商合理地利用数据、挖掘数据的潜在价值,不仅能为客户自身带来收益,而且推动了整个行业的进步。




09人工智能

人工智能VS人类智能

机智过人还是技不如人?

经过海量数据训练,人工智能可在边界清晰的领域内游刃有余,只是与可在开放环境下对变化中的事物不断学习进而适应的人类智能相比,机器在面对超过固定规则设置的罕见场景时,往往不知所措,鲁棒性有待提高。不过,在面对超大规模数据且对实时性有所要求的超复杂性问题,机器能力往往远胜人类,日常生活、社会运营的诸多场景均有丰富的可供智能技术升级改造的空间。




人工智能产业链

人工智能技术逐步向各行业场景渗透


嵌入式感知系统加速产业智能升级

前端智能的渗透率将逐步提升,与后端协同智能计算


伴随AI专用芯片及嵌入式感知系统的成熟研发,前端设备即可完成相对基础的视觉、语音识别及对话交互,并将识别、分类的结果实时应用,实现前端智能。对于需要大量计算、存储资源,利用多维度数据关联分析的诸多场景,后端服务器计算依然是当前主流。前端智能的渗透率将逐步提升,与后端智能协同加速产业升级,不仅可满足特定场景对实时性、隐私性的要求,还可在前端成像(千万像素、千帧/秒)提供越来越多数据信息的背景下,让前端智能选择预处理过的结构化的高

质量数据及分析结果传输至后端,减少因带宽压力过大导致的丢包、压缩所引起的信息丢失或误差,提升智能分析的准确性。前端智能系统的功耗、稳定性、存储空间、数据及系统更新的网络传输等诸多重要问题仍有待解决,现阶段主要通过压缩算法模型、挖掘硬件潜力以及在压缩模型的同时针对现有芯片进行优化来解决功耗有限、运算能力低的问题。



技术供应商将继续完善商业服务链条

对于更为广泛的传统行业或线下使用场景的潜在客户,人工智能的技术落地往往涉及对具体业务场景的硬件设备改造、软件集成以及本地计算设施的部署,算法、技术的实际功效更需要建立在对客户真实业务场景的深层理解之上的针对性开发。不断增长的市场需求要求更加全面、及时的售前、售中、售后服务,而在对智能技术能够达到的有效帮助缺乏足够认知或部分暂时缺乏科学完善的评测标准或技术相对同化的业务场景,市场销售的重要性尤为凸显。既要注重前沿算法研发,又要注意现阶段商业落地与市场拓展,这些都为以高新技术人才为主的人工智能公司提出了更为综合的挑战。



垄断与新流量

免费的高频业务都是优质流量,中国进入技术型人口红利时代

中国互联网产业尤其独特的一面,注重商业本质是中国众多不同特质的互联网公司共同具备的特点,因此未来突破性的技术创新尚难以在产业内发生。因此,过去导致中国互联网企业走向成功的战略,极大可能在未来以不同的形式复制。回顾产业发展历程,免费+增值服务的商业策略是中国商业环境制胜的法宝,先垄断了客户流量的企业,也形成了围绕用户衣食住行多方面的垄断。未来寻找技术型流量蓝海是众多企业的新突破口,同时强化自身“高频”业务,也是强化企业品牌认知的有效手段。




整合与同质化

新互联网平台将有机会整合老互联网平台

在一些市场集中度不高的行业中,多数机构的业务同质化非常严重,这在未来可能催生出以整合同质化平台为目的的新平台。这些平台以统一账户为手段,整合用户数据为目的,最终形成对老互联网产业的颠覆,这从一个侧面反映了,互联网产业中,数据孤岛的严重性,若无行政手段强制整合,未来很多改变中国的新技术,推行难度将加大。




探索与不可能

可能改变中国未来的十大黑科技



结语:2017年中国互联网产业呈现五大发展态势:一是提网速,广连接。骨干网络优化提速明显,固定宽带普及目标提前完成;网络提速降费成效显著,移动网络体系建设加快推进;物联网络部署大幕拉开,专有网络连接更加广泛;智能硬件丰富信息交互,推进传统产业转型升级;资源连接范围持续扩大,产业互联互通步伐加快。二是深融合,强制造。产业互联网全面深度融合,服务实体经济创新发展;“中国制造2025”全面实施,制造强国建设迈上新台阶;工业互联网全力纵深推进,产业生态体系显现雏形;“互联网 农业”迸发巨大能量,技术助推产业链升级;“双创”平台持续普及推广,成为融合发展新动能。三是兴业态,惠民生。智能技术助力业态焕新,打造科技时尚新生活;新型消费优化产业布局,构筑个性化、智能化应用场景;无人零售领域百花竞放,服务布局向线下聚拢;分享经济加速优胜劣汰,强势企业瞄准AI领域;在线娱乐行业加速升温,产品丰富但问题不容小觑;创新领域覆盖更广更深,网络惠民触手可及。四是谋创新,拓市场。应用创新向技术创新挺进,商业化应用竞争加剧;多级平台同步孵化产品,“内容为王、创意为先”优势凸显;互联网平台走向生态化,产业链依存关系持续增强;企业“进军”农村市场,县域经济蓬勃发展;推广中国本土优势经验,“出海”足迹延伸更广。五是重安全,共治理。系列法律法规加速实施落地,为网络安全保驾护航;网络安全保障能力持续提升,安全产业向服务主导转型;有效防范打击通讯信息诈骗,全力保障社会民生;不良信息治理力度持续加大,网络空间更加清朗;命运共同体理念深入人心,互联网全球治理体系深度变革。


金准数据认为,2018年中国互联网产业发展趋势有六个方面值得关注:一是新技术,下一代网络建设带动5G产业崛起,工业互联网促进制造业集成创新,大数据、人工智能将加速推进产业深度融合,技术创新推动金融信用体系趋于完善。二是新动能,产业互联网推动新旧动能加速转换,“互联网 先进制造业”成为振兴实体经济的重要途径,制造业与互联网融合的行业解决方案将继续突破,智能制造的网络安全保障将成为关键一环,农业全产业链