蓝海商信 - 蓝海硅谷-金地毯

前言

人工智能是一个跨领域学科，旨在创造出智能机器。我们相信，AI将会成为促进数字化、数据社会的强大催化剂。这是因为，如今我们周围的一切，从文化到消费产品，无一不是智能的产物。

1.研究与技术突破

1.1迁移学习

我们通过学习示例来训练机器学习模型解决任务。但是，为解决一个新的任务，需要使用专门的新数据重新进行训练。迁移学习可以让经过训练获得的知识应用于新任务中。

迁移学习：从Image Net训练模型预测目标，检测皮肤癌

迁移学习能够对人类患者的危险皮肤病变进行自动、最先进的检测。

GoogleInceptionV3网络首先在Image Net上接受训练，再使用129,450张临床图像进行重新训练以检测2,032种不同的皮肤病。它可以学习仅基于像素输入和疾病标签对图像进行分类。结果显示，该模型优于21名斯坦福皮肤科专家。

1.2AI硬件新前沿

半导体在促进AI发展中的角色。

半导体（或芯片）是AI研究和应用进步的关键驱动因素，这是因为AI模型经常需要训练大量数据来学习特定任务（如图像识别）。

GPU成为AI模型训练的得力助手，很大部分原因是其能提供比CPU更强大的并行计算能力。这意味着更快的训练速度和迭代。

硬件之战：更多GPU会让训练速度更快，构建规模更大、功能更强大的模型。

AI硬件对深度学习意义重大。AI模型性能随着数据规模和模型参数提高，计算量提高。

毫无疑问，GPU越来越受到开发者的欢迎。

然而，GPU更擅长处理图像任务，并进一步扩展到高性能的计算和AI任务。

训练时虽然广泛使用GPU，但它却并不擅长推理。虽然大多数情况下，GPU性能优于CPU，但数据中心大量的CPU使其成为一个有用且广泛使用的平台。例如，在Facebook，GPU基本上被用于线下训练，而不是实时用户数据处理。

处理器内核时钟频率没有变得更快，摩尔定律产生的能量有限。

GPU和新型硅片的租金价格太高，意味着计算资源会受限于资金预算。

虽然谷歌的TPUv2价格更贵，但是模型训练速度更快，更加经济。

在GoogleI/O2018上，谷歌发布了第三代TPU。

在2018年5月的GTC上，英伟达发布了HGX-2，可同时用于高精度要求的科学计算和低精度要求的AI负载任务。

很多企业在开发定制AI芯片，包括IC（集成电路）供应商英特尔、高通、英伟达等，科技巨头和HPC（高性能计算）供应商谷歌、亚马逊AWS、三星等，IP供应商ARM、新思科技等，中国创业公司寒武纪、地平线机器人等，以及全球的创业公司Cerebras、Wave Computing等。

大型云服务商在制造专用AI硬件，并大幅提高预算支出。

传统计算机视觉通过检测物体来描述视觉场景。AI模型进行物体像素关联（语义分割）或识别展示物体（分类）然而，检测出图像中的物体还不足以理解真实场景。AI模型在进行基于目标理解描述视觉场景任务时犯了明显的错误。真正的视觉场景理解需要理解动作和常识，使用深度学习和标记目标动作的视频来学习常识是一种可行的方法。

1.3大规模视频理解数据

创建训练机器学习模型理解视频的数据集。创建描述感兴趣的动作的视频，例如假装扔下一些东西。如果深度学习模型能够识别和消除视频中行为中的细微差别，那么它具备了关于世界的常识。这也被称为“直观物理学”（intuitive physics）。

1.4文本语义理解

深度学习模型实际上可以理解视频中的动词和名词。

机器还可以通过学习从不同视角理解视觉场景。如果机器学习模型可以正确地预测同一场景的另一全新视角，它就获得了这个场景的内化知识。

1.5目标导向的强化学习：以游戏为例

Alpha Zero表明深度强化学习可以通过学习击败世界围棋冠军。

Alpha Zero是一个无人类干预或历史玩家数据输入，通过自我对弈即可预测从一特定棋盘位置走棋输赢概率的AI系统。让人震惊的是，Alpha Zero系统超越所有其他版本的Alpha Go（基于两套神经网络），经过40天的训练即超越人类最高水平。

Open AI的多代理强化学习系统学习复杂的实时战略游戏《魔兽争霸2》。

Open AI Five是由5个RL代理组成的团队，通过强化学习自我对弈优化游戏策略每个代理的神经网络经过强化学习训练都可观察局部和高维环境来生成长期动作规划。这些强化学习代理可以组团打败人类玩家，它们采取的多样化行动和大范围地图互动十分引人关注。

1.6怎样保证模型训练无偏见？

机器学习偏见例1:刻板印象

土耳其语中性别是中立的，但是谷歌翻译会在英语-土耳其语转换时产生性别区别，反之亦然。

例2:种族歧视

当训练数据中未合理标识皮肤颜色时，计算机视觉系统会做出冒犯性的种族偏见的行为，比如一些人脸识别系统无法识别黑皮肤的人。

受训练数据影响，机器学习会产生5种分配偏倚。典型的偏见来源于训练数据没有合理地代表多样性或被标记有偏见的标签。

1.7调参的可解释性

与所有软件一样，ML模型也需要调参，但是却很难解释原理。许多ML，尤其是DL模型，很多完全就是“黑盒子”。

可解释性可以证明机器学习的推理是“正确”的。

在计算机视觉中，模型可以解释一个具体的标签是由哪个像素推导而出（例如，哪个像素是狗）。这样，我们就可以知道模型到底是真的正确学习了还是因为某些错误的原因偶然得出了正确的预测标签。

下一步：用简单易懂的语言解释决策的合理性

结合文本生成基本原理和注意力视觉化可以深入解释决策原理。

对于特定问题和图像，Pointing和ustification Explanation(PJ-X)模型预测答案和多模态的解释都指向决策的视觉证据并提供文本。多模式解释可以生成更好的视觉和文本解释。

1.8对抗攻击

对抗攻击意味着现实世界中将存在严重的安全风险

受到对抗攻击之后，原来可以检测到穿越斑马线行人的计算机视觉系统就再也“看”不到他们了。

当自动驾驶车辆上路之后，这显然会造成巨大的安全隐患。

1.9谷歌Auto ML自动学习

谷歌的Auto ML自动学习系统可以找到计算机视觉任务的最佳模型。Auto ML遍历架构搜索空间，找到两个可以集成到一个优于所有现有人造模型的最终模型（NASNet，右图）的新单元设计（正常和缩小，左图）。

Federated learning分散数据获取和模型训练

谷歌使用Federated learning训练其移动键盘预测模型Gboard。

2.全球人才供需分布

人才供给：Element AI预计全球有22000名AI研究者和工程师拥有博士学位。

全球仅有3000名可用的AI人才劳动力；亚洲市场紧追西方市场；中国同业互查公开发表数量超过美国。

Element AI预计全球有5000名高级AI研究者。

美国是全球AI人才的温床，岗位空缺10k，是人才交流最集中的地方。

人才分布：众所周知，谷歌是最大的AI人才雇主。

2017年ICML6.3%的论文的作者来自谷歌/Deep Mind。

今年ICML论文作者来自谷歌/Deep Mind的论文数量相比2017年翻了一倍。

2017ICML谷歌贡献的论文最多。

在NIPS大会，谷歌&Deep Mind论文作者数量占主导。

需求：机器学习工程师薪水持续上涨。据金准人工智能专家了解，刚出校门的博士生或有若干年工作经验但教育水平低于博士的AI专家年薪可以达到30万-50万美元，或通过持有公司股票可能得到更高的薪水。

在Deep Mind，员工规模扩大到400名，成本达到1.38亿美元，每名员工成本约为34万5000美元。OpenAI2016年为研究负责人Ilya Sutskever支付了190万美元的薪酬，为Ian Good fellow支付的薪酬超过80万美元。金准人工智能专家估计，AI行业薪资水平较2014年翻了一倍。

3.行业：知识产权集中在巨头

关于AI的知识产权，毫无疑问聚集在几大巨头公司：GAFAMBAT（谷歌、苹果、Facebook、亚马逊、微软、百度、阿里巴巴、腾讯），它们每年的研发费用达数十亿美元。

尤其是云服务巨头，正在通过API建起各自的城墙。比如谷歌通过其云生态投入大量资金宣传ML服务，亚马逊、谷歌等公司也在做着同样的事情。

在实际应用行业当中，人工智能发挥了什么作用？最近一部爆口碑的电影《我不是药神》，天价药物的存在，寻找仿制进口药，无疑反映了医药行业发展进程慢且药品价格昂贵。

谷歌Tensor Flow在机器学习框架之战中胜出，但是战局变化迅速。

这意味着谷歌赢得了开发者的拥护，借此打造了一条云服务通道，让一代开发者和研究人员使用他们的技术并不断改进。他们的开放战略也解决了一些潜在的竞争对手。然而，实践者却感觉到这一领域潜藏巨大的不确定性。选择错误的框架会产生严重的后果，不仅包括重构成本。

3.1医药行业

目前，医药行业的发展进程慢且价格昂贵。在医疗行业，机器学习可用于开发新药，或者改变现有药物的用途。例如苏格兰初创公司Exscientia，目前已跟葛兰素史克公司达成合作；用机器学习进行药物研发的公司insitro等。在保健行业，机器学习可用于医疗成像、液体活检等。金准人工智能专家预计相关公司产品通过临床试验和监管检测之后将会采取更多行动。

3.2政府和国防

另一个重要行业是政府与国防（Government and defense）。比如中国政府继续推广使用计算机视觉监控软件。2017年末，中国共有1.7亿台闭路监控器。此监控网络将在3年内将增长至4亿台。成立4年的商汤科技遥遥领先，2018年5月获得C轮融资后估值超过了45亿美元。

谷歌则因与五角大楼合作军事项目Project Maven遭到抗议，其中谷歌4500多名员工联合签署公开信要求谷歌停止该协议。

受剑桥分析公司丑闻事件影响，个人数据隐私问题成为焦点，数据保护和匿名成为人们关心的话题。其中欧盟的GDPR已于2018年5月生效，以保护用户数据隐私。在数据保护和信息匿名方面，机器学习可以作用于：人工数据合成和混淆敏感数据。

3.3卫星数据

随着微型卫星的发展，部件成本和发射成本降低，向地传输架构逐渐完善，卫星数据的成本随之降低，分辨率和频率不断提高。在卫星数据领域，机器学习可用于保险、金融和农业。

3.4网络安全

云计算、移动设备和更多联网供应链意味着网络攻击的风险在增加。但是，网络安全从业人员的缺口却越来越大。机器学习能够以灵活的方式从过去的攻击中学习，并自动进行处理，节约时间。在网络安全领域，机器学习可用于网络和终端安全、内部威胁检测。

3.5库房自动化

电商的发展对库房分拣提出了更高的要求，劳动力和库房空间的稀缺也促使电商采用更多的机器人。零售商在亚马逊收购kiva以及对该领域的投资之后做出了反应。在库房自动化领域，机器学习应用包括机器人、库房管理系统等。

3.6蓝领手工操作

计算机视觉部件成本降低，技术提高，这意味着机器人的价格将会比各种蓝领工人的手工操作成本更低。机器学习可用于房屋建造、清洁、安保等。

3.7农业：室内和室外农场

2050年，全球人口将从76亿增长值96亿，粮食产量需要提高70%才能满足需求。农场和温室里配备机器人、控制系统、联网设备成为解决粮食问题的新途径。机器学习可用于温室控制系统、立体农场、农作物和动物健康监测、农作物收割等。

3.8自动化

在自动化领域，机器学习可用于共享自动驾驶车辆、最后一公里物流自动化、仿真环境、街道地图和软件开发自动化等。

3.9金融

在金融领域，机器学习可用于资产管理、信用贷款、预防诈骗。企业自动化机器学习可用于机器人处理自动化、文件数字化、软件开发自动化。

3.10材料科学

在材料科学领域，机器学习与医药行业的应用相似，可用于学习材料科学发现的规律。

4. 公众对自动化的态度调研

根据两家美国大型调研机构调查结果显示：民众越来越意识到自动化对工作的影响，18%的美国人表示他们知道有人因为自动化失业，薪资或工作时长减少。

年轻人、兼职、西班牙人和美国低收入人群反映受到影响最大。自动化将引起不公正的担忧越来越大。

布鲁克林研究所调查显示:

对AI的乐观程度

大部分人认为AI会改善生活

但AI也会牺牲隐私

并且AI会消灭一些工作岗位

大部分人认为AI是对人类的威胁

应该由政府监管

虽然美国目前仍然是AI领头羊

在公众对自动化态度调研这一部分，金准人工智能专家的调研结果显示：虽然美国目前仍然是AI领头羊，但认为中国在AI领域将在十年内赶超美国。

那么，美国劳动力市场实际上有什么变化呢？金准人工智能智能专家调查发现，这些变化主要体现在以下几个方面：

① 美国自动化程度虽然提高，但失业率却达17年来最低

② 常规工作发展停滞

③ 工资水平提高落后于工作岗位增长

④ 劳动产量与每小时报酬不成正比

⑤ 劳动力所得份额稳步下降

⑥ 工人收入变动幅度加大

自动化在导致美国劳动力市场现状中起到多大的作用不得而知，关于机器学习对劳动力市场的影响也出现了两极分化的观点：

其中一种观点认为无需担心，历史上科技进步总会创造更多的工作，这次也不例外；另一种观点则是忧心忡忡，认为这次革命与以往不同，人类将会创造更多智能，减少薪酬较高的工作，新增的工作岗位数量将少于消失的工作。

总结与展望

金准人工智能专家预测，在未来一年：位于中国的实验室取得重大研究突破。DeepMind成功应用RL学习在《星际争霸》游戏中取得突破性成果；深度学习继续仍然是讨论的焦点，重大替代方法不会出现；使用机器学习发现的第一种治疗药物在试验中产生积极的结果；总部位于中国和美国的公司收购欧洲机器学习公司的总额超过50亿美元；经合组织国家政府阻止总部位于美国或中国的技术公司收购一家领先的机器学习公司（估值>1亿美元）；争抢台湾和韩国半导体公司明显成为中美贸易战的一部分；一家大型研究机构因地缘政治原因未公开重大研究成果，因而“走向黑暗”。

金准人工智能 AI全景报告