• 项目
首页>>文章列表
文章列表

进博会里的中国当代艺术

首届中国国际进口博览会(以下简称进博会)于11月5日至10日在上海举办,进博会以“新时代,共享未来”为主题,是世界上第一个以进口为主题的国家级展会。进博会的举办地——国家会展中心(上海),总建筑面积达147万平方米,是目前世界上最大的会展综合体。进博会期间,如何在这个最大的会展综合体里进行艺术陈设,向世界展现中国艺术,讲好中国故事,显然不是件易事。


艺术陈设的三大特色


本次进博会中的艺术陈设,包含三大特色:


首先,最大的特点就是紧扣“主动开放”的关键词,对当代艺术作品大胆启用。空间共陈设的一百多件艺术品,是从数千件作品中精挑细选而来。


其次,艺术家的选择除了近代大师外,还邀请了对艺术史产生重要影响、来自世界各地的优秀华人艺术家,各艺术流派的创始人、推动者,当代艺术的生力军和有引领性的青年艺术家,共同参与会议空间的艺术品创作,以多维立体的角度展现华人艺术家的最高创作水平。艺术类型繁多,包含古瓷、古字画、木雕、漆画、刺绣、当代水墨、书法、油画、雕塑、陶瓷等多个艺术门类,宛如一部高度浓缩的中国当代艺术谱系展。


第三,进博会会场的陈设与美术馆有着本质的差别,会场作为一个具备外交功能的展示空间,艺术品起到的是锦上添花的提升作用,不能让艺术品抢占空间的视线及有碍空间的主要功能。作品既要代表中国艺术的高水平,又要考虑外交尺度,因此作品的主题内容、作品尺度、画面形象、表现方式、色彩配置、装裱方式都受到一定限制;作品的选用面临着更多层筛选,既要符合会议的精神,又要符合国家外交空间的礼仪规制,能构建严肃又有活力的氛围,最重要的是作品画面在空间里要“隐”的同时,还要对主题精神有足够“显”的文化力量。


进博会分为主会场和平行论坛两大区域,主会场又分为中方贵宾区、外方贵宾区、中外共享区三个部分。中方贵宾厅以呈现中国传统哲学思想为主,外方贵宾厅以体现全球视野和创新精神为要,中外共享区则中西合璧,艺术品主要选择抽象艺术及山水艺术,以海派精神体现中华民族的文化传统和主动开放的姿态。


主会场开门迎客,因此设置了3幅巨制——巨幅国画《春风又绿江南岸》、木雕屏风《锦绣中华》、刺绣《玉兰飘香》,向各国宾客展现中华锦绣山河。迎宾厅主背景巨幅国画《春风又绿江南岸》由陈琪、江宏、车鹏飞、汪家芳四位上海画家创作完成。这是目前全国最大的青绿山水作品。作品以江南春景为主题,采用传统平远构图,以大视野描绘出江南水乡的绿水青山、薄雾朝霞、桃红柳绿、水榭亭廊、渔船钓叟。这也是作者对江南文化底蕴、新时代春风、改革开放四十年来中国社会盎然生机进行的诗意表达。美轮美奂的全景式山水木雕巨作屏风《锦绣中华》则是由中国工艺美术大师陆光正带领百人技师团队,耗时3个月完成。这是目前国内最大单幅东阳木雕屏风作品。该作品以全景式构图、多样木雕技法,表达了中国传统审美,赞美祖国、讴歌时代,展示了气壮山河的国家形象。精美绝伦的苏绣屏风作品《玉兰飘香》由国家级非遗项目(苏绣)代表传承人姚建萍带领团队完成。500朵姿态各异、生机勃勃的玉兰花向世界传递出中国传统文化的精彩魅力和开放胸怀。


艺术创陈的四个思路


一、天地古今,命运共同。


中方贵宾区艺术品创作和陈设思路体现的是中国视野与格局:传统文化中的宇宙天地观,纵通古今、横贯东西的人文发展观,全球视野下的人类命运共同体全局观。赵无极的作品蕴含一种东方精神的凝聚,是对“道”的观照。吴为山的《孔子问道》与王中的《道法自然》,生动呈现了古代中国两大思想流派的特征,追古问今。肖谷的《青山瑞华》是青山绿水的现实观照,唐云的《牡丹》是国色天香,吴昌硕的《白玉兰》是上海市花。艺术陈设从传统到创新,从抽象到具象,从天地到国家再到上海,融会贯通。


二、水墨上海,书写未来。


在设计外方贵宾区时,我们倾向于艺术品语言更加国际化,艺术手法相对创新,娓娓道来中国故事,讲好上海的历史和现在,展现了创新精神,呈现在新的历史时刻中国主动开放的姿态与决心。创作元素多以水墨和书法为主,描绘上海的都市风景,集中体现了典型性的人文艺术层面的中国元素。本区域主要陈设了王秋童、董小明、俞晓夫、许江、樊枫、赵峥嵘等艺术家的作品。


水墨是中国传统绘画材料,当代水墨是中国文化融汇开放的观念在艺术中的具体体现。本区域选择与上海城市发展和城市文化相关的不同个人风格的作品,旨在呈现中国文化基因中开放、包容、接纳、融合的发展观。当代水墨经过几十年主动变革的发展,如今已是全球当代艺术重要的组成部分,是把“民族的”转化为“世界的”成功案例。书法则是最具中国特色的艺术门类,与整个民族文化血脉相连。在全球化时刻,书法也做出了应对时代的变革。谷文达以书写作为基本元素进行着具有很强话题性的当代实践艺术,他为进博会创作的作品《汇流·通达》,取意开放的上海,各方流域汇流长江和东海,同时象征汇流世界的商业博览。该区域还陈设了王冬龄、徐冰、汤国、崔宪基、魏立刚、范勃等艺术家的作品。


三、抽象山水,包容开放。


中外共享区域是迎宾开幕前后中外贵宾双方会见、交流的地方,重在交流对话。在这里,艺术品需体现中西合璧的理念,体现交流对话的模式。因此,该区域的艺术品陈设,力求体现海派文化开放、包容、转化的品格及能力。


“山水精神”是中国绘画的核心精神,山水已内化成文人艺术家的处世态度和精神追求。仁者乐山,智者乐水,而仁和智,是理想人格的象征。山水共生,两者互为映照与依托,相辅相成,是合作共赢的象征。本区域主要陈设了黄宾虹、丁雄泉、刘国松、王劼音、童雁汝南等艺术家的作品。而抽象艺术代表外来艺术语言的影响,一组抽象作品营造出赤橙黄绿青蓝紫阳光普照、共享时代的勃勃生机。本区域陈设了朱德群、赵无极、邱世华、周长江、申凡等艺术家的作品。


四、梅兰竹菊,风格鲜明。


平行论坛作为共商协作的重要功能区,以梅、兰、竹、菊划分为四个区域,同时作为创作元素,梅的高洁坚强,兰的淡雅脱俗,竹的正直坚韧、虚怀若谷,菊的孤标亮节,强烈的文化赋予超越了其物象本身,体现的是具有深厚历史人文的大国礼仪及外交态度。“大道不孤,德必有邻”,我国外交坚持民族气节与风骨的同时,秉承“亲、诚、惠、容”的共处原则,以开放包容、亲仁善邻的姿态处理国际关系。该区域主要陈设了徐世扬、陈家泠、韩天衡、闵学林、潘公凯等艺术家的艺术作品。


代表中国百年的视觉艺术成果荟萃首届进博会,充分体现了大国的文化自信。不同文化之间对话交流,最后需要归结到共建人类命运共同体视野下的当代世界价值观,这也是构建人类命运共同体的精神支撑。

高通详解骁龙855:整体性能提升45%,AI性能提升三倍

美国时间12月5日,高通在夏威夷年度技术峰会上对昨日发布的旗舰级移动平台骁龙855进行了详解。


骁龙855是全球首款全面支持数千兆比特5G连接、人工智能和沉浸式扩展现实的商用移动平台,它采用全新的芯片架构基于7纳米制程工艺打造,将为用户带来持久的电池续航以及影像、音频、游戏和XR等方面的体验。


高通高级副总裁兼移动业务总经理Alex Katouzian表示:“随着运营商即将在2019年早些时候部署5G网络,消费者将最先在搭载骁龙855的移动终端上享受到5G用户体验。”



骁龙855采用了最先进的基于ARM Cortex技术打造的Kryo 485 CPU(三丛集架构:1+3+4),与前代旗舰平台相比能够带来最高达45%的性能提升。


不仅如此,骁龙855集成全新的Adreno 640 GPU,能够带来高达20%的图形渲染速度提升(与Adreno 630对比)。同时还能继续保持业界领先水平的每瓦特能效。Adreno图形所支持的Vulkan 1.1、高动态范围(HDR)和基于物理渲染(PBR)将带来全新水平的逼真游戏体验。


AI方面,骁龙855搭载第四代多核人工智能引擎AI Engine,可以实现每秒超过7万亿次运算(7TOPs),AI性能较前代旗舰移动平台相比提升3倍。


全新的高通Hexagon 690处理器包含一个全新设计的Hexagon张量加速器(Hexagon Tensor Accelerator,HTA)和四个Hexagon向量扩展内核(Hexagon Vector eXtensions,HVX),这是前代旗舰产品向量处理的两倍,并且还增加了四线程标量内核,综合实现了专有的、可编程的AI加速。


第四代人工智能引擎AI Engine软件套件可以为高通神经处理器SDK、Google Android NN-API以及Hexagon NN和高通Math Library带来一系列的提升。


高通的软件生态系统合作伙伴正在不断拓展,目前新增的合作伙伴包括思必驰、AnyVision、科大讯飞、大象声科、Nalbi等。



影像表现上,全新的高通Spectra 380 ISP集成了大量硬件加速的计算机视觉(CV)能力,让这款全球首个推出的CV-ISP能够支持最尖端的计算摄影和视频拍摄功能,同时功耗降低高达4倍。该CV-ISP包括基于硬件的深度感测,支持在4K HDR@60fps的状态下实时进行视频拍摄、对象分类和对象分割。


也就是说用户可以拍摄一段视频并且精准地对选定的对象或背景进行实时替换,而这一切操作都可以在能够表现超过10亿色的4K HRD分辨率下实现。


连接方面,利用骁龙X50 5G调制解调器,骁龙855移动平台可以实现5G网络支持。同时通过集成的骁龙X24 LTE调制解调器支持最佳的数千兆比特4G连接。借助骁龙X50,该平台能够同时支持6GHz以下和毫米波频段,带来快速的响应和前所未有的速度。


在娱乐方面,骁龙855为消费者提供了一个全新升级的娱乐平台,支持更逼真的游戏、增强的观影体验,以及更高性能的XR体验。



游戏方面骁龙855是首款支持全新Snapdragon Elite Gaming体验的平台。该体验包括true HDR(超过10亿色)电影级分级调色、电影级色调映射、要求颇高的基于物理渲染(PBR),以及对Vulkan 1.1图形库的支持。


通过利用旨在降低90%以上掉帧的定制算法,即便是要求极致的游戏,在骁龙855上也能流畅运行。此外,借助全新aptX Adaptive音频编解码器以及对TrueWireless Stereo Plus的支持,其音频体验也得以提升。


当看电影时,增强的影院级体验将首次在移动终端上实现对HDR10+播放的商用支持。借助新增的硬件加速H.265和VP9解码所带来的高能效,用户还可以通过一次充电观看更长时间的电影。


此外,骁龙855是首款支持高通3D声波传感器的移动平台,它是全球首个支持屏下超声波指纹识别的商用解决方案,也是唯一一个能够穿透不同类型污渍准确识别指纹的移动解决方案,同时具备更高的安全性和准确性。


高通表示,骁龙855移动平台现已向客户出样,搭载该平台的商用终端预计将在2019年上半年开始出货。


以下是骁龙855移动平台的细节特性:


连接


骁龙X24 LTE调制解调器,支持LTE Category 20;

骁龙X50 5G调制解调器(面向5G终端);

Qualcomm WiFi 6-ready移动平台:支持802.11ax-ready、802.11ac Wave 2和802.11a/b/g/n。

Qualcomm 60 GHz WiFi移动平台:支持802.11ay和802.11ad;

蓝牙版本:5.0;

蓝牙传输速度:2 Mbps;

双频GNSS支持高精确的定位。

Qualcomm Spectra 380 ISP


双14位计算机视觉ISP(CV-ISP);2200万像素@30fps的并行双摄像头;4800万像素@30fps的单摄像头;

硬件计算机视觉功能,包括对象侦测与追踪(梯度方向直方图、Harris角点检测、归一化互相关、线性分类与光流),以及立体景深处理;

HDR解决方案,包括增强的zzHDR、三重曝光四色滤波阵列(QCFA)HDR;

支持人像模式(背景虚化)的4K 60 HDR视频拍摄(HRD10、HDR10+和HLG),10位色深,Rec 2020色域;

针对抓拍的硬件多帧降噪(MFNR),针对视频的动态补偿时域滤波(MCTF);

摄像头子系统中的硬件稳像解决方案;

全新模块ISP设计,支持图像管线输出更高的灵活性,包括RAW和YUV像素域;

高帧率的慢动作视频拍摄(720p @480fps);

HEIF照片拍摄和HEVC(H.265)视频拍摄。

音频


Qualcomm Aqstic音频技术;

Qualcomm aptX,包括classic aptX、aptX HD和aptX adaptive;

Qualcomm TrueWireless Stereo Plus。

Qualcomm Adreno 640视觉子系统


Adreno 640 GPU;

支持Vulkan 1.1 API;

HDR游戏;

基于物理渲染;

API:支持OpenGL ES 3.2、OpenCL 2.0 FP和Vulkan 1.1;

最高终端侧显示屏:支持高达4K HDR显示屏;

最高外接显示屏:最多支持两个4K HDR显示屏;

硬件加速H.265和VP9解码;

HDR播放编码器支持HDR10+、HDR10、HLG和Dolby Vision;

Volumetric VR视频播放;

8K 360 VR视频播放。

Qualcomm Kryo 485 CPU


一颗超级内核,主频高达2.84GHz;

三颗性能内核,主频高达2.42GHz;

四颗效率内核,主频高达1.80GHz;

64位架构。

制程


7纳米制程工艺。

Qualcomm Hexagon 690处理器


安全处理能力;

四线程标量内核;

四个Qualcomm Hexagon向量扩展内核;

Qualcomm Hexagon张量加速器;

Qualcomm Hexagon语音助理;

Qualcomm All-Ways Aware技术。

安全


Qualcomm生物识别认证套件:指纹、Qualcomm虹膜认证、语音、面部、支持移动支付的Qualcomm安全处理单元;

Qualcomm 3D声波传感器。

Qualcomm Quick Charge 4+ 技术


内存


内存速度:2133MHz;

内存类型:4x16位,LPDDR4x。

创梦天地正式登陆香港联交所,开盘价6.6港元

12月6日,创梦天地(01119.HK)正式在香港联交所挂牌上市,售价开盘价6.6港元,募集资金净额为7.45亿港元。


创梦天地CEO陈湘宇在香港联交所致辞时表示,在香港联交所挂牌上市,是创梦天地发展史上的又一个重要里程碑。


“香港上市,对于创梦天地来说是一个新的起点。创业这八年,我始终念念不忘菲尔·奈特的一句话:“懦夫从不启程,弱者躺于路中。”


创梦天地的招股书显示,2018年上半年,创梦天地实现营收10.74亿元,比上年同期增长43.5%,经调整利润为1.51亿元,同比增长51.58%。


其中,主业游戏的营收同比大幅增长49.29%,达到9.52亿元。根据第三方机构伽马数据的统计显示,同期中国移动手游市场同比增长仅12.90%。


创梦天地成立于2011年,旗下乐逗游戏推出过《地铁跑酷》、《神庙逃亡2》、《纪念碑谷》、《圣斗士星矢-集结》、《梦幻花园》等知名手游,截至2018年9月30日平均月活跃用户达1.295亿。


2014年8月,创梦天地科技有限公司(iDreamSkyTechnology)正式登陆美国纳斯达克,交易代码为“DSKY”。


2016年9月,创梦天地科技有限公司(NSDAQ:DSKY)宣布完成私有化交割,从纳斯达克退市。根据2015年12月31日签署的合并协议,私有化购买团已以普通股每股3.5美元(相当于美国存托股每股14美元)的价格,收购发行在外的股份。


2018年11月,创梦天地宣布将于 2018年11月26日起在香港公开发售,并计划于2018年12在联交所主板挂牌交易。


招股书显示,创梦天地CEO陈湘宇持股21.25%,其第一大机构股东腾讯持有创梦天地20.65%的股份。


此外,索尼集团以500万美元成为其基石投资者。这是索尼集团第一次投资中国游戏公司,也是第一次参与港股IPO。创梦天地另一基石投资者是京东,它通过位于英属维京群岛的投资公司Windcreek Limited投资了500万美元。


除了索尼、京东两大基石,创梦天地的明星股东还包括王思聪的普思资本,持有3.38%,澳门赌王何鸿燊妻子梁安琪的Vigo Global则参与了创梦天地的Pre IPO,持股1.11%。林建岳的香港丽新发展也在Pre IPO中持有0.97%。


以下是创梦天地CEO陈湘宇演讲全文:


我是创梦天地的陈湘宇,首先,热烈地欢迎各位与我们一起来见证创梦天地的上市仪式。


在香港联交所挂牌上市,是创梦天地发展史上的又一个重要里程碑。我们的股票代码是1119,因为11月19日是我们公司的创立日期,希望这个代码可以让创梦天地的所有同仁不忘初心、纵情向前。本次成功上市,首先要感谢创梦天地600多位现任员工、还有那些曾经的创梦人,以及他们的家属,是你们的付出和支持,铸造了创梦天地的成就。


要感谢创梦天地的几亿用户,感谢你们选择创梦的产品和服务。我们用科技和创意给你们创造快乐,你们也给我们创造了无限的价值。


还感谢过去的、现在的创梦股东,以及即将成为创梦的股东,感谢你们的信任,相信我们有能力推动业务的持续增长,创造长期的投资价值。


更要感谢我们的合作伙伴,有你们的支持和帮助,我们才能打造出一个个精品,得以快速的成长。


最后,我们诚挚地感谢香港联交所和香港监管部门对创梦天地上市旅程的支持与帮助。


感谢参与本次上市工作的所有中介团队,感谢这么多年来支持创梦天地的媒体朋友们,感谢这一路上所有支持和帮助过我们的朋友。


香港上市,对于创梦天地来说是一个新的起点。创业这八年,我始终念念不忘菲尔.奈特的一句话:懦夫从不启程,弱者躺于路中,


只剩我们前行,一步都不能停 The cowards never started and the weak died along the way- that leaves us.


让我们一起继续努力!

遭做空机构狙击后陌陌交出三季度财报,净营收同比增长51%

12月6日,近期刚被做空的陌陌公布了截至2018年9月30日的第三季度(Q3)未经审计财报。


财报显示,2018年第三季度,陌陌净营收达36.48亿元(约5.36亿美元),同比增长51%。不按照美国通用会计准则计量,2018年三季度归属于陌陌的净利润为7.78亿(约1.143亿美元)元,同比增长22%。


根据彭博社汇总数据,华尔街15位分析师平均预计,陌陌2018年第三季度营收为5.33亿美元,华尔街7位分析师平均预计,陌陌2018年第三季度(Non-Gaap)每股摊薄净利润为0.43美元。财报显示,陌陌2018年三季度营收为5.36亿美元,(Non-Gaap)每股摊薄净利润为0.53美元,超出华尔街日期。


三季度归属于陌陌的净利润为5.8亿元(约8520万美元),上一年同期为5.27亿元(约7910万美元)。不按照美国通用会计准则计量,归属于陌陌的净利润为7.78亿元(约1.143亿美元),相比上一年同期的6.26亿元(约9380万美元)增长22%。


每股美国存托股(ADS)摊薄净利润为2.65元(约0.39美元),上一年同期为2.53元(约0.38美元)。不按照美国通用会计准则计量,每股美国存托股(ADS)摊薄净利润为3.61元(约0.53美元),上一年同期为3.00元(约0.45美元)。


2018年9月,陌陌月度活跃用户为1.105亿,上一年同期陌陌月度活跃用户为9440万人,同比增长17%。


2018年第三季度,陌陌直播服务与增值服务付费用户去重后总数达1250万(包括探探付费用户360万),上一年同期为730万。


截至2019年9月30日,陌陌持有的现金、现金等价物和定期存款为14.936亿美元,截至2017年12月31日为10.612亿美元。2018年第三季度经营活动带来的净现金为5090万美元,上一年同期为1.046亿美元。


陌陌公司董事长兼CEO唐岩表示,“很高兴地看到三季度我们在运营和财务两方面都取得了令人满意的成绩。同时,我们会稳步推进产品和运营,为来年储备了更持久的增长动力。”


陌陌表示,前三季度净营收较上一年同期增长57%,主要是由于来自直播服务、增值业务营收的增长。陌陌预计,2018年第四季度公司净营收在人民币36.550亿元至人民币37.550亿元之间,同比增长在43%至47%之间,环比增长0%至3%。


在日前举办的知名沽空机构大会Kase Short-Selling Conference上,投资咨询公司J Capital称,中国视频直播平台陌陌可能存在“循环营收”的问题。


J Capital分析师安妮·史蒂文森-杨(AnneStevenson-Yang)表示,陌陌是中国公司制造“虚拟营收”的典型案例,其大部分营收增长均受部分用户驱动,这些用户在打赏后可以获得陌陌75%至100%的返现。她称,这种方式可能被用来洗钱,并估计这种行为可能影响陌陌约40%的营收。


史蒂文森-杨表示,陌陌的月活用户数实际上在一年前就已见顶,此外该公司所处的行业竞争十分激烈,还面临高度的监管风险和巨大的内部抛售。


同时,陌陌近期还被曝出将3000万条用户数据在暗网以50美金的价格出售。卖家贴出的交易截图显示,这些数据包括用户的手机号、密码,写入时间是2015年7月17日。


对此陌陌表示:这个所谓的三年多前通过撞库得来的数据,与陌陌用户的匹配度极低,测试结果都是错误信息。同时,陌陌采用的算法对用户密码进行了加密,任何人无法直接从陌陌数据库中直接获取用户明文密码。


财报发布后,陌陌同时宣布了董事会成员变化:沈南鹏于2018年12月1日正式辞去陌陌公司董事会董事一职。元璟资本合伙人兼董事、阿里巴巴集团联合创始人吴泳铭先生自2018年12月3日起被任命为陌陌公司董事会董事,即日生效。吴先生于2015年创立了元璟资本,并领导阿里巴巴集团几项核心业务。


截至12月6日每股收盘,陌陌股价收于31.69美元,下跌4.2%。

金准人工智能 人工智能芯片研究报告

前言

2010年以来,由于大数据产业的发展,数据量呈现爆炸性增长态势,而传统的计算架构又无法支撑深度学习的大规模并行计算需求,于是研究界对AI芯片进行了新一轮的技术研发与应用研究。AI芯片是人工智能时代的技术核心之一,决定了平台的基础架构和发展生态。金准人工智能专家在此背景下,对人工智能芯片的发展现状进行了简单梳理,包括以下内容:

人工智能芯片概念。首先对人工智能芯片相关概念、技术路线以及各自特点进行介绍,接着对国外、国内AI芯片的发展历程及现状进行梳理。

AI芯片的技术特点及局限性。对AI芯片的几个技术流派进行介绍。

AI芯片厂商介绍。对AI芯片领域的国内外代表性厂商进行介绍。

AI芯片领域专家介绍。通过AMiner大数据平台对AMiner的人工智能芯片人才库进行数据挖掘,统计分析领域内学者分布及迁徙。同时,介绍了目前AI芯片领域的国内外代表性研究学者。

AI芯片应用领域介绍。AI芯片已经渗透到日常生活的方方面面,金准人工智能主要对智能手机、ADAS、CV、VR、语音交互设备、机器人等方向的应用进行介绍。

AI芯片的发展趋势介绍。人工智能的发展历经波折,如今得益于大数据的供给、深度学习算法的革新以及硬件技术的提升,AI芯片以不可阻挡的势态飞速发展。AI芯片的算力提高、功耗降低及更合理的算法实现必然是将来的发展趋势。

一、AI芯片基本知识及现状

从广义上讲只要能够运行人工智能算法的芯片都叫作AI芯片。但是通常意义上的AI芯片指的是针对人工智能算法做了特殊加速设计的芯片,现阶段,这些人工智能算法一般以深度学习算法为主,也可以包括其它机器学习算法。人工智能与深度学习的关系如图所示。

▲人工智能与深度学习

深度学习算法,通常是基于接收到的连续数值,通过学习处理,并输出连续数值的过程,实质上并不能完全模仿生物大脑的运作机制。基于这一现实,研究界还提出了SNN(Spiking Neural Network,脉冲神经网络)模型。作为第三代神经网络模型,SNN更贴近生物神经网络——除了神经元和突触模型更贴近生物神经元与突触之外,SNN还将时域信息引入了计算模型。目前基于SNN的AI芯片主要以IBM的True North、Intel的Loihi以及国内的清华大学天机芯为代表。

1.1AI芯片发展历程

从图灵的论文《计算机器与智能》和图灵测试,到最初级的神经元模拟单元——感知机,再到现在多达上百层的深度神经网络,人类对人工智能的探索从来就没有停止过。上世纪八十年代,多层神经网络和反向传播算法的出现给人工智能行业点燃了新的火花。反向传播的主要创新在于能将信息输出和目标输出之间的误差通过多层网络往前一级迭代反馈,将最终的输出收敛到某一个目标范围之内。1989年贝尔实验室成功利用反向传播算法,在多层神经网络开发了一个手写邮编识别器。1998年Yann LeCun和Yoshua Bengio发表了手写识别神经网络和反向传播优化相关的论文《Gradient-based Learning applied to document recognition》,开创了卷积神经网络的时代。

此后,人工智能陷入了长时间的发展沉寂阶段,直到1997年IBM的深蓝战胜国际象棋大师和2011年IBM的沃森智能系统在Jeopardy节目中胜出,人工智能才又一次为人们所关注。2016年AlphaGo击败韩国围棋九段职业选手,则标志着人工智能的又一波高潮。从基础算法、底层硬件、工具框架到实际应用场景,现阶段的人工智能领域已经全面开花。

作为人工智能核心的底层硬件AI芯片,也同样经历了多次的起伏和波折,总体看来,AI芯片的发展前后经历了四次大的变化,其发展历程如图所示。

▲AI芯片发展历程

1)2007年以前,AI芯片产业一直没有发展成为成熟的产业;同时由于当时算法、数据量等因素,这个阶段AI芯片并没有特别强烈的市场需求,通用的CPU芯片即可满足应用需要。

2)随着高清视频、VR、AR游戏等行业的发展,GPU产品取得快速的突破;同时人们发现GPU的并行计算特性恰好适应人工智能算法及大数据并行计算的需求,如GPU比之前传统的CPU在深度学习算法的运算上可以提高几十倍的效率,因此开始尝试使用GPU进行人工智能计算。

3)进入2010年后,云计算广泛推广,人工智能的研究人员可以通过云计算借助大量CPU和GPU进行混合运算,进一步推进了AI芯片的深入应用,从而催生了各类AI芯片的研发与应用。

4)人工智能对于计算能力的要求不断快速地提升,进入2015年后,GPU性能功耗比不高的特点使其在工作适用场合受到多种限制,业界开始研发针对人工智能的专用芯片,以期通过更好的硬件和芯片架构,在计算效率、能耗比等性能上得到进一步提升。

1.2我国AI芯片发展情况

目前,我国的人工智能芯片行业发展尚处于起步阶段。长期以来,中国在CPU、GPU、DSP处理器设计上一直处于追赶地位,绝大部分芯片设计企业依靠国外的IP核设计芯片,在自主创新上受到了极大的限制。然而,人工智能的兴起,无疑为中国在处理器领域实现弯道超车提供了绝佳的机遇。人工智能领域的应用目前还处于面向行业应用阶段,生态上尚未形成垄断,国产处理器厂商与国外竞争对手在人工智能这一全新赛场上处在同一起跑线上,因此,基于新兴技术和应用市场,中国在建立人工智能生态圈方面将大有可为。

由于我国特殊的环境和市场,国内AI芯片的发展目前呈现出百花齐放、百家争鸣的态势,AI芯片的应用领域也遍布股票交易、金融、商品推荐、安防、早教机器人以及无人驾驶等众多领域,催生了大量的人工智能芯片创业公司,如地平线、深鉴科技、中科寒武纪等。

尽管如此,国内公司却并未如国外大公司一样形成市场规模,反而出现各自为政的散裂发展现状。除了新兴创业公司,国内研究机构如北京大学、清华大学、中国科学院等在AI芯片领域都有深入研究;而其他公司如百度和比特大陆等,2017年也有一些成果发布。可以预见,未来谁先在人工智能领域掌握了生态系统,谁就掌握住了这个产业的主动权。

1.3 AI学者概况

基于来自清华大学AMiner人才库数据,全球人工智能芯片领域学者分布如图所示,从图中可以看到,人工智能芯片领域的学者主要分布在北美洲,其次是欧洲。中国对人工智能芯片的研究紧跟其后,南美洲、非洲和大洋洲人才相对比较匮乏。

▲人工智能芯片领域研究学者全球分布

按国家进行统计来看美国是人工智能芯片领域科技发展的核心。英国的人数紧排在美国之后。其他的专家主要分布在中国、德国、加拿大、意大利和日本。

▲人工智能芯片领域研究学者全球分布

对全球人工智能芯片领域最具影响力的1000人的迁徙路径进行了统计分析,得出下图所示的各国人才逆顺差对比。

▲各国人才逆顺差

可以看出,各国人才的流失和引进是相对比较均衡的,其中美国为人才流动大国,人才输入和输出幅度都大幅度领先。英国、中国、德国和瑞士等国次于美国,但各国之间人才流动相差并不明显。

二、AI芯片的分类及技术

人工智能芯片目前有两种发展路径:一种是延续传统计算架构,加速硬件计算能力,主要以3种类型的芯片为代表,即GPU、FPGA、ASIC,但CPU依旧发挥着不可替代的作用;另一种是颠覆经典的冯·诺依曼计算架构,采用类脑神经结构来提升计算能力,以IBM True North芯片为代表。

2.1传统CPU

计算机工业从1960年代早期开始使用CPU这个术语。迄今为止,CPU从形态、设计到实现都已发生了巨大的变化,但是其基本工作原理却一直没有大的改变。通常CPU由控制器和运算器这两个主要部件组成。传统的CPU内部结构图如图3所示,从图中我们可以看到:实质上仅单独的ALU模块(逻辑运算单元)是用来完成数据计算的,其他各个模块的存在都是为了保证指令能够一条接一条的有序执行。这种通用性结构对于传统的编程计算模式非常适合,同时可以通过提升CPU主频(提升单位时间内执行指令的条数)来提升计算速度。但对于深度学习中的并不需要太多的程序指令、却需要海量数据运算的计算需求,这种结构就显得有些力不从心。尤其是在功耗限制下,无法通过无限制的提升CPU和内存的工作频率来加快指令执行速度,这种情况导致CPU系统的发展遇到不可逾越的瓶颈。

▲传统CPU内部结构图(仅ALU为主要计算模块)

2.2并行加速计算的GPU

GPU作为最早从事并行加速计算的处理器,相比CPU速度快,同时比其他加速器芯片编程灵活简单。

传统的CPU之所以不适合人工智能算法的执行,主要原因在于其计算指令遵循串行执行的方式,没能发挥出芯片的全部潜力。与之不同的是,GPU具有高并行结构,在处理图形数据和复杂算法方面拥有比CPU更高的效率。对比GPU和CPU在结构上的差异,CPU大部分面积为控制器和寄存器,而GPU拥有更ALU(ARITHMETICLOGICUNIT,逻辑运算单元)用于数据处理,这样的结构适合对密集型数据进行并行处理,CPU与GPU的结构对比如图所示。程序在GPU系统上的运行速度相较于单核CPU往往提升几十倍乃至上千倍。随着英伟达、AMD等公司不断推进其对GPU大规模并行架构的支持,面向通用计算的GPU(即GPGPU,GENERALPURPOSEGPU,通用计算图形处理器)已成为加速可并行应用程序的重要手段。

▲CPU及GPU结构对比图(引用自NVIDIACUDA文档)

GPU的发展历程可分为3个阶段,发展历程如图所示:

第一代GPU(1999年以前),部分功能从CPU分离,实现硬件加速,以GE(GEOMETRYENGINE)为代表,只能起到3D图像处理的加速作用,不具有软件编程特性。

第二代GPU(1999-2005年),实现进一步的硬件加速和有限的编程性。1999年,英伟达发布了“专为执行复杂的数学和几何计算的”GeForce256图像处理芯片,将更多的晶体管用作执行单元,而不是像CPU那样用作复杂的控制单元和缓存,将T&L(TRANSFORMANDLIGHTING)等功能从CPU分离出来,实现了快速变换,这成为GPU真正出现的标志。之后几年,GPU技术快速发展,运算速度迅速超过CPU。2001年英伟达和ATI分别推出的GEFORCE3和RADEON8500,图形硬件的流水线被定义为流处理器,出现了顶点级可编程性,同时像素级也具有有限的编程性,但GPU的整体编程性仍然比较有限。

第三代GPU(2006年以后),GPU实现方便的编程环境创建,可以直接编写程序。2006年英伟达与ATI分别推出了CUDA(Compute United Device Architecture,计算统一设备架构)编程环境和CTM(CLOSE TO THE METAL)编程环境,使得GPU打破图形语言的局限成为真正的并行数据处理超级加速器。

2008年,苹果公司提出一个通用的并行计算编程平台OPENCL(OPEN COMPUTING LANGUAGE,开放运算语言),与CUDA绑定在英伟达的显卡上不同,OPENCL和具体的计算设备无关。

▲GPU芯片的发展阶段

目前,GPU已经发展到较为成熟的阶段。谷歌、FACEBOOK、微软、TWITTER和百度等公司都在使用GPU分析图片、视频和音频文件,以改进搜索和图像标签等应用功能。此外,很多汽车生产商也在使用GPU芯片发展无人驾驶。不仅如此,GPU也被应用于VR/AR相关的产业。

但是GPU也有一定的局限性。深度学习算法分为训练和推断两部分,GPU平台在算法训练上非常高效。但在推断中对于单项输入进行处理的时候,并行计算的优势不能完全发挥出来。

2.3半定制化的FPGA

FPGA是在PAL、GAL、CPLD等可编程器件基础上进一步发展的产物。用户可以通过烧入FPGA配置文件来定义这些门电路以及存储器之间的连线。这种烧入不是一次性的,比如用户可以把FPGA配置成一个微控制器MCU,使用完毕后可以编辑配置文件把同一个FPGA配置成一个音频编解码器。因此,它既解决了定制电路灵活性的不足,又克服了原有可编程器件门电路数有限的缺点。

FPGA可同时进行数据并行和任务并行计算,在处理特定应用时有更加明显的效率提升。对于某个特定运算,通用CPU可能需要多个时钟周期;而FPGA可以通过编程重组电路,直接生成专用电路,仅消耗少量甚至一次时钟周期就可完成运算。

此外,由于FPGA的灵活性,很多使用通用处理器或ASIC难以实现的底层硬件控制操作技术,利用FPGA可以很方便的实现。这个特性为算法的功能实现和优化留出了更大空间。同时FPGA一次性成本(光刻掩模制作成本)远低于ASIC,在芯片需求还未成规模、深度学习算法暂未稳定,需要不断迭代改进的情况下,利用FPGA芯片具备可重构的特性来实现半定制的人工智能芯片是最佳选择之一。

功耗方面,从体系结构而言,FPGA也具有天生的优势。传统的冯氏结构中,执行单元(如CPU核)执行任意指令,都需要有指令存储器、译码器、各种指令的运算器及分支跳转处理逻辑参与运行,而FPGA每个逻辑单元的功能在重编程(即烧入)时就已经确定,不需要指令,无需共享内存,从而可以极大的降低单位执行的功耗,提高整体的能耗比。

由于FPGA具备灵活快速的特点,因此在众多领域都有替代ASIC的趋势。FPGA在人工智能领域的应用如图所示。

▲FPGA在人工智能领域的应用

2.4全定制化的ASIC

目前以深度学习为代表的人工智能计算需求,主要采用GPU、FPGA等已有的适合并行计算的通用芯片来实现加速。在产业应用没有大规模兴起之时,使用这类已有的通用芯片可以避免专门研发定制芯片(ASIC)的高投入和高风险。但是,由于这类通用芯片设计初衷并非专门针对深度学习,因而天然存在性能、功耗等方面的局限性。随着人工智能应用规模的扩大,这类问题日益突显。

GPU作为图像处理器,设计初衷是为了应对图像处理中的大规模并行计算。因此,在应用于深度学习算法时,有三个方面的局限性:第一,应用过程中无法充分发挥并行计算优势。深度学习包含训练和推断两个计算环节,GPU在深度学习算法训练上非常高效,但对于单一输入进行推断的场合,并行度的优势不能完全发挥。第二,无法灵活配置硬件结构。GPU采用SIMT计算模式,硬件结构相对固定。目前深度学习算法还未完全稳定,若深度学习算法发生大的变化,GPU无法像FPGA一样可以灵活的配制硬件结构。第三,运行深度学习算法能效低于FPGA。

尽管FPGA倍受看好,甚至新一代百度大脑也是基于FPGA平台研发,但其毕竟不是专门为了适用深度学习算法而研发,实际应用中也存在诸多局限:第一,基本单元的计算能力有限。为了实现可重构特性,FPGA内部有大量极细粒度的基本单元,但是每个单元的计算能力(主要依靠LUT查找表)都远远低于CPU和GPU中的ALU模块;第二、计算资源占比相对较低。为实现可重构特性,FPGA内部大量资源被用于可配置的片上路由与连线;第三,速度和功耗相对专用定制芯片(ASIC)仍然存在不小差距;第四,FPGA价格较为昂贵,在规模放量的情况下单块FPGA的成本要远高于专用定制芯片。

因此,随着人工智能算法和应用技术的日益发展,以及人工智能专用芯片ASIC产业环境的逐渐成熟,全定制化人工智能ASIC也逐步体现出自身的优势,从事此类芯片研发与应用的国内外比较有代表性的公司如图所示。

▲人工智能专用芯片(包括类脑芯片)研发情况一览

深度学习算法稳定后,AI芯片可采用ASIC设计方法进行全定制,使性能、功耗和面积等指标面向深度学习算法做到最优。

2.5类脑芯片

类脑芯片不采用经典的冯·诺依曼架构,而是基于神经形态架构设计,以IBM Truenorth为代表。IBM研究人员将存储单元作为突触、计算单元作为神经元、传输单元作为轴突搭建了神经芯片的原型。目前,Truenorth用三星28nm功耗工艺技术,由54亿个晶体管组成的芯片构成的片上网络有4096个神经突触核心,实时作业功耗仅为70mW。由于神经突触要求权重可变且要有记忆功能,IBM采用与CMOS工艺兼容的相变非挥发存储器(PCM)的技术实验性的实现了新型突触,加快了商业化进程。

三、AI芯片产业及趋势

3.1 AI芯片应用领域

随着人工智能芯片的持续发展,应用领域会随时间推移而不断向多维方向发展,这里我们选择目前发展比较集中的几个行业做相关的介绍。

▲AI芯片目前比较集中的应用领域

1)智能手机

2017年9月,华为在德国柏林消费电子展发布了麒麟970芯片,该芯片搭载了寒武纪的NPU,成为“全球首款智能手机移动端AI芯片”;2017年10月中旬Mate10系列新品(该系列手机的处理器为麒麟970)上市。搭载了NPU的华为Mate10系列智能手机具备了较强的深度学习、本地端推断能力,让各类基于深度神经网络的摄影、图像处理应用能够为用户提供更加完美的体验。

而苹果发布以iPhoneX为代表的手机及它们内置的A11Bionic芯片。A11Bionic中自主研发的双核架构Neural Engine(神经网络处理引擎),它每秒处理相应神经网络计算需求的次数可达6000亿次。这个Neural Engine的出现,让A11Bionic成为一块真正的AI芯片。A11Bionic大大提升了iPhoneX在拍照方面的使用体验,并提供了一些富有创意的新用法。

2)ADAS(高级辅助驾驶系统)

ADAS是最吸引大众眼球的人工智能应用之一,它需要处理海量的由激光雷达、毫米波雷达、摄像头等传感器采集的实时数据。相对于传统的车辆控制方法,智能控制方法主要体现在对控制对象模型的运用和综合信息学习运用上,包括神经网络控制和深度学习方法等,得益于AI芯片的飞速发展,这些算法已逐步在车辆控制中得到应用。

3)CV(计算机视觉(Computer Vision)设备

需要使用计算机视觉技术的设备,如智能摄像头、无人机、行车记录仪、人脸识别迎宾机器人以及智能手写板等设备,往往都具有本地端推断的需要,如果仅能在联网下工作,无疑将带来糟糕的体验。而计算机视觉技术目前看来将会成为人工智能应用的沃土之一,计算机视觉芯片将拥有广阔的市场前景。

4)VR设备

VR设备芯片的代表为HPU芯片,是微软为自身VR设备Hololens研发定制的。这颗由台积电代工的芯片能同时处理来自5个摄像头、1个深度传感器以及运动传感器的数据,并具备计算机视觉的矩阵运算和CNN运算的加速功能。这使得VR设备可重建高质量的人像3D影像,并实时传送到任何地方。

5)语音交互设备

语音交互设备芯片方面,国内有启英泰伦以及云知声两家公司,其提供的芯片方案均内置了为语音识别而优化的深度神经网络加速方案,实现设备的语音离线识别。稳定的识别能力为语音技术的落地提供了可能;与此同时,语音交互的核心环节也取得重大突破。语音识别环节突破了单点能力,从远场识别,到语音分析和语义理解有了重大突破,呈现出一种整体的交互方案。

6)机器人

无论是家居机器人还是商用服务机器人均需要专用软件+芯片的人工智能解决方案,这方面典型公司有由前百度深度学习实验室负责人余凯创办的地平线机器人,当然地平线机器人除此之外,还提供ADAS、智能家居等其他嵌入式人工智能解决方案。

3.2 AI芯片国内外代表性企业

本篇将介绍目前人工智能芯片技术领域的国内外代表性企业。文中排名不分先后。人工智能芯片技术领域的国内代表性企业包括中科寒武纪、中星微、地平线机器人、深鉴科技、灵汐科技、启英泰伦、百度、华为等,国外包括英伟达、AMD、Google、高通、Nervana Systems、Movidius、IBM、ARM、CEVA、MIT/Eyeriss、苹果、三星等。

中科寒武纪。寒武纪科技成立于2016年,总部在北京,创始人是中科院计算所的陈天石、陈云霁兄弟,公司致力于打造各类智能云服务器、智能终端以及智能机器人的核心处理器芯片。阿里巴巴创投、联想创投、国科投资、中科图灵、元禾原点、涌铧投资联合投资,为全球AI芯片领域第一个独角兽初创公司。

寒武纪是全球第一个成功流片并拥有成熟产品的AI芯片公司,拥有终端AI处理器IP和云端高性能AI芯片两条产品线。2016年发布的寒武纪1A处理器(Cambricon-1A)是世界首款商用深度学习专用处理器,面向智能手机、安防监控、无人机、可穿戴设备以及智能驾驶等各类终端设备,在运行主流智能算法时性能功耗比全面超越传统处理器。

中星微。1999年,由多位来自硅谷的博士企业家在北京中关村科技园区创建了中星微电子有限公司,启动并承担了国家战略项目——“星光中国芯工程”,致力于数字多媒体芯片的开发、设计和产业化。

2016年初,中星微推出了全球首款集成了神经网络处理器(NPU)的SVAC视频编解码SoC,使得智能分析结果可以与视频数据同时编码,形成结构化的视频码流。该技术被广泛应用于视频监控摄像头,开启了安防监控智能化的新时代。自主设计的嵌入式神经网络处理器(NPU)采用了“数据驱动并行计算”架构,专门针对深度学习算法进行了优化,具备高性能、低功耗、高集成度、小尺寸等特点,特别适合物联网前端智能的需求。

▲集成了NPU的神经网络处理器VC0616的内部结构

地平线机器人(Horizon Robotics)。地平线机器人成立于2015年,总部在北京,创始人是前百度深度学习研究院负责人余凯。BPU(Brain Processing Unit)是地平线机器人自主设计研发的高效人工智能处理器架构IP,支持ARM/GPU/FPGA/ASIC实现,专注于自动驾驶、人脸图像辨识等专用领域。2017年,地平线发布基于高斯架构的嵌入式人工智能解决方案,将在智能驾驶、智能生活、公共安防三个领域进行应用,第一代BPU芯片“盘古”目前已进入流片阶段,预计在2018年下半年推出,能支持1080P的高清图像输入,每秒钟处理30帧,检测跟踪数百个目标。地平线的第一代BPU采用TSMC的40nm工艺,相对于传统CPU/GPU,能效可以提升2~3个数量级(100~1,000倍左右)。

深鉴科技。深鉴科技成立于2016年,总部在北京。由清华大学与斯坦福大学的世界顶尖深度学习硬件研究者创立。深鉴科技于2018年7月被赛灵思收购。深鉴科技将其开发的基于FPGA的神经网络处理器称为DPU。到目前为止,深鉴公开发布了两款DPU:亚里士多德架构和笛卡尔架构,其中,亚里士多德架构是针对卷积神经网络CNN而设计;笛卡尔架构专为处理DNN/RNN网络而设计,可对经过结构压缩后的稀疏神经网络进行极致高效的硬件加速。相对于Intel Xeon CPU与Nvidia Titan XGPU,应用笛卡尔架构的处理器在计算速度上分别提高189倍与13倍,具有24,000倍与3,000倍的更高能效。

灵汐科技。灵汐科技于2018年1月在北京成立,联合创始人包括清华大学的世界顶尖类脑计算研究者。公司致力于新一代神经网络处理器(Tianjic)开发,特点在于既能够高效支撑现有流行的机器学习算法(包括CNN,MLP,LSTM等网络架构),也能够支撑更仿脑的、更具成长潜力的脉冲神经网络算法;使芯片具有高计算力、高多任务并行度和较低功耗等优点。软件工具链方面支持由Caffe、Tensor Flow等算法平台直接进行神经网络的映射编译,开发友善的用户交互界面。Tianjic可用于云端计算和终端应用场景,助力人工智能的落地和推广。

启英泰伦。启英泰伦于2015年11月在成都成立,是一家语音识别芯片研发商。启英泰伦的CI1006是基于ASIC架构的人工智能语音识别芯片,包含了脑神经网络处理硬件单元,能够完美支持DNN运算架构,进行高性能的数据并行计算,可极大的提高人工智能深度学习语音技术对大量数据的处理效率。

百度。百度2017年8月HotChips大会上发布了XPU,这是一款256核、基于FPGA的云计算加速芯片。合作伙伴是赛思灵(Xilinx)。XPU采用新一代AI处理架构,拥有GPU的通用性和FPGA的高效率和低能耗,对百度的深度学习平台Paddle Paddle做了高度的优化和加速。据介绍,XPU关注计算密集型、基于规则的多样化计算任务,希望提高效率和性能,并带来类似CPU的灵活性。

华为。麒麟970搭载的神经网络处理器NPU采用了寒武纪IP,如图12所示。麒麟970采用了TSMC10nm工艺制程,拥有55亿个晶体管,功耗相比上一代芯片降低20%。CPU架构方面为4核A73+4核A53组成8核心,能耗同比上一代芯片得到20%的提升;GPU方面采用了12核MaliG72MP12GPU,在图形处理以及能效两项关键指标方面分别提升20%和50%;NPU采用HiAI移动计算架构,在FP16下提供的运算性能可以达到1.92TFLOPs,相比四个Cortex-A73核心,处理同样的AI任务,有大约具备50倍能效和25倍性能优势。

英伟达(Nvidia)。英伟达创立于1993年,总部位于美国加利福尼亚州圣克拉拉市。早在1999年,英伟达发明了GPU,重新定义了现代计算机图形技术,彻底改变了并行计算。深度学习对计算速度有非常苛刻的要求,而英伟达的GPU芯片可以让大量处理器并行运算,速度比CPU快十倍甚至几十倍,因而成为绝大部分人工智能研究者和开发者的首选。自从Google Brain采用1.6万个GPU核训练DNN模型,并在语音和图像识别等领域获得巨大成功以来,英伟达已成为AI芯片市场中无可争议的领导者。

AMD。美国AMD半导体公司专门为计算机、通信和消费电子行业设计和制造各种创新的微处理器(CPU、GPU、APU、主板芯片组、电视卡芯片等),以及提供闪存和低功率处理器解决方案,公司成立于1969年。AMD致力为技术用户——从企业、政府机构到个人消费者——提供基于标准的、以客户为中心的解决方案。

2017年12月Intel和AMD宣布将联手推出一款结合英特尔处理器和AMD图形单元的笔记本电脑芯片。目前AMD拥有针对AI和机器学习的高性能Radeon Instinc加速卡,开放式软件平台ROCm等。

Google。Google在2016年宣布独立开发一种名为TPU的全新的处理系统。TPU是专门为机器学习应用而设计的专用芯片。通过降低芯片的计算精度,减少实现每个计算操作所需晶体管数量的方式,让芯片的每秒运行的操作个数更高,这样经过精细调优的机器学习模型就能在芯片上运行得更快,进而更快地让用户得到更智能的结果。在2016年3月打败了李世石和2017年5月打败了柯杰的阿尔法狗,就是采用了谷歌的TPU系列芯片。

GoogleI/O-2018开发者大会期间,正式发布了第三代人工智能学习专用处理器TPU3.0。TPU3.0采用8位低精度计算以节省晶体管数量,对精度影响很小但可以大幅节约功耗、加快速度,同时还有脉动阵列设计,优化矩阵乘法与卷积运算,并使用更大的片上内存,减少对系统内存的依赖。速度能加快到最高100PFlops(每秒1000万亿次浮点计算)。

高通。在智能手机芯片市场占据绝对优势的高通公司,也在人工智能芯片方面积极布局。据高通提供的资料显示,其在人工智能方面已投资了Clarifai公司和中国“专注于物联网人工智能服务”的云知声。而早在2015年CES上,高通就已推出了一款搭载骁龙SoC的飞行机器人——Snap dragon Cargo。金准人工智能专家认为在工业、农业的监测以及航拍对拍照、摄像以及视频新需求上,公司恰好可以发挥其在计算机视觉领域的能力。此外,高通的骁龙820芯片也被应用于VR头盔中。事实上,高通已经在研发可以在本地完成深度学习的移动端设备芯片。

Nervana Systems。Nervana创立于2014年,公司推出的The Nervana Engine是一个为深度学习专门定制和优化的ASIC芯片。这个方案的实现得益于一项叫做High Bandwidth Memory的新型内存技术,这项技术同时拥有高容量和高速度,提供32GB的片上储存和8TB每秒的内存访问速度。该公司目前提供一个人工智能服务“in the cloud”,他们声称这是世界上最快的且目前已被金融服务机构、医疗保健提供者和政府机构所使用的服务。他们的新型芯片将会保证Nervana云平台在未来的几年内仍保持最快的速度。

Movidius(被Intel收购)。2016年9月,Intel发表声明收购了Movidius。Movidius专注于研发高性能视觉处理芯片。其最新一代的Myriad2视觉处理器主要由SPARC处理器作为主控制器,加上专门的DSP处理器和硬件加速电路来处理专门的视觉和图像信号。这是一款以DSP架构为基础的视觉处理器,在视觉相关的应用领域有极高的能耗比,可以将视觉计算普及到几乎所有的嵌入式系统中。

该芯片已被大量应用在Google3D项目的Tango手机、大疆无人机、FLIR智能红外摄像机、海康深眸系列摄像机、华睿智能工业相机等产品中。

IBM。IBM很早以前就发布过watson,投入了很多的实际应用。除此之外,还启动了类脑芯片的研发,即True North。True North是IBM参与DARPA的研究项目SyNapse的最新成果。SyNapse全称是Systems of Neuromorphic Adaptive Plastic Scalable Electronics(自适应可塑可伸缩电子神经系统,而SyNapse正好是突触的意思),其终极目标是开发出打破冯·诺依曼体系结构的计算机体系结构。

ARM。ARM推出全新芯片架构DynamIQ,通过这项技术,AI芯片的性能有望在未来三到五年内提升50倍。

ARM的新CPU架构将会通过为不同部分配置软件的方式将多个处理核心集聚在一起,这其中包括一个专门为AI算法设计的处理器。芯片厂商将可以为新处理器配置最多8个核心。同时为了能让主流AI在自己的处理器上更好地运行,ARM还将推出一系列软件库。

CEVA。CEVA是专注于DSP的IP供应商,拥有众多的产品线。其中,图像和计算机视觉DSP产品CEVA-XM4是第一个支持深度学习的可编程DSP,而其发布的新一代型号CEVA-XM6,具有更优的性能、更强大的计算能力以及更低的能耗。CEVA指出,智能手机、汽车、安全和商业应用,如无人机、自动化将是其业务开展的主要目标。

MIT/Eyeriss。Eyeriss事实上是MIT的一个项目,还不是一个公司,从长远来看,如果进展顺利,很可能孵化出一个新的公司。Eyeriss是一个高效能的深度卷积神经网络(CNN)加速器硬件,该芯片内建168个核心,专门用来部署神经网路(neural network),效能为一般GPU的10倍。其技术关键在于最小化GPU核心和记忆体之间交换数据的频率(此运作过程通常会消耗大量的时间与能量):一般GPU内的核心通常共享单一记忆体,但Eyeriss的每个核心拥有属于自己的记忆体。

目前,Eyeriss主要定位在人脸识别和语音识别,可应用在智能手机、穿戴式设备、机器人、自动驾驶车与其他物联网应用装置上。

苹果。iPhone8和iPhoneX的发布会上,苹果明确表示其中所使用的A11处理器集成了一个专用于机器学习的硬件——“神经网络引擎(Neural Engine)”,每秒运算次数最高可达6000亿次。这块芯片将能够改进苹果设备在处理需要人工智能的任务时的表现,比如面部识别和语音识别等。

三星。2017年,华为海思推出了麒麟970芯片,据知情人士透露,为了对标华为,三星已经研发了许多种类的人工智能芯片。三星计划在未来三年内新上市的智能手机中都采用人工智能芯片,并且他们还将为人工智能设备建立新的组件业务。三星还投资了Graphcore、深鉴科技等人工智能芯片企业。

3.3技术趋势

目前主流AI芯片的核心主要是利用MAC(Multiplier and Accumulation,乘加计算)加速阵列来实现对CNN(卷积神经网络)中最主要的卷积运算的加速。这一代AI芯片主要有如下3个方面的问题。

1)深度学习计算所需数据量巨大,造成内存带宽成为整个系统的瓶颈,即所谓“memory wall”问题。

2)与第一个问题相关,内存大量访问和MAC阵列的大量运算,造成AI芯片整体功耗的增加。

3)深度学习对算力要求很高,要提升算力,最好的方法是做硬件加速,但是同时深度学习算法的发展也是日新月异,新的算法可能在已经固化的硬件加速器上无法得到很好的支持,即性能和灵活度之间的平衡问题。

因此可以预见下一代AI芯片将有如下的五个发展趋势。

1)更高效的大卷积解构/复用

在标准SIMD的基础上,CNN由于其特殊的复用机制,可以进一步减少总线上的数据通信。而复用这一概念,在超大型神经网络中就显得格外重要。如何合理地分解、映射这些超大卷积到有效的硬件上成为了一个值得研究的方向,

2)更低的Inference计算/存储位宽

AI芯片最大的演进方向之一可能就是神经网络参数/计算位宽的迅速减少——从32位浮点到16位浮点/定点、8位定点,甚至是4位定点。在理论计算领域,2位甚至1位参数位宽,都已经逐渐进入实践领域。

3)更多样的存储器定制设计

当计算部件不再成为神经网络加速器的设计瓶颈时,如何减少存储器的访问延时将会成为下一个研究方向。通常,离计算越近的存储器速度越快,每字节的成本也越高,同时容量也越受限,因此新型的存储结构也将应运而生。

4)更稀疏的大规模向量实现

神经网络虽然大,但是,实际上有很多以零为输入的情况,此时稀疏计算可以高效的减少无用能效。来自哈佛大学的团队就该问题提出了优化的五级流水线结,在最后一级输出了触发信号。在Activation层后对下一次计算的必要性进行预先判断,如果发现这是一个稀疏节点,则触发SKIP信号,避免乘法运算的功耗,以达到减少无用功耗的目的。

5)计算和存储一体化

计算和存储一体化(process-in-memory)技术,其要点是通过使用新型非易失性存储(如ReRAM)器件,在存储阵列里面加上神经网络计算功能,从而省去数据搬移操作,即实现了计算存储一体化的神经网络处理,在功耗性能方面可以获得显著提升。

总结

金准人工智能专家认为,近几年,AI技术不断取得突破性进展。作为AI技术的重要物理基础,AI芯片拥有巨大的产业价值和战略地位。但从大趋势来看,目前尚处于AI芯片发展的初级阶段,无论是科研还是产业应用都有巨大的创新空间。现在不仅英伟达、谷歌等国际巨头相继推出新产品,国内百度、阿里等纷纷布局这一领域,也诞生了寒武纪等AI芯片创业公司。在CPU、GPU等传统芯片领域与国际相差较多的情况下,中国AI芯片被寄望能实现弯道超车。

Uber加码医疗交通服务 抢占420亿美元市场

Uber正在进一步开拓医疗健康领域。据CNBC报道,Uber于近期聘用了长期从事健康领域工作的Aaron Crowell和打车应用公司Lyft的医疗团队区域副总裁Dan Trigub。


Crowell表示,他加入Uber是因为他们拥有产业内缺乏的一种GPS跟踪技术。他认为这项服务有机会走向海外,因为除美国以外的国家也可能需要这样的服务。


Trigub则称,他加入Uber是因为对公司“对产品的热情和专注”感到印象深刻。他表示,“对于年老体衰和低收入人群而言,在他们最需要的时候,应该能更方便的使用交通工具”。


早在今年3月份,Uber就曾推出Uber Health,为非紧急医疗提供运输服务,旨在帮助患者预约乘车。通过这项服务,卫生保健提供商可以在几小时或30天内通知患者和看护人乘车。对比大多数非紧急医疗运输企业,Uber定位为更便宜、更可靠的选择。因其服务缴费简单,且易于管理,符合医疗隐私法,该服务已覆盖全美超100家医疗保健提供商。


2017年1月份,Uber还在华盛顿特区聘请了一位资深说客,来推进公司所提交的一系列与卫生保健和医疗记录隐私相关的政策议程。UberHealth表示将切实遵循美国 《 Health保险流通与责任法案》(HIPAA)规定,保证用户隐私安全。


2016年,Uber还曾与波士顿Circulation公司合作,为25个州700多个医疗机构提供患者乘车服务。


不止Uber,作为竞争对手,Lyft也在不断加码医疗交通服务。此前,Lyft将麦凯松前高管Megan Callahan纳入公司,以扩大健康运输服务业务;公司也曾与Circulation和保险业者CareMore卫生系统(CareMore Health Systems)联手合作。


美国对医疗交通有着大量的需求。据美国医学会内部医学协会(JAMA InternalMedicine)数据显示,每年大约有360万美国人因为缺乏可靠的交通方式而错过了他们的门诊预约。Uber表示,之所以押注医疗保健领域,希望为这些因交通不便利而错过门诊的这些人提供交通服务。


据报道,在美国,通常情况下,该项乘车费用将由保险公司报销。研究人员预计,到2024年,医疗交通服务市场的规模将达到420亿美元,而Uber和Lyft就可能瓜分走30亿美元的市场。

新文创空间不可预知的“惊喜”

放假时,独自一人或三五知己在文创生活馆中看书、休憩、看展览、听讲座、挑选文创产品……感受时间的静止、文字的优雅以及美学的力量,令生活变得鲜活与生动,是不少人的休闲选择。


阅读、文化能带给一个城市力量。随着城市生活的演进、传统书店的变迁,如今书店已不单是提供书籍阅读、销售的门店,而是成为文创生活空间的一个组成部分,将设计、创意、休闲、美感、功能、体验,以及文创于一体。今年以来,这类型的文创生活馆在广州陆续出现,许多人走进其中,第一感觉是充满了个性化的设计感以及视觉冲击力,而它们独具匠心的现代空间设置和沉浸式体验感的营造,会令人置身其中而不觉时间的流逝。


80、90后眼中的新派书店:


不高冷、阅读氛围好、附加元素丰富


广州的年轻人喜欢新派书店吗?记者采访了几位在一二线城市不同领域工作的90后。作为一名互联网工作者,大扬对文创书店有自己的见解,“我认为在这个精神消费多元、文字载体更迭的时代,这类书店最吸引人的地方不在于书,而在于文化认同,让人觉得自己也和所羡慕的、在书店里举办过文化活动的人们一起在向‘深刻’看齐。我们需要这样的文化地标,在当下做书店都很值得鼓励。”


“我不喜欢太过‘高冷’的书店,少了点味道。书店还是应该多些‘市井味’,让人像下课去买奶茶一样自然地走进去。”文字工作者培培表示,“最好能够不断给我惊喜。比如言几又,精挑细选的书籍与分布明确的主题区我就很喜欢,有一些与书店格调相统一的小物件也不错。”


毛毛是一名语文教师,她认为书店最重要的还是提供“阅读”功能。“像树德这样采光好、随处可坐的书店就较适合长时间阅读。一家书店如果第一次去觉得阅读氛围好,我就会长期过去。”


漫画家心心同样对文创书店的阅读氛围有较高要求,但同时也表示:“书店举办的一些文化活动我也很感兴趣,只要不是太严肃就好。像我周六还要去书店参加一个义卖会!”


在他们眼里,书店不仅仅是阅读,文化活动、文创产品等贩卖“附加值”的元素也是吸引他们的重要原因。


不一味追求视觉冲击


讲求颜值与功能平衡


走进广州珠江新城K11的言几又,宛如进入了一条时光隧道,整体的装潢充满科技感与现代气息,“随处”摆放的艺术装置、黑色镜面天花、金属墙壁……仿佛走进了科幻片,然而,木质的书架、排列整齐有序的书籍、淡黄色的灯光,又会渐渐令人清晰知道:哦,原来我是来了一家书店,一家传递现代生活方式的文创空间。


“首先是基于K11艺术商场的定位”,峻佳设计有限公司创始人、广州言几又K11设计师陈峻佳在接受全媒体记者采访时谈了自己的想法,“由于是坐落于广州繁华的CBD,因此现代生活与艺术感是这个门店总体的设计理念,我们希望呈现一种有活力的艺术,打造一个文化与艺术的迷宫。”据介绍,这位获得WYDF世界青年设计师全球总冠军的设计师,其所带领的设计团队,之前更是打造了北京、成都、杭州、重庆等城市的言几又门店。几乎每一家的门店都具有“不可复制”的设计特色,成为当地年轻潮人们或者是前往当地旅游的游客喜爱的“打卡地”。他强调,在复合空间设计中,不能一味只追求视觉冲击,更要讲求商业逻辑,简单而言,是“颜值”与功能之间取得平衡。过于夸张的设计或是纯粹讲求视觉冲击的设计是不行的。据了解,在设计之初他们会先做大量的调查,他们发现目前这种新兴的文创生活空间,主要的消费群体是80后、90后,因此,他们的设计会更多符合年轻消费群体的审美。在陈峻佳眼中,作为书店,诚品像一个有内涵的学者,表现在设计上,外观比较端庄稳重;而言几又则像是一个年轻的、喜欢创意的文艺青年,在设计时多用潮流元素和新鲜的手法,“这个品牌给人的感觉,就是无论是穿hiphop服装或是穿正装去都可以,每一次都有新的设计和体验”。


“隐身”旧厂房 营造贴合自然之感


与位于市中心商业旺区的言几又门店不同,“树德之光”在记者眼中走的是不一样的路线。


踏入“树德之光”书店,你会看到成片的玻璃墙面与大块的玻璃天窗让自然光肆意倾泻,触目所及的大片白色仿佛模糊了空间的边界,呈现出一种更为广阔的视野。“白色是树德的重要标志,我们会把白色一直沿用下去。”树德合伙人陈惠璇表示,“但是在白色的基础上,我们也会增加一些新的颜色。”


随处可见的木色桌椅与文创产品,与白色共同构成了整个空间的视觉担当。“大量采用木质材料也是树德的一大特色,木质代表着温暖与自然。我们并不想打造一个过于精细的场所,粗糙一点反而会让人更加放松与舒适。”


树德一直以让人们感觉“放松”为己任。“我们在树德生活馆之内开了一家设计书店,希望提供一个让大众真正能够阅读、休息的空间,并非以盈利为第一目标,而是想要让人们沉浸其中去感受设计、感受美。”陈惠璇告诉记者,“但这种‘感受’也是轻松的,我们不会去刻意传递。在书店中逛累了随处都可落座,不用担心店员会来打扰、随意推销。”但这种免费空间带来的成本损耗是难免的,“所以我们希望人们在使用过程中可向我们提建议,这些宝贵建议可弥补成本上的损耗。”


既然是设计书店,本身自然承载着展示设计感的功能。绵延而上的阶梯,用脚手架搭建而成的书墙,仿佛以有限的实体空间容纳着无限的精神空间。“我们认为书店应该是天堂图书馆的样子。人们要在书店得到一种静谧感,首先需要被震撼。于是我们设计了整面的书墙,创造一种被书包围之感,仿佛在书的海洋里畅游。而踏着旋转楼梯往上走的时候,会感觉自己正在攀登知识的阶梯。”


利用展览、文创市集吸引年轻人 强调设计原创


陈峻佳表示,现代的文创生活空间,书籍只是其中一部分,它是吸引大家走进来一个媒介,进入里面之后,这里是充满多种多样的业态,有书区、主题艺术区、咖啡区、儿童区、文创商品区等等。他坦言,处理复合空间最难的地方是如何吸引人不停地往里走,对不同业态的转接设计。


从初期只打算建立“生活馆”,到配套设计出书店、美术馆、国际展厅、创意部落、创意中心、公寓,“我们希望打造一个小型的文化综合体。这是一个逐步探索的过程,从仅仅打算出售我们原创设计的文创产品,到现在不断增加新的内容,我们认为树德不仅仅是单纯‘卖东西’的地方,而应该成为一个原创设计的发生地。”陈惠璇解释。


记者了解到,为达到成为“原创设计发生地”的目的,树德进行了诸多探索:树德中错落有致的阶梯面积堪称“奢侈”,这并不仅仅为了打造空间层次感,还为了满足“分享”、“交流”的需求。每个馆中的LED屏与阶梯共同构成了一个讲演空间,供设计大咖与大众进行思想碰撞。陈惠璇表示,树德下一步的考虑,是希望慢慢变成一个生活圈。


未来实体店 体验是重要附加值


除了不同业态的梳理,和不同功能区“刻意”地相间穿插,当下的现代文创生活馆更讲求能让消费者“停留”。


在陈峻佳团队看来,门店可通过设计、通过空间的营造来实现其品牌定位,通过业态的梳理来让其店铺成为各年龄层的消费者愿意停留的空间,成为真正意义上的生活空间、生活场景。“人停留在空间之中便会自然地阅读,而这样的阅读行为会对他人产生影响,形成阅读气氛,让进入空间的每个人能够沉浸其中,享受阅读”。


从设计业界专家看来,沉浸式、体验将是未来文创空间重要一环。在互联网时代,许多人都会通过网上消费、购物,因为网上能买到便宜的产品,因此必须设计一些在网络上难以完成的东西才能吸引人前往实体店,比如靠触摸、良好的场景感会让人产生消费冲动等。如今,有很多新型展厅,设计出阳台、梳妆台等家一样的情景,让你直接体验。


陈惠璇表示,“我们的每个产品都有自己的名字,有自己的故事。设计师在设计产品的时候会将设计与文创相结合,并不只是在做一个普通的产品,而会上升到文化的层面。”她以“香薰”举例,设计师取宋诗“春有百花秋有月,夏有凉风冬有雪”的意象设计了“好时节”系列香薰,在“春夏秋冬”四个套装中,每种香味都代表着某种意象,如秋天套装中有“秋实”、“朗月”等不同香味。


对于未来,陈峻佳说:“我们设计出具有视觉冲击的东西也是一种体验,令人看起来会感觉好玩。未来,实体店潮流肯定会往这个方向靠拢,让人觉得这个地方有附加值,而且符合80、90后的新型设计会越来越多。”