• 项目
首页>>文章列表
文章列表

2019年第三批新能源车目录公布,奥迪一款车未获得国家补贴

2019年4月8日,工业和信息化部在官网发布了第318批《道路机动车辆生产企业及产品公告》。本批公告中还发布了《新能源汽车推广应用推荐车型目录(2019年第3批)》,共包括67户企业的178个车型,其中纯电动产品共64户企业164个型号、插电式混合动力产品共6户企业11个型号、燃料电池产品共3户企业3个型号。


根据2019年新能源车补贴新政策:从2019年起,符合公告要求但未达到2019年补贴技术条件的车型产品也纳入推荐车型目录。此次,已经开始出现不享受补贴的进入目录车型。


同时,新补贴政策中对于纯电动乘用车的补贴档位调整为:400公里及以上补贴2.5万元、250-400公里补贴1.8万元。因此,此批新能源车目录中不少车型的续航里程参数精准地“卡”在了400公里档次。例如,山西新能源汽车工业有限公司帝豪牌编号为JHC7002BEV25、JHC7002BEV26的两款纯电动轿车。


根据公告,奥迪一款纯电动轿车未获得国家补贴,原因是其电池能量密度未达标,纯电动乘用车技术指标要求——纯电动乘用车动力电池系统的质量能量密度不低于125Wh/kg,而该车型为121Wh/kg。



2019年的第3批目录面对新补贴阶段的市场要求,续航500公里和电池密度超170Wh/kg的乘用车车型都有推出。


根据乘联会提供的综合数据来看,2019年第三批新能源车目录电池系统能量密度超过160Wh/kg的纯电动车用车占比达41%,今年前两批目录占比分别为33%、40%。而2018年的新能源车目录中仅有10%的车型电池能量密度高于160Wh/kg。


例如,上汽大通牌 SH6481N1BEV纯电动多用途乘用车电池系统能量密度达到164.8Wh/kg;比亚迪牌 BYD7003BEV6纯电动轿车电池系统能量密度达到160Wh/kg;广汽传祺牌 GAM7000BEVA0E纯电动轿车电池系统能量密度更达到了170Wh/kg。


除此以外,2019年第3批乘用车电池系统能量密度高于120Wh/kg的占到100%,140Wh/kg以上占到90%。


本批目录中续航里程为250-299公里的纯电动乘用车为3款,占比7%;300-399公里的为17款,占比40%;400公里以上的为22款,占比52%。其中,续航最低的纯电动车型为宝骏牌 LZW7002EVBHW纯电动轿车,恰好卡在了“250公里”补贴最低要求档位,10.9%的电耗系数也为本批最低水平。


乘联会秘书长崔东树分析称,本次推出的车型的续航里程普遍在400公里,其中比亚迪达到500公里,续航能力相对较强,而且从电耗系数来看,相对来说都优于平均水平的20%以上,应该能拿到比较高的补贴。


从2019年第3批新能源车目录中可以看出,补贴新政中更高的技术门槛要求对倒逼企业提升技术水平的效果已经显现。

邻家少年美如玉 被珠宝点缀的他们精致又帅气!

日本数学家冈洁:日本教育已让孩子们丧失知性、麻木不仁

日本数学大家,日本文化勋章、学士院奖得主冈洁(1901-1978)

按:此前国内的“禁奥令”(即教育部取消奥赛和升学挂钩的规定)一度引发了教育者和家长们的热议,不少支持者认为,打压奥数在某种程度上可以为学生“减负”,将他们从“应试教育”导向“素质教育”。然而,数学的学习只能通过强压式的计算和逻辑训练进行吗?作为一门强调实用性的学科,数学一定与道德情操的培养无关吗?在日本数学家冈洁先生看来,答案是否定的。他认为,数学不仅是许多自然科学的重要基石,也对一个人的心智和认知发展起着相当大的作用,研究数学靠的不是头脑,而是“情绪”。


冈洁生于二十世纪初,毕业于日本京都帝国大学,以攻克多复变函数论中的“三大难题”知名,为现代数学的发展做出了杰出贡献。由于多年来对数学的狂热追求和不计代价的刻苦钻研,冈洁也被人们称为“日本的阿基米德”。在他的代表性论著《春夜十话》中,除了有关数学的独到见解,也包含了他对日本义务教育的细微考察,以及更多涉及人性深层问题的探讨。冈洁在书中强调,无论是数学还是其他科学,教育的任务应该是通过“情绪认知”启发学生内在的探索意识。若不能习得“健全的情绪”,任何学科都有可能成为破坏人类和谐的利器。这本书中的警世之语,或许可以为解决现今的教育困境提供一个全新的思路。


《春夜十话》

[日] 冈洁 著 林明月 译

人民邮电出版社 2019-02

经出版社授权,界面文化(ID:Booksandfun)从《春夜十话》中节选了冈洁对于日本教育、学生素质和数学发展的部分意见,以期对冈洁逝世近半个世纪后的中国教育者亦有所启迪。


《春夜十话》(节选)


文 | [日]冈洁  译 | 林明月


人的情绪与教育


在日本,无论研究还是教育,似乎都将“人”剔除在外。西方也面临着同样的问题。实际上,研究、教育的主体都是人。所以先从生理学角度去认识人究竟是什么,这是否才应该是各门学科的中心呢?可现在还没有从生理学角度研究人的学科,即便医学也未真正试图从生理学角度研究人。也许医学正以此为目标,但发展的速度已落后太多。


幼儿培养方法和义务教育等方面,最能明显反映出对人了解不足的问题。人是动物,却不只是动物。人是在动物性的砧木上嫁接人性之芽,如同在涩柿的砧木上嫁接甜柿的芽苗。可日本当代教育一心追求芽苗的快速生长与成熟,并不关注嫁接的是什么。倘若任其生长,甜柿芽的生长发育将会受限,茁壮成长的仍是涩柿芽。因为涩柿芽比甜柿芽的生长发育要早得多,所以我们必须防备其成熟期的提前。过早成熟不如推迟成熟,这也是教育的根本原则。


第二次世界大战后,日本义务教育年限延长,但女性的平均初潮年龄却较战前提早了三年。这一现象实在令人担心。我认为这正是人性受到压制,动物性被激发的表现。比方说,牛马的幼仔出生后很快就能行走,但人类出生一年后才能行走。这一年是人类重要的准备期。这样的话,成熟期提早三年,不正意味着人区别于动物的那部分生长得过于仓促吗?(现代医学研究认为,性早熟的女童会表现出高智力、低自我意识的差异,并存在抑郁、社交退缩、攻击性等行为问题。——编者注)人和动物有何不同?我认为人有体贴体察之心,动物没有。人能从动物进化成人,不外乎因为能体察他人情感。而体察他人情感可不是一件易事。观察婴儿的内心成长,最棘手的也是这个部分,他人的情感实在难以洞察。人想要体察他人情感,何止需要几千年,花上无穷的岁月也不嫌多。人在2岁左右才能稍稍理解情感,且仅限于自身。到4岁左右才开始微识他人情感。中间仅有两年的学习时间。要知道,在未能体察他人的微妙情感前,是无法学习道义之根本的。


最近,我的长孙出生了。我期盼他能有一颗慈悲怜悯之心,并能早日感知情感,但他仍处于混沌之中。说起来,所谓素养其实是一种条件反射,约束人的思想行为,令人感觉不自由。可倘若放纵其如杂草般肆意生长,也会令人头疼该不该施以约束管制。


心智有自己的成长期,如同植物的茎、枝、叶的生长也非均衡划一。战争时期大家都种过南瓜,应该清楚茎叶的生长旺盛期不同。但有人却将所有时期混同,在每个时段都密集地去评判孩子是好是坏、有没有能力,根本没认识到孩子自身的成长规律。


日本当代的教育忽略了同情心的培养。由此联想到,最近的青少年犯罪的确具有“无情”这一共性特征。我认为这是动物性萌芽被提早激发的结果。这样的头脑也不适合做学问。夏目漱石的弟子小宫丰隆和寺田寅彦曾咏一组连歌。小宫丰隆吟上句“予水墓上苔,鲸吸水无影”(水やればひたと吸い入る墓の苔),寺田先生接下句“檐下聚蚊蚋,凭空添一柱”(かなめのかげに動く蚊柱)。寺田先生对连歌信手拈来的本领,令小宫先生叹为观止。但勿论其他,一个好的头脑,首先当能如干渴青苔遇水般,对知识鲸吸牛饮。若动物性萌芽发育导致头脑对知识不甚渴望,那么如此庸钝不堪的头脑,根本无法做学问。中学老师近来也称学生具有此类问题,常常冥顽不灵,难以教授知识。


冈洁

现在的年轻人,即便能理解他人的坚强,但又有多少人能理解他人内心的悲戚呢?倘若无视他人的感受,做事多会粗枝大叶,不够细致周到。所谓粗枝大叶,是指全然不在意对方而一味地自以为是。如果毫不在意对方的感受,缺乏细致周到的思虑,必然导致一事无成。长冈半太郎曾提及寺田寅彦先生的细致周到,认为放眼日本文学界,几乎没有文章可与寺田先生的《薮柑子集》媲美,尤其是其中的《团栗》一文。


情绪塑造心智


一般观点认为做学问靠的是头脑,但我认为实际上情绪才是关键。人体的自主神经包括交感神经系统和副交感神经系统,正常情况下两者处于相互平衡制约状态。以我的数学研究为例,倘若交感神经系统活动起主要作用时,则会思绪不畅,蜗步难移。感觉腹腔内脏仿佛被置于板上,肠胃蠕动受到抑制。而当副交感神经系统活动起主要作用时,我反倒文思泉涌,下笔有如神助。只是,此时的肠胃蠕动增强,容易出现腹泻症状。


最近,美国有位医生用狗做实验,切断了狗的交感神经。结果如实验预期,狗出现了腹泻及大肠溃疡等症状。在基本生理方面,人与狗其实相差无几。情感问题可引发腹泻,或许正是因为“情绪中心”同时也是身体的中心吧。情绪中心位于太阳穴深层,大脑皮质下的中脑区域。两侧的神经系统也受该区域控制。这样看来,此处不仅是情绪中心,亦可谓人的中心。


如上所述,人的发育自然也受情绪中心影响,因而培养健全情绪的教育不可不谓头等大事。我并非一味强调情操教育的重要性,更希望大家理解情绪之所以重要,是因为今天的情绪将塑造出明天的心智。当你了解情绪中心切实存在的事实,就应明白所谓的差生不过是情绪中心未能正常发挥作用,因此教师教育培养学生的方法十分重要。另外,由此也可知做学问靠的并不只是能力或者聪明。


日本当代教育令我深感担忧的是,20岁左右的年轻人缺少控制冲动的能力。控制能力主要受大脑前额叶的影响。摘除大脑前额叶,并不影响生命体的存续,但会使人在生活中变得极易冲动。何为冲动?比方说在考试中,未充分理解题目意思便提笔作答就是冲动。所以,现在日本年轻人易冲动的现状,或许也可以称之为大脑前额叶发育不良。大脑发育是西式教育的中心,家长也非常重视大脑的发育。但近来日本教育的重心开始向求职方向倾斜,该现象出现时间不长,原因也暂未明确。总而言之,教育的结果以大脑前额叶发育不良的形式呈现出来。也许再过不久,整个日本民族都将面临同样的问题。虽然我希望能彻底改变教育,但教育改革如同大型轮船用网拖着日式老木船,欲速则不达,须平流缓进。因此,必须首先改变年青的一代。为了减少他们成为社会中坚力量时的麻烦,认真培养下一代无疑是不二选择。想要避免将来可能发生的混乱,就必须从现在开始养成不过分拘泥于年龄的习惯。倘若事事都以年长者为先,必将引起诸多麻烦。


回到前面提到的副交感神经系统。一般情况下,我们沉醉于游戏或热衷于某件事情时,都是副交感神经系统在发挥作用。这种主动沉浸的状态非常重要,因此即便学校创造了接受教育的机会,但接下来如何发展唯有靠自己。战争时期,日本的孩子被剥夺了玩耍的权利。战争结束后,他们失去了玩耍的天性。这或许是因为大脑缺少了副交感神经系统的配合运作。为何副交感神经如此重要的功能会被人遗忘?那是因为他们不了解人的中心在情绪之中。


不仅教育,日语中也存在同样的问题。今年二月,我第二个孙子出生。他们让我给取个名字,可我思来想去实在不想只在当用汉字(日本的国语措施之一。由汉字中使用率高的字构成,作为公文和媒体等文字的表示范围之用)中挑选。尽管其中也有人名用汉字选项,但皆为“虎”“熊”“鹿”之类。当用汉字基本都是含义十分具象的汉字,表达情绪气氛类的汉字早已被剔除在外。


我十分属意“悠久”一词。可当用汉字中只有“久”,并无表达跨越时间之感的“悠”。我第二个孙子出生于二月,本想用“萌”字表达发芽萌出之意,可惜当用汉字中亦无此字。


如果你想详尽描述某件东西,其实日语多有不便,不是最佳选择。若追求简洁明了,只怕世上无任何一种语言能够胜任。所谓简洁明了,应呈水流之势。所以我不赞同削减具有气势的动词或改变它们的灵活用法。总之,将表达感官的汉字悉数剔除在外,也是对“情绪与人性”的一种忽视。


冈洁

情操与智力之光


我认为无论是理想还是理想所指的真善美,都不属于理性世界,它们只是与我们的世界存在联系,并能让我们获得一种实在感。借用芥川龙之介的“永恒之影”(悠久なものの影)一词来形容,可谓恰如其分。我也想找寻词语描绘理想的形态,可惜并无发现。自古以来,为捕捉理想形态奉献一生的人不胜枚举。其实这一事实恰好证明了理想的本质,即真善美的本质是实在感。对此,我深有同感。


理想拥有惊人的吸引力,虽然无法被清晰看到,但却总能让人感受到它的存在。这种吸引力,仿佛能使一个与母亲从未谋面的孩子,在寻母途中很快判断出所遇之人是不是母亲。所以,理想的基调是“怀念”的情操。用理想之眼观察,才能快速察觉自己判断、行为上的偏差。可以说,理想、理念的高度决定了品格的高度。


真善美中最容易理解的是美,美也确实存在。我常去美术馆看展览,乐于在其中寻找美的实感。有时,我也会在数学研讨会上带领学生去美术馆感受美,因为我想让他们明白艺术是数学最好的同伴。参观的时候,我总能碰上一些画作令我感受到美的存在。美近在咫尺,却无法道明,甚至无以言表。越是追求真善美,越难看透其本质。如果能让普罗大众明白这种感觉,那已是文化上的巨大飞跃。


在数学领域,为了朝理想更进一步,数学家细致打探了通往理想的入口,即加强了对自然的观察。这也是20世纪数学世界的一大特征。虽然无法断言数学的各个领域都出现了这样的变化,而且由于20世纪战争频发,数学各个领域皆未展现出十分明确的形态,但整体上确实有这样的倾向。所以,如果能在心中搭建出数学化的自然,并用知性的眼睛去观察自然,那么就可以去研究数学。能否在心中搭建数学化的自然完全依仗情操,所以不管怎么强调培养良好情操的重要性都不为过。像小学三四年级就是培养情操的最好时机。若能拥有“回归人性”(心的故乡)情操,自然能够形成鲜活的理念与理想。


作为一名数学教学工作者,我想对负责高中之前的教育工作者提出一点建议。无论何时,数学的第一属性都是“确定性”。所以若有人询问结论的确定性时,请确凿地回答是或不是。若非如此,后面的学习将无法继续,因为只有依仗结论的确定性,才能进一步探索前进。就像走路,当你迈出左脚后,身体的重量会全部落在左脚上,再迈出右脚时,重量又将完全转移到右脚上。科学的学习方法就是如此,必须一步一个脚印地踏实前行。不过能否掌握科学的学习方法与小智小慧无关,关键是道义。不成“人”,何谈学问?


在室内读书,如果光线不足,那么书上的内容也难看清楚。这里的光线,其实就是“智力”。近来,日本学生的智力之光变得十分暗淡,他们甚至不清楚自己是否弄懂了。忘记了小学学习的道义,忘记了高中老师教授的理性,智力之光怎能不暗淡?我试着用比较法去衡量近来学生智力之光的衰退程度,发现明明只要具有一般智力就能立刻完成的事情,当今学生的完成速度竟大大落后于我这个年代的人。


为了明确上文的“立刻”具体是多久,我用掐秒表的方式记录了我和朋友中谷宇吉郎的对连句用时。宇吉郎先吟“近秋灼日下,桶内存物华”(初秋や桶に生けたる残り花),我用了十秒对出“已近夕阳斜,但闻饮水花”(西日こぼるとりむずの音)。宇吉郎继续吟上句“秋日静海深,碧霄云已远”(秋の海雲なき空に続きけり),我对出“无迹沙滩白,仰见旖旎光”(足跡もなく白砂の朝)。同样花了十秒。通过这个测试,我搞清楚了“立刻”大约为十秒。可当我们把本应立刻就可作答的问题交给学生们,没想到他们竟然需要三日之久。我反复做了几次实验,但结果始终如一。莫要觉得惊讶,实际情况就是如此。这样算起来,他们只有过去人两万七千分之一的智力。


还有一些本应一望便知的自相矛盾,现在的孩子们不经提醒竟然毫无发觉,他们的智力之光何其暗淡。可以说,知性已完全丧失。我十分担忧,长此以往,即便有人提醒,他们会不会仍然不明就里、麻木不仁?出现这个问题全拜日本教育所赐。明明尚未弄清自己是否懂了,但凡别人问起,就立马颔首表达自己已明了。也正因为如此,我才希望能改变教育的根本。

碧桂园助力首届“大湾区智能生活”科创大赛 搭建湾区科技合作桥梁

来自香港大学的参赛队伍凭借“炒菜机器人Alphacook”提案获得冠军,来自香港理工大学的参赛队伍凭借“闪购”“优你农庄”分别获得亚军、季军。另外,来自香港专业教育教育学院的Bed Men、Eldventure两支队伍获优异奖。


聚焦未来智能生活 青年才俊创意多


在《粤港澳大湾区发展规划纲要》中,香港被列入创新科技走廊建设的重要城市之一,将于广州、深圳、澳门共建粤港澳大湾区大数据中心和国际化创新平台。为帮助香港青年更好地落地科创想法,挖掘香港的优秀科技人才,碧桂园集团在去年10月联合举办了首届“大湾区智能生活”创科提案比赛。


参赛选手与颁奖嘉宾互动

在近6个月时间里,来自香港理工大学、香港大学、香港科技大学等高校的30支参赛队伍,围绕衣食住行发挥科技想象力,为未来智慧城市的建造出谋划策。其中,来自香港大学的容晓康凭借“炒菜机器人Alphacook”获得冠军,来自香港理工大学的连钧浩、杨锦微团队,以智能购物车“闪购”获得亚军;吴汉燊、梁明慧、聂敬洪团队以推动城市农业发展的“优你农庄”获得季军;另外,来自香港专业教育学院的Bed Men、Eldventure两支队伍分别以传承分享历史的《耆秒历程》APP、智能婴儿车获得优异奖。


这些脑洞大开的奇思妙想都非常贴近生活,体现了香港新一代青年的想象力、创造力。提出“炒菜机器人Alphacook”的参赛同学容晓康介绍,如今香港的餐饮业人力成本昂贵,同时还面临着质量不稳定、食品安全等不可控等因素的挑战。为此,他希望可以通过研发炒菜机器人促使餐饮行业降低人力成本的比重,更好地关注食材品质。他希望炒菜机器人可以先应用于快餐店、外卖店、便利店等餐饮场景。


“此次参赛选手的创意都是超水平发挥,竞争很激烈。”香港资讯科技商会荣誉会长方保侨评价,“这次获奖的作品,既具有原创概念,另外具备实操性、可落地性,可以真正融入生活。”


探讨科创生活新理念 鼓励科技成果落地


颁奖典礼上,现场嘉宾还一同围绕“大湾区智慧生活”进行了探讨和分享。


智慧城市联盟副会长杨文锐表示,“智慧城市是将生活与工作的流程重新定义,大数据、物联网等科技都能帮助我们的生活更加便利。未来,香港年轻人会有更多的发挥空间。”


“在发展智能化的同时,我们还应考虑智能环保后面所产生的问题,追得上智能时代的法律规范。”港科院院士黄乃正教授表示,“智能化的发展还应注重设计人性化,坚持以人为本,多融入人文精神,尊重环保与自然。


“参赛选手的这些提案都非常具有想象力和创新力,也带给我们很多启发和思考。”碧桂园集团品牌管理部总经理郑岚表示,“香港是一个活力之城,拥有很多科技人才。未来期待这些创意可以生根发芽开花结果,推动构建大湾区智慧城市更加美好的未来。”


颁奖嘉宾合影

如今,香港青年的创业热情与日俱增。香港投资推广署发布的数据显示,2018年,香港的初创公司去年增长至2625家,按年增长18%,创新创业气氛渐浓。


比赛期间,参赛队伍曾前往碧桂园潼湖科技小镇等大湾区科创基地参观考察,收获颇多。“现在香港的创业氛围越来越浓,正是需要见识和学习的时候。”容晓康提到,参观了碧桂园潼湖小镇后,了解到很多关于科技新思路,打开了新的世界,这对于落地“炒菜机器人”项目有着很大的帮助。


作为一家为全世界创造美好生活产品的高科技综合性企业,碧桂园集团一直积极致力于融入粤港澳大湾区高科技产业,助力大湾区科技发展。在惠州,碧桂园建设了潼湖科技小镇,打造物联网、大数据、云计算等产业亮点。在顺德,碧桂园及其旗下公司正在发力建设机器人谷等产业项目。今年2月,碧桂园集团旗下的博智林机器人公司与香港科技大学达成合作,将共建联合研究院,积极探索人工智能与机器人领域科技创新成果转化应用新模式。

新氧正式赴美IPO,这家互联网医美平台年营收增幅为138%

北京时间4月9日凌晨,北京新氧科技有限公司(下称“新氧科技”或“新氧”)向美国证券交易委员会(SEC)提交招股说明书,拟在纳斯达克上市,代码为SY。


新氧科技此次承销商为德意志银行和中金公司,但公司暂未在招股说明书中透露发行数量、发行价格区间等信息。


新氧科技招股书显示,公司近三年营收规模实现跨级式增长,其总营收从2016年0.49亿元先跃升至2017年的2.59亿元,增速高达428%;2018年总营收进一步增长138%至6.17亿元(约合8980万美元)。


净利润表现方面,作为一家成立不到6年的互联网医美服务平台创业公司,新氧科技2018年实现净利润5508万元,同比大幅增长220%。


新氧此前已是互联网医疗领域的一只独角兽。其最近一次资本运作发生在2018年9月,完成7000万美元E轮融资,由兰馨亚洲投资集团领投,中银国际控股有限公司、中俄投资基金、经纬中国跟投。


目前,新氧业务覆盖中国超过300个城市,吸引近4000家认证医美机构供用户选择,主要包括医院、门诊部和诊所。此外,新氧覆盖包含齿科在内的消费医疗机构总数接近6000家。平台现已积累超过200万篇基于用户黏性的“美丽日记”。


在流量和转化问题上,招股书显示2018年第四季度,新氧通过社交媒体网络和特定的媒体平台传播的内容,平均每月有超过2.4亿的观看量。据弗若斯特沙利文调研,2018年新氧手机app占线上医美服务手机app用户每日使用总时长的84.1%。


2018年,通过新氧平台促成的医美服务交易总额为21亿元,占当年线上预约医美服务交易总额的33.1%。


中国的医美服务行业规模巨大且增长迅速。弗若斯特沙利文数据显示,2018年医美服务行业总收入规模达到1217亿元,2014年至2018年的年均复合增长率为23.6%,预计行业收入规模到2023年将达到3601亿元,2018年至2023年的年均复合增长率进一步提高至24.2%。


伴随着行业的快速增长,中国已经成为全球发展最快的医美服务市场之一,2017年市场规模排名全球第二,到2021年有望成为全球最大的医美服务市场。


尽管面对蓝海市场,互联网医美平台要解决的痛点并未因此减少。传统医美行业获客成本极高,有相关从业者透露平均6000元/人。医美平台在整合行业资源、提供咨询和预约服务以外,还必须减少信息不对称、提高产业透明度,为消费者做决策降低难度,才有可能提高转化率。


新氧的解决方案是一边加强机构的信息收集,通过招收医学专业人才对内容严厉把关;另一边利用社区中用户分享的真人医美日记,提高用户黏性。


显然,对于这样一个试错成本极高的行业,新氧要做的远远不止于此。而对于一家即将赴美上市的医美O2O平台,面对可见的竞争压力,它仍将探索更多商业模式的可能性。


新氧创始人、CEO 金星

在新氧创始人、CEO金星眼里,新氧从成立之初便不仅仅局限于“医美”领域。


他曾在接受媒体采访时表示,综合性电商平台例如淘宝、京东,都拥有绝对流量、亿级用户,它们所做的是不停地拓品类,追求流量的转化率,是追求广度;而医美消费决策门槛更高,所以新氧追求的是对每个用户整体的服务深度。


这样一个仍存在想象空间的科技公司,纳斯达克也许会喜欢。

金准产业研究 人工智能产业深度研究——半导体篇(上)

前言

目前人工智能芯片仍多是以GPU, 张量处理器, 或FPGA+CPU 为主, 但未来ASIC将在边缘运算及设备端遍地开花,及逐步渗透云端市场,预估全球AI云端半导体市场于2018-2025年CAGR应有 37%,边缘运算及设备端半导体市场于2018-2025年CAGR应有 249%, 远超过全球半导体市场在同时间CAGR的5%, 占整体份额从2018年的1% 到2025年的10%,超过10倍数增长可期。

一、人工智能平台到底是工具还是应用?

人工智能平台包括芯片,模组,软件在一般人看起来像是一种新型应用但在我们看来人工智能芯片在整合软硬件后将成为各种物联网应用的提升效能工具平台这就像我们常用的微软Office软件微软Office软件是我们在办公室应付各种应用的生财工具因此人工智能平台除了被广泛利用在云端大数据的深度学习训练和推断外我们认为人工智能平台也将出现在各式各样的应用端的边缘设备,从英伟达公布的数字来看,早在2016年,公司就累计了7大领域高等教育,发展工具,互联网,自驾车,金融,政府,生命科学19439客户使用其深度学习的服务工具配合软件和之前在云端大数据的深度学习训练和推断的数据成果库来达到帮助使用者或取代使用者来执行更佳的智能判断推理。

虽然目前人工智能芯片仍多是以昂贵的图形处理器GPU),张量处理器Tensor Processing Unit),或现场可编程门阵列芯片配合中央处理器FPGA+CPU为主来用在云端的深度学习训练和推理的数据中心但未来特定用途集成电路ASIC将在边缘运算及设备端所需推理及训练设备遍地开花,及逐步渗透部分云端市场,成为人工智能芯片未来的成长动能我们预估全球人工智能云端半导体市场于2018-2025年复合成长率应有37%,边缘运算及设备端半导体市场于2018-2025年复合成长率应有249%请参考图表),远超过全球半导体市场在同时间的复合成长率的5%整体约占全球半导体市场的份额从2018年的1%到2025年的10%。

二、人工智能会渗入各领域应用-无所不在

当大多数的产业研究机构把自驾车Autonomous drive vehicle),虚拟/扩增实境Virtual Reality/Augmented Reality),无人商店Unmanned store),安防智能监控Smart Surveillance System),智能医疗,智能城市,和智能亿物联网Internet of ThingsIoT分别当作半导体产业不同的驱动引擎国金半导体研究团队认为其实自驾/电动车5G虚拟/扩增实境无人商店安防智能监控智能医疗,智能城市其实都只是人工智能亿物联网的延伸。

2.1无人驾驶/电动/联网车对半导体的需求爆增10

虽然全球汽车半导体产业,目前由传统的整合元件制造商IDM掌控,但未来很难说,主要是因为先进辅助或自动驾驶系统兴起,人工智能,摄像,传感,雷达芯片公司的出现。像英伟达图形处理器Xavier,Pegasus320,谷歌张量处理器Tensor Processing Unit,英特尔/Alt era/Mobil eye的CPU/FPGA/AI解决方案,地平线L3/L4自动驾驶Matrix1.0平台,征程2.0芯片),高通,联发科,华为/海思的5G无线通信平台及毫米波雷达,索尼,豪威的传感器,博通及瑞昱的以太网络芯片。尤其是自动驾驶对雷达,摄像头,传感器及芯片的3倍增幅千倍的3D视频数据的上传及云端的存储学习推理因无人驾驶车设备及云端建制成本高昂US$150000/Way mo车),额外成本必须由广大消费者共同分摊费用较有利,乘坐共享公交服务业产品运送的后勤支援业无人驾驶应会领先乘用车市场,而Way mo/谷歌将带动出租车/公交车自动驾驶市场,领先英伟达的自驾乘用车市场请参阅国金电动,无人驾驶,车联网的三部曲驱动力的深度报告),依照美国加州DMVDepartment of Moter Vehicles最新公布的资料显示Way mo于去年测试的120万英里中,每1000英里发生解除自驾系统状况频率是0.09次,运低于前年的0.179次,及通用Cruise的0.19次,苹果的872次,及Uber的2860次自动泊车、车道偏离检测、无人驾驶的带宽需求,及车内电线费用和重量的不断增加。为了让增加数倍的电子控制单元ECU能彼此间快速地沟通数倍的以太网路节点和转换器芯片需求便随之而来。

2.2无人商店及安防智能监控

除了自动驾车联网外最近风起云涌的无人商店和智能监控不也是利用大量监控摄像头配合三维人脸辨识系统二维码/近场通讯来收集大数据资料再透过WiFi/xDSL/光纤传输将资料送到云端人工智能储存与处理来达到无需柜台人员的无人商店和能随时辨识的视频智能监控而政府机关可透过此系统来调查人口移动来重新设计城市智能公共交通系统协寻通缉犯恐怖分子失踪人口及在展场车站机场学校大型活动场地的安全监护系统整合业者除可做无人商店外也可靠着人口动向来预测消费热点商家必备),人口居住热点房地产业必备),如果再配合无人商店,线上购物系统,和政府的大数据系统业者便可更精准的投送广告发展个人信用评级。类似于自驾车联网无人店和监控联网系统需要大量并且高清晰度的三维辨识摄像头和芯片传输系统和芯片和庞大的云端,边缘运算,及设备端的储存及智能训练及推理的各式高速芯片及软件。

2.3智能医疗

智能医疗系统可利用三维脸部个人辨识来挂号减少排队时间让看诊更顺畅。医院可收集资料并整合个人在不同医疗院所的所有医疗纪录医生可利用人工智能数据平台辅助做更精准的医疗判断减少重复用药的浪费和对病人的副作用医院可利用此大数据资料做更深入的医学研究数家政府医院应先抛砖引玉带头做整合。

2.4智能亿物联网

(1) 空污,水污染化学感测物联网政府是否应利用强制安装并定期检验各式气体/液体的物联网化学感测器在每部汽、机车和工厂排污管道上再透过大量的低耗能无线通讯将资料上传到云端储存和处理并透过人工智能来监测空污水污来收取空污或水污税

(2) 身份识别证明联网大型互联网企业像谷歌Googl US),百度Baidu US),腾讯00700.HK),或海康威视002415.SZ为何不能发展三维脸部个人辨识智能系统来整合所有的线上线下购物启动驾驶银行转帐/汇款/提款进入手机/电脑/应用App和政府机关办事所需要的身份证明。您可否想过你现在要纪录多少密码多少使用者名称身上带着多少付款软体银行卡,信用卡钞票居民身分证交通卡,驾照护照居民健康卡电梯卡加油卡金融社保卡大卖场会员证和各式通行卡

(3) 同步翻译连网目前先进智能芯片/软体的语音辨识速度太慢和不够精准的理解与翻译应是语言同步翻译机仍未大卖的主因但透过更高速的智能芯片无线通讯芯片和更庞大的语音数据库来训练云和端的人工智能的推理反应相信未来国际多种语言的零障碍沟通将指日可待

(4) 人工智能教师和消费机器人当把强大的人工智能导入到人工智能教师和消费机器人联网物中透过不断的反覆学习这不但可提升学生的教育水平和兴趣未来都能解决老人及残障人士的健康照顾清洁饮食娱乐保全等需求减少后代的负担及外佣虐老事件也明显能提升老人和残障人士的寿命和生活品质。

三、三种主流人工智能演算法

最早的人工智能出现及运用在1950-1980年代,接着转换到1980-2010年机器学习,从2010年以后,随着各种演算法CNNsRNNsDNNs等图影像视觉学习,辨识,推理的普及,让深入人工智能深入学习的突飞猛进。深度学习是人工智能和机器学习的一个子集,它使用多层人工神经网络在诸如对象检测,语音识别,语言翻译等任务中提供最先进的准确性。深度学习与传统的机器学习技术的不同之处在于,它们可以自动学习图像,视频或文本等数据的表示,而无需引入手工编码规则或人类领域知识。它们高度灵活的架构可以直接从原始数据中学习,并在提供更多数据时提高其预测准确性。人工智能的深度学习最近取得的许多突破,例如谷歌Deep Mind的AlphaGo及更强大的Alpha Zero陆续在围棋,西洋棋类比赛夺冠,谷歌Waymo英伟达的Xavier/Pegasus320Intel/Mobil eye的Eye4/5自动驾驶汽车解决方案,亚马逊的Alexa谷歌的Google Assistant苹果Siri,微软的Cortana及三星的Bixby智能语音助手等等。借助加速的深度学习框架,研究人员和数据科学家可以显着加快深度学习培训,可以从数天或数周的学习缩短到数小时。当模型可以部署时,开发人员可以依靠人工智能芯片加速的推理平台来实现云,边缘运算设备或自动驾驶汽车,为大多数计算密集型深度神经网络提供高性能,低延迟的推理。

3.1卷积神经网络CNNsConvolutional Neural Networks

卷积神经网络CNN是建立在模拟人类的视觉系统,并透过图影像分类模型的突破,也将是,主要来自于发现可以用于逐步提取图影像内容的更高和更高级别的表示。CNN是将图像的原始像素数据作为输入,并‚学习‛如何提取这些特征,并最终推断它们构成的对象。首先,CNN接收输入特征图三维矩阵,其中前两个维度的大小对应于图像的长度和宽度以像素为单位,第三维的大小为3对应于彩色图像的3个通道红色,绿色和蓝色CNN包括一堆模块,每个模块执行三个操作。举例而言,卷积将3x3过滤贴图的9个条件0,1套用先乘后求和以获得单个值5x5输入特征贴图的9个像素特征上,而得出3x3全新的卷积输出特征贴图。在每次卷积操作之后,会采用最大池演算法Max poolingCNN对卷积特征贴图进行下采样以节省处理时间,同时仍保留最关键的特征信息,最大池化是要从特征贴图上滑动并提取指定大小的图块2x2,对于每个图块,最大值将输出到新的特征贴图,并丢弃所有其他值。在卷积神经网络的末端是一个或多个完全连接的层,完全连接的层将一层中的每个神经元连接到另一层中的每个神经元。它原则上与多层感知器神经网络multi-layer perceptron neural networkMLP类似,他们的工作是根据卷积提取的特征进行分类,CNN可以包含更多或更少数量的卷积模块,以及更多或更少的完全连接层,工程师经常试验要找出能够为他们的模型产生最佳结果的配置。总之,CNN专门于图影像处理如自动驾驶汽车,安防,人脸辨识,及疾病图像辨识解决方案。

3.2循环神经网络RNNsRecurrent Neural Network

RNN是一类人工听觉及说话的神经网络,具有记忆或反馈回路,可以更好地识别数据中的模式。RNN是常规人工神经网络的扩展,它增加了将神经网络的隐藏层送回自身的连接-这些被称为循环连接。循环连接提供了一个循环网络,不仅可以看到它提供的当前数据样本,还可以看到它以前的隐藏状态。具有反馈回路的循环网络可以被视为神经网络的多个副本,其中一个的输出用作下一个的输入。与传统的神经网络不同,循环网络使用他们对过去事件的理解来处理输入向量,而不是每次都从头开始。当正在处理数据序列以进行分类决策或回归估计时,RNN特别有用,循环神经网络通常用于解决与时间序列数据相关的任务。不同于CNN专门于图影像处理,循环神经网络的应用包括自然语言处理,语音识别,机器翻译,字符级语言建模,图像分类,图像字幕,股票预测和金融工程。机器翻译是指使用机器将一种语言的源序列句子,段落,文档翻译成相应的目标序列或另一种语言的矢量。由于一个源句可以以许多不同的方式翻译,因此翻译基本上是一对多的,并且翻译功能被建模为有条件而非确定性。在神经机器翻译NMT中,我们让神经网络学习如何从数据而不是从一组设计规则进行翻译。由于我们处理时间序列数据,其中语境的上下文和顺序很重要,因此NMT的首选网络是递循环神经网络。可以使用称为注意的技术来增强NMT,这有助于模型将其焦点转移到输入的重要部分并改进预测过程。举两RNN的例子,为了跟踪你的自助餐厅主菜的哪一天,每周在同一天运行同一菜的严格时间表。如周一的汉堡包,周二的咖喱饭,周三的披萨,周四的生鱼片寿司和周五的意大利面。使用RNN,如果输出‚生鱼片寿司‛被反馈到网络中以确定星期五的菜肴,那么RNN将知道序列中的下一个主菜是意大利面因为它已经知道有订单而周四的菜刚刚发生,所以星期五的菜是下一个。另一个例子是如果我跑了10英里,需要喝一杯什么?人类可以根据过去的经验想出如何填补空白。由于RNN的记忆功能,可以预测接下来会发生什么,因为它可能有足够的训练记忆,类似这样的句子以‚水‛结束以完成答案。

3.3深度神经网络DNNsDeep Neural Network

DNN在视觉,语言理解和语音识别等领域取得了关键突破。为了实现高精度,需要大量数据和以后的计算能力来训练这些网络,但这些也带来了新的挑战。特别是DNN可能容易受到分类中的对抗性示例,强化学习中遗忘任务,生成建模中的模式崩溃的影响以及过长的运算时间。为了构建更好,更强大的基于DNN的系统,是能否有效地确定两个神经网络学习的表示何时相同?我们看到的两个具体应用是比较不同网络学习的表示,并解释DNN中隐藏层所学习的表示。设置的关键是将DNN中的每个神经元解释为激活向量,神经元的激活矢量是它在输入数据上产生的标量输出。例如,对于50个输入图像,DNN中的神经元将输出50个标量值,编码它对每个输入的响应量。然后,这50个标量值构成神经元的激活矢量。因为深度神经网路的规模即层数和每层的节点数,学习率,初始权重等众多参数都需要考虑。扫描所有参数由于时间代价的原因并不可行,因而小批次训练微型配料,即将多个训练样本组合进行训练而不是每次只使用一个样本进行训练,被用于加速模型训练。而最显著地速度提升来自GPU,因为矩阵和向量计算非常适合使用GPU实现。但使用大规模集群进行深度神经网路训练仍然存在困难,因而深度神经网路在训练并列化方面仍有提升的空间。

四、到底哪种人工智能芯片将成云计算的主流?

深度学习是一种需要训练的多层次大型神经网络结构请参考图表,其每层节点相当于一个可以解决不同问题的机器学习。利用这种深层非线性的网络结构,深度学习可以从少数样本展现强大的学习数据集本质特征的能力。简单来说,深度学习神经网络对数据的处理方式和学习方式与人类大脑的神经元更加相似和准确。谷歌的阿法狗也是先学会了如何下围棋,然后不断地与自己下棋,训练自己的深度学习神经网络更厉害的阿法零Alpha Zero透过更精准的节点参数不用先进行预先学习就能自我演化训练学习。深度学习模型需要通过大量的数据训练才能获得理想的效果训练数据的稀缺使得深度学习人工智能在过去没能成为人工智能应用领域的主流算法。但随着技术的成熟,加上各种行动、固定通讯设备、无人驾驶交通工具可穿戴科技各式行动、固定监控感测系统能互相连接与沟通的亿物联网,骤然爆发的大数据满足了深度学习算法对于训练数据量的要求。

训练和推理所需要的神经网络运算类型不同。神经网络分为前向传播Forward algorithm其中包括输入层隠藏层输出层和后向传播Backward algorithm主要指的是梯度运算两者都包含大量并行运算。训练同时需要前向和后向传播推理则主要是前向传播。一般而言训练过程相比于推理过程计算量体更大。云端人工智能系统透过海量的数据集和调整参数优化来负责训练和推理,边缘运算终端人工智能设备负责推理。推理可在云端进行,也可以在边缘运算端或设备端进行。等待模型训练完成后,将训练完成的模型主要是各种通过训练得到的参数用于各种应用。应用过程主要包含大量的乘累加矩阵运算,并行计算量很大,但和训练过程比参数相对固定,不需要大数据支撑,除在云端实现外,也可以在边缘运算端实现。推理所需参数可由云端训练完毕后,定期下载更新到应用终端。

4.1在深度学习半导体领域里,最重要的是数据和运算

谁的晶体管数量多,芯片面积大谁就会运算快和占据优势。因此,在处理器的选择上,可以用于通用基础计算且运算速率更快的GPU迅速成为人工智能计算的主流芯片根据美国应用材料的公开资料请参考图表),英伟达的人工智能逻辑芯片配合英特尔的中央处理器服务器芯片面积达7432mm2,是不具人工智能的企业用和大数据服务器的八倍或谷歌专用张量处理器人工智能服务器的三倍多存储器耗用面积32512mm2是其他服务器的三倍以上。可以说,在过去的几年,尤其是2015年以来,人工智能大爆发就是由于英伟达公司的图形处理器得到云端主流人工智能的应用。但未来因为各个处理器的特性不同我们认为英伟达的图形处理器GPU和谷歌的张量处理器仍能主导通用性云端人工智能深度学习系统的训练可编程芯片FPGA的低功耗及低延迟性应有利于主导云端人工智能深度学习系统的推理,而特殊用途集成电路ASIC未来将主导边缘运算及设备端的训练及推理,但因为成本,运算速度,及耗电优势,也会逐步侵入某些特殊应用人工智能云端服务器市场,抢下训练及推理运算的一席之地以下就先列出各种处理器在云端人工智能系统的优缺点

4.2中央处理器CPU

X86和ARM在内的传统CPU处理器架构往往需要数百甚至上千条指令才能完成一个神经元的处理,但对于并不需要太多的程序指令,却需要海量数据运算的深度学习的计算需求,这种结构就显得不佳。中央处理器CPU需要很强的处理不同类型数据的计算能力以及处理分支与跳转的逻辑判断能力,这些都使得CPU的内部结构异常复杂现在CPU可以达到64bit双精度,执行双精度浮点源计算加法和乘法只需要1~3个时钟周期,时钟周期频率达到1.532~3gigahertz。CPU拥有专为顺序逻辑处理而优化的几个核心组成的串行架构,这决定了其更擅长逻辑控制、串行运算与通用类型数据运算当前最顶级的CPU只有6核或者8核,但是普通级别的GPU就包含了成百上千个处理单元,因此CPU对于影像,视频计算中大量的重复处理过程有着天生的弱势。

4.3图形处理器GPU仍主导云端人工智能深入学习及训练

最初是用在计算机、工作站、游戏机和一些移动设备上运行绘图运算工作的微处理器但其海量数据并行运算的能力与深度学习需求不谋而合,因此,被最先引入深度学习。GPU只需要进行高速运算而不需要逻辑判断。GPU具备高效的浮点算数运算单元和简化的逻辑控制单元,把串行访问拆分成多个简单的并行访问,并同时运算。例如,在CPU上只有20-30%的晶体管内存存储器DRAM dynamic random access memory缓存静态随机存储器Cache SRAM控制器controller占了其余的70-80%晶体管是用作计算的,但反过来说GPU上有70-80%的晶体管是由上千个高效小核心组成的大规模并行计算架构DRAM和微小的Cache SRAMcontroller占了剩下的20-30%晶体管。大部分控制电路相对简单,且对Cache的需求小,只有小部分晶体管来完成实际的运算工作,至于其他的晶体管可以组成各类专用电路、多条流水线,使得GPU拥有了更强大的处理浮点运算的能力。这决定了其更擅长处理多重任务,尤其是没有技术含量的重复性工作。不同于超威及英特尔的GPU芯片,英伟达的人工智能芯片具有CUDA的配合软件是其领先人工智能市场的主要因素。CUDA编程工具包让开发者可以轻松编程屏幕上的每一个像素。在CUDA发布之前,GPU编程对程序员来说是一件苦差事,因为这涉及到编写大量低层面的机器码。CUDA在经过了英伟达的多年开发和改善之后,成功将Java或C++这样的高级语言开放给了GPU编程,从而让GPU编程变得更加轻松简单,研究者也可以更快更便宜地开发他们的深度学习模型。因此我们认为目前英伟达价值6000/7500-9300/10500美元的图形处理器加速卡TeslaV100PCIe/SXM2640Tensor核心5120CUDA核心或配备8/16颗V100的DGX-1/H-2系统180000-360000美元,配合其CUDA软件及NV Link快速通道,能达到近125兆次深入学习的浮点运算训练速度TERAFLOPS),16bit的半精度浮点性能来看,可达到31TeraFLOPS32bit的单精度浮点性能可达到15.7TeraFLOPS64bit的双精度可达到7.8TeraFLOPS,210亿个晶体管台积电12纳米制程工艺,815mm2芯片大小,仍然是目前云端人工智能深入学习及训练的最佳通用型解决方案但未来会受到类似于华为海思Ascend-Max910ASIC芯片及Ascend Cluster系统的挑战。

4.4现场可编程门阵列芯片FPGA的优势在低功耗,低延迟性

CPU内核并不擅长浮点运算以及信号处理等工作,将由集成在同一块芯片上的其它可编程内核执行,而GPU与FPGA都以擅长浮点运算着称。FPGA和GPU内都有大量的计算单元,它们的计算能力都很强。在进行人工智能神经网络CNNRNNDNN运算的时候,两者的速度会比CPU快上数十倍以上。但是GPU由于架构固定,硬件原来支持的指令也就固定了,而FPGA则是可编程的,因为它让软件与应用公司能够提供与其竞争对手不同的解决方案,并且能够灵活地针对自己所用的算法修改电路。虽然FPGA比较灵活但其设计资源比GPU受到较大的限制,例如GPU如果想多加几个核心只要增加芯片面积就行,但FPGA一旦型号选定了逻辑资源上限就确定了。而且,FPGA的布线资源也受限制,因为有些线必须要绕很远,不像GPU这样走ASICflow可以随意布线,这也会限制性能。FPGA虽然在浮点运算速度增加芯片面积,及布线的通用性比GPU来得差,却在延迟性及功耗上对GPU有着显着优势。英特尔斥巨资收购Altera是要让FPGA技术为英特尔的发展做贡献。表现在技术路线图上,那就是从现在分立的CPU芯片+分立的FPGA加速芯片20nmArria10GX,过渡到同一封装内的CPU晶片+FPGA晶片,到最终的集成CPU+FPGA系统芯片。预计这几种产品形式将会长期共存,因为CPU和FPGA的分立虽然性能稍差,但灵活性更高。目前来看用于云端的人工智能解决方案是用Xeon CPU来配合Nervana用于云端中间层和边缘运算端设备的低功耗推断解决方案是用Xeon CPU来配合FPGA可编程加速卡。赛灵思Xilinx2018年底推出以低成本,低延迟,高耗能效率的深度神经网络DNN演算法为基础的Alveo加速卡采用台积电16nm制程工艺的Ultra Scale FPGA,预期将拿下不少人工智能数据中心云端推理芯片市场不少的份额。

4.5谷歌张量处理器TPU3强势突围,博通/台积电受惠,可惜不外卖

因为它能加速其人工智能系统Tensor Flow的运行,而且效率也大大超过GPU―Google的深层神经网络就是由Tensor Flow引擎驱动的。谷歌第三代张量处理器TPUTensor Processing Unit大约超过100TeraFLOPS/hp-16bit是专为机器学习由谷歌提供系统设计,博通提供ASIC芯片设计及智财权专利区块,台积电提供16/12纳米制程工艺量身定做的,执行每个操作所需的晶体管数量更少,自然效率更高。TPU每瓦能为机器学习提供比所有商用GPU和FPGA更高的量级指令。TPU是为机器学习应用特别开发,以使芯片在计算精度降低的情况下更耐用,这意味每一个操作只需要更少的晶体管,用更多精密且大功率的机器学习模型,并快速应用这些模型,因此用户便能得到更正确的结果。以谷歌子公司深度思考的阿尔法狗及零AlphaGoAlpha Zero/Deep Mind利用人工智能深度学习训练和推理来打败世界各国排名第一的围棋高手世界排名第一的西洋棋AI程式Stockfish8世界排名第一的日本棋Shogi AI专家,但我们估计Alpha Zero系统使用至少近5大排人工智能主机,5000个张量处理器1280个中央处理单元而让云端的设备异常昂贵且无提供任何的边缘运算端设备。

4.6 ASIC特定用途IC需求即将爆发

即使研发期长初期开发成本高通用性差,但国内芯片业者因缺乏先进x86CPUGPUFPGA的基础设计智慧财产权IPs,可完全客制化,耗电量低,性能强的特定用途ICASIC Application-specific integrated circuit设计就立刻成为国内进入人工智能云端及边缘运算及设备端芯片半导体市场的唯一途径。但因为起步较晚,除了比特大陆的算丰SOPHONBM1680及BM1682云端安防及大数据人工智能推理系列产品已经上市之外,其他公司在云端人工智能训练及推理芯片设计都还停留在纸上谈兵阶段。举例而言,华为海思使用台积电7纳米制程工艺设计的昇腾Ascend910ASIC系列,号称在16bit半精度下能达到256兆次的浮点运算,倍数于英伟达目前最先进的Volta100解决方案台积电12纳米也要等到2H19量产及谷歌最新推出的张量处理器3台积电16/12纳米,。而从智能手机端IP事业切入设计云端芯片的寒武纪,将于2019首发的产品MLU100PCIe智能推理加速卡台积电16纳米在打开稀疏模式时的峰值也可达到64兆次浮点运算16bit半精度。最后可惜的是国内搜寻引擎龙头百度的昆仑芯片818-300采用Samsung14纳米,阿里巴巴的Ali-NPU及亚马逊的Inferentia目前都还没有提供更确实的芯片速度,耗电量,应用,价格,量产时点,及软件框架规格让我们做出更好的比较图表。

五、哪种人工智能芯片将成边缘运算及设备端的主流?

从算法,IP,边缘运算及设备端芯片转换到模块,平台或生态系的战争

谷歌在GoogleCloudNEXT2018活动中首次推出人工智能推断用边缘运算张量处理器Edge Tensor Processing UnitEdge TPU<30mm2具有低功耗,低延迟,高运算效率,其开发版系统模块套件中还包括有恩智浦的CPU图芯的GPU,再配合谷歌开源简易版机器学习框架软件Open-source Tensor Flow Lite,设备端物联网核心运作Edge IoT Core和边缘运算端张量处理器来推动各种应用,像是预测性维护,异常检测,机器视觉,机器人,语音识别医疗保健,零售,智能空间,运输交通等等。

在谷歌的Waymo建立了全球最大的无人驾驶车队后,谷歌再次利用其在深度学习及云端软,硬件的技术领先优势,提供机器学习边缘运算端软件,固件,安卓物联网作业系统及专用半导体芯片整体解决方案模块,让客户对其智能物联网解决方案的黏着度提升,这不但对中国大陆人工智能芯片公司是利空,也对目前主要提供云及边缘运算物联网服务的竞争厂商亚马逊AWS,微软Azure,阿里巴巴造成市场压力。

但是,目前谷歌终端型张量处理器目前只能算是个机器学习的加速器,不能独立运作,其解决方案中还要配合其他半导体公司的芯片,像是恩智浦以安谋为核心的中央处理器,图芯Vivante CorporationGC7000Lite图形处理器请参考图表,我们认为谷歌的解决方案效能比较与量产时间未定。而且,谷歌过去还是主推软件解决方案,自有硬件及半导体的产品上市都是拿来推广其软件及生态系解决方案,其边缘运算型张量处理器硬件规格中,还是使用相对旧的28纳米晶圆代工制程工艺,TeraOPS浮点远算能力,耗电瓦特数,价格等指标都还是未知,来与其他人工智能芯片设计公司的产品来做比较。举例而言,英伟达今年推出的Jetson AGXX avier模块也是瞄准物联网应用端的解决方案,但在其高单价下规格明显胜出。华为即将推出的边缘运算模块Atlas200和Atlas300也相当有竞争力。

从英伟达,谷歌,英特尔,及华为在深入学习边缘运算端解决方案模块及软件与固件的竞争而高通及联发科陆续将人工智能专利区块透过嵌入式整合到其手机应用处理器中,可以看出未来在人工智能端的应用领域已经不再单单是人工智能算法,IP智财权到芯片设计推陈出新的竞争,中国大陆的人工智能算法/IP/芯片龙头公司像寒武纪,地平线为了存活,就必须与应用领域系统公司紧密合作,共同推出更佳的嵌入式或独立式解决方案模块及软,固件,否则就要像谷歌和英伟达一样推出自己整套的解决方案。虽然比特大陆及嘉楠耘智进入人工智能芯片领域较晚,但其在挖矿机业务及挖矿生态系的系统整合经验,反而比只具备算法/IP/芯片的人工智能设计公司还有机会。

六、谁能引领国内人工智能芯片产业突围?

未来因人工智能边缘运算推理端和云端推理Inferencing芯片及设备成本性能,耗电效率的考量以及各种处理器的特性不同我们预期特定用途集成电路ASIC或系统集成电路SoCsystem on chip未来将在设备,边缘运算,及云端推理市场和设备,边缘运算,小部分云端训练市场遍地开花百花齐放根据产业链调查,我们认为中国在处理器/芯片领域的投资有加速的迹象,AI芯片的创业企业目前已达到40家左右。

而中国的人工智能半导体公司像华为海思HiSilicon),寒武紀Cambricon),地平线Horizon Robotics),彼特大陆Bitmain),耐能Kneron),肇观Next VPU,及大数据系统公司如百度,阿里巴巴及安防龙头海康威视,大华将追随国际大厂陆续推出人工智能特定用途集成电路和系统芯片从过去的模仿和追赶模式改为提前布局的思路加上今年中国科创板融资平台的加持相信一定可以孵育出未来世界级的人工智能芯片设计龙头公司。但就未来2-3年来看,因为有强大的财物资源来支持10纳米以下先进制程工艺的电子设计自动化软件EDA tool,验证Verification,光掩膜Photo Mask成本的蹿高请参考图表,最有实力的半导体设计团队,及其对人工智能深入学习系统的知识及各种设备人工智能化的需求,我们预测华为海思将能引领国内人工智能芯片产业突围而比特大陆因为深谙IP,芯片,模块,到平台或生态系的争战,金准产业研究团队不排除比特大陆反而领先其他一些一线设计公司率先推出些云端人工智能的推理/训练芯片及解决方案模块当然,金准产业研究团队还是认为纯算法及半导体设计公司寒武纪,目前有较佳的设计团队及较充裕的估值融资能力来陆续推出边缘运算端及云端推理的人工智能芯片最后因为SAELevel4/5自动驾驶平台成本过高及生态系组成庞大及复杂,目前金准产业研究团队对地平线在自动驾驶的解决方案方面的短期营运及获利模式存疑。

6.1华为海思后发先至

在供应全球智能手机第二大厂,中国智能手机第一大厂华为超过近六成的应用处理器及基频芯片,及率先数月于高通及联发科采用台积电的7纳米制程工艺推出的麒麟980芯片,让华为的Mate20手机大卖,并让华为整体智能手机在国内的市占从2017年的20%,提高到2018年的27%,及2018年四季度的29%,预期这也将同时拉升华为海思HiSilicon在全球无晶圆设计公司的市占到6-7%或是在2019年成为前五大。而7纳米的麒麟980芯片是整合了寒武纪Cambricon设计的Cambricon-1M神经处理单元NPUNeural Processing Unit专利区块来让摄像头看得更全更清更快更久让麦克风听得更清更广识别场景推测用户行为意图和适时处理高性能或高效率任务根据华为公布的资料在人工智能性能比上,其NPU是一般CPU的25倍,GPU的6.25倍25/4,能效比上,NPU更是达到了CPU的50倍,GPU的6.25倍50/8)(请参考图表。但因为目前其边缘运算端神经处理单元架构简单金准产业研究团队估计此专利区块芯片应不超过整体芯片面积基频和应用处理器整合在一起的系统芯片面积10%。但因为金准产业研究团队预期采用台积电7纳米EUV制程工艺的华为海思麒麟990芯片,将使用海思自行设计的人工智能专利区块Ascend Lite SKU请参考图表,而苹果Neural Engine5TeraOPS高通Neural Processing Engine SDK Software Development Kit,<8TeraOPS,联发科Neuro Pilot SDKAndroid Neural Network NNAPI联发科Neuro Pilot SDK也将陆续整合其人工智能专利区块及软件到其手机应用处理器Application processor中,这将对寒武纪及其他人工智能算法及芯片公司在智能手机及联网物IoT设备端的芯片发展造成限制。

华为海思因为有这样强大的财物资源来支持7纳米以下先进制程工艺的电子设计自动化软件EDA tool,验证Verification,光掩膜Photo Mask成本的蹿高,拥有国内最强的半导体设计团队,及其庞大的系统知识及各种设备对人工智能化的需求,金准产业研究团队预测华为海思将后发先至引领国内人工智能芯片产业突围。华为海思今年将陆续问世的7纳米昇腾Ascend-Max910ASIC整合8颗芯片dies,及1024颗昇腾910芯片的Ascend Cluster256PetaFLOPS,使用12纳米昇腾Ascend-mini310),-Lite-Tiny-Nano ASIC推出的Atlas200加速模块Atlas300加速卡Atlas500智慧小站,Atlas800私有云解决方案一体机,MDC600移动数据中心Mobile Data Center金准产业研究团队预期这些AI芯片及系统,陆续将对英伟达,赛灵思,英特尔,谷歌在云端及边缘运算端人工智能芯片及平台的地位,带来挑战,但特定用途IC的专用性缺点会让华为海思切入像是外部安防等系统公司客户时,碰到些安防公司系统知识领域不愿意外泄的问题。

6.2寒武纪从设备端步入云端

寒武纪Cambricon是于2016年在北京成立,核心成员陈天石及陈云霁兄弟都曾在中科院计算所工作,专攻计算机处理器结构优化和人工智能,而后来寒武紀在拿到中关村科技园区支持资金及上海市政府对神经网络处理器,深度学习处理器IP核项目,智能处理器核项目等多项补助近6000万人民币,加上多次拉高估值的融资,于2018年5月3日发布了使用TSMC7nm工艺IP的1M,每瓦速度达3.1-3.3兆次运算,为10纳米1A智财权专利区块的10倍左右,且超越英伟达V100的每瓦速度达0.4兆次运算,其8位运算效能比达5Tops/watt每瓦5兆次运算。寒武纪提供了三种尺寸的处理器内核2Tops/4Tops/8Tops以满足不同领域下,不同量级智能处理的需求智能手机、智能音箱、摄像头、自动驾驶Cambricon也介绍以TSMC16nm工艺制程设计的MLU100及MLU200云端服务器AI芯片,具有很高的通用性,可满足计算机视觉、语音、自然语言处理和数据挖掘等多种云端推理,甚至训练的任务。在发布会上,联想ThinkSystemSR650,中科曙光Phaneron服务器,科大讯飞翻译机2.0都介绍了使用CambriconMLU100芯片相对应的云端服务器。此外,专为开发者打造的Cambricon Neu Ware人工智能软件平台,加上支持Tensor FlowCaffeMXNet等主流机器学习框架Framework,让寒武纪在尚未扭亏为盈的情况下估计2017年亏损超过1000万人民币以上2018年营收连1000万美金都达不到的状况下2016/2017年营收估计约400万人民币上下,市值已被拉高到超过25亿美元。

6.3卖人工智能解决方案模块的地平线

地平线Horizon Robotics创办人是前百度深度学习研究院负责人余凯、还有前华为芯片研发架构师周峰,地平线不是只做芯片,在软件方面,地平线已经研发出了自动驾驶的雨果神经网络OS平台及智能家居的安徒生平台。地平线的目标是做分支处理单元BPUBranch processing unit的人工智能算法架构+嵌入式芯片的Embedded ARMCPUGPUFPGA自动驾驶征程2.0处理器),智能城市智能商业旭日1.0处理器的人工智能设备终端解决方案模块具有感知,识别,理解,控制的功能给产品厂商。地平线的整个流程是根据应用场景需求,设计算法模型,在大数据情况下做充分验证,模型成熟以后,再开发一个芯片架构去实现,该芯片并不是通用的处理器,而是针对应用场景跟算法是结合在一起的人工智能算法处理器,得到芯片大小执行耗能Area、Performance、Power的综合解决方案。地平线BPU架构的解决方案只可以用在符合车规的FPGA或GPU等计算平台上,下一步地平线会将自己的BPU处理器IP授权给国际厂商,让他们生产车规级处理器。智能驾驶方面,基于高斯架构研发的ADAS产品征程1.0处理器也会作为重点推进SAEL3/L4的无人驾驶Matrix1.0平台,也会持续落实与系统厂商像是博世的技术合作,计划在年中实现特定道路的自动驾驶智能生活方面,除与美的的合作之外,地平线继续在家电、玩具、服务机器人等领域发力公共安防方面,地平线去年与英特尔在北美安防展上进行联合展示。类似于寒武纪,地平线于2018年11月27日获得近10亿美金的B轮融资,持续拉高其市值。

6.4从挖矿机转云端人工智能推理模块的比特大陆

CEO詹克团及创办人吴忌寒于2013年联合成立的挖矿机及芯片霸主比特大陆BITMAIN2017年11月正式介绍其AIASIC芯片品牌SOPHON算丰,宣布全球首款云端安防及大数据人工智能推理系列的张量加速计算芯片28nmBM1680的震撼面世,并展示了视频图像分析、人脸人体检测的演示。并同步发布了SOPHON.AI官网,并将系列产品在官网中面向全球发售。BITMAIN致力于通过强大的芯片工程、快速迭代和系统设计制造能力,提供最具性价比、最具性能功耗比的AI计算力,同时致力于为行业定制、优化全栈的硬件和系统方案,从而极大降低行业+AI的难度,促进AI普及。BM1682在2017年12月已进入流片阶段,并于2Q18量产。12nm的BM1684是预计于1Q19量产及第四代的12纳米芯片BM1686是预计于2H19量产。这两款芯片会拥有6/9TeraFlops的能力和30W的功耗。BM1880是比特大陆于2018年10月发布的一款设备端AI芯片,将主要应用于安防、互联网及园区等领域BM1880芯片可以作为深度学习推理加速的协处理器,也可以作为主处理器从以太网接口或USB接口接收视频流、图片或其它数据,执行推理和其他计算机视觉任务,其它主机也可以发送视频流或图片数据给BM1880,BM1880做推理并将结果返回主机。比特大陆将于2019年推出第二代产品BM1882,以及2020年的BM1884,按照规划,BM1882和BM1884的主要应用场景将是智能摄像机、智能机器人和智能家居等。虽然目前比特币跌破4000美元以下,占比特大陆98%的矿机销售,自营挖矿业务要是采用两年折旧几乎是无利可图除了于4Q18推出的7纳米BM1391挖矿芯片及S15挖矿机应可获利外,而AI芯片导入云端系统又遥不可期,但不同于其他新兴AI芯片设计公司大多缺乏现金,比特大陆在手现金7-8亿美元现金,4-5亿美元的加密货币应该还是有超过10亿美元,芯片研发设计资源仍然丰厚,每一代芯片代与代之间的间隔是快于摩尔定律而达到9-12个月。摩尔定律是指芯片行业每18到24个月的周期里,计算能力能翻一倍,或者在相同的单位芯片面积里,晶体管数量翻一倍。


金准产业研究 人工智能产业深度研究——半导体篇(下)

6.5耐能专注于低功耗设备端的人工智能芯片

耐能kneron是由一群留美华人于2015年成立于圣地牙哥,CEO刘峻诚博士是毕业于UCLA,并于2018年7月延揽前高通多媒体研发部总监李湘村前展讯,华为,VIVOVP为其首席科学家,其余团队成员多有UCLA清华大学,高通,三星电机,电子,计算机背景,并于2017年11月耐能宣布完成超过千万美元的A轮融资,阿里创业者基金Alibaba Entrepreneurs Fund领投,奇景光电HIMXHimax Technologies,Inc.、中华开发资本CDIB、高通、中科创达Thunder soft、红杉资本Sequoia Capital的子基金Cloudatlas与创业邦跟进投资2018年5月由李嘉诚旗下维港投资Horizons Ventures领投的A1轮融资,还有最近一轮从Iconiq capitalMark Zuckerberg’sprivate fund拿到的融资。耐能的定位是子系统设备端人工智能的技术提供厂商,现在主打低功耗、轻量级可压缩/重组recon figurable靠软件重组CNN,Pooling运算区块的组合NPU神经网络处理单元芯片,专注在智能手机的子系统NPUIP-KDP300、物联网IoT、智能家居、智能安防NPUIP-KDP500设备端市场机器人,无人机,安防NPUIP-KDP700能耗比可以做到100mw到300mw,最新的一款产品甚至可以到10mw以下,但在算力方面可以达到华为海思Ascend Lite系列的芯片等级,而纳能另外与Cadence的TensilicaVisionP6DSP处理器整合的KDP720NPU处理器,主要是锁定智能安防与监控。有别于目前市场上主流的云端人工智能,耐能提供创新的设备端人工智能解决方案,可将一部份的人工智能从云端移转到设备端上,进行实时识别与分析推断,不用等到把所有数据经由网络传送至云端后才能处理,并可大幅减轻网络、云端的负担与成本。耐能目前手机加OEM/ODM客户可达6-8家,主要客户有手机相关的高通,格力,奇景光电,互联网的客户包括搜狗,腾讯,钰创,钰立微,工业计算机客户有研扬,安防客户有大华,苏州科达等。格力已经使用其智财权区块量产,目前一些芯片已经量产。因扩大研发团队及产品线,耐能从2017年的获利扭赢转到2018年亏损达400-500万美元,但2019年将有二颗芯片流片Tapeout

6.6亿智是有实力又低调的AI芯片公司

由前全志团队组成的亿智电子科技于2016年7月在珠海高新区注册成立。同年10月在北京设立人工智能AI算法研究团队。亿智核心团队是中国最早一批进行SOC系统设计的专家,有20多年的行业经验,目前亿智在珠海的研发团队已近100余人。亿智电子科技已于2018年2月完成了数千万元天使轮融资,并于2018年8月由北极光创投领投,达泰资本跟投。亿智的商业模式主要为代理商和大客户提供整套的解决方案。目前,亿智解决方案主要聚焦在视像安防、智能硬件家电、汽车电子等方面。2017年底第一颗Test Chip首次流片即成功,2018年第四季度流片AI功能量产版系统级芯片,于2019年实现量产出货。亿智在珠海、北京、深圳均设有办公地点,其中珠海为总部,负责芯片设计、算法研究、软件开发等方向。北京负责人工智能AI算法的研究。深圳负责方案开发、技术支持、市场与客户拓展等。亿智成立至今,一直坚持AI加速、高清显示、音视频编解码、高速数模混合等IP的自主研发,这样可以实现更低带宽、更低功耗、更低成本地落地应用产品。特别是AI的IP的PPA指标均优于业界对手。目前已经成长为具备完全自主AISOC产品量产落地能力的人工智能芯片设计公司。亿智凭借在音视频编解码以及AI视觉算法方面积累了超过10年的领先经验,通过对人工智能需求市场的垂直化、场景化应用研究,在汽车电子应用方面,亿智的产品线具有车牌识别、路牌识别、文字识别的能力,ADAS智能算法可实现4路全景拼接、全景泊车,行车记录仪/智能后视镜/智能中控车机等汽车电子产品应用。目前的夜视后视镜产品,长焦夜视摄像头、短焦行车摄像头,显示车辆油耗、车速、水温等,信息全部手机互联。4G后视镜提供在线导航、在线音乐、云狗、行车记录,ADAS安全驾驶辅助系统。亿智的占道抓拍产品,可进行车牌检测,车牌识别,抓拍路段时间规划、黑白名单管理、车辆轨迹显示、后台管理系统多车道实时识别,具备软件能力,团队表示目前的识别成功率达到95%。志在成为视像安防、汽车电子、智能硬件领域智能化AI赋能的全球领导者。

结语

金准产业研究团队分析,有今年中国科创板融资平台的加持,国内的半导体公司将陆续推出人工智能ASIC抢先机。而华为海思因为有强大的财力来开发10纳米及以下产品,负担EDA软件,验证,光掩膜成本的蹿高,加上强大的设计团队及对系统的认知,预计将引领国内AI芯片行业突围;而比特大陆因为深谙IP,芯片,模块,到生态系的竞争,不排除其反而率先推出有竞争力的云端人工智能的解决方案模块;寒武纪目前有较佳的设计团队及较充裕的估值融资能力来陆续推出边缘运算端及云端推理的人工智能芯片。

除了国内算法软件公司及美国AI芯片大厂外,未来24个月,我们看不出来国内AI芯片大厂能摆脱亏损;美国商务部工业安全局可能对其11项AI和机器学习技术列入出口管制清单;AI ASIC大厂对各种应用系统认知不足,安防/语音/自驾系统公司不愿分享其系统设计机密。