• 项目
首页>>文章列表
文章列表

文学、少女与死亡:卡夫卡的生命三角

近百年来以卡夫卡为题材或传主的作品在全世界范围内不下数百部,而以少女为线索探究卡夫卡内心和文学世界的,大概只有法国当代作家达尼埃尔 · 德马尔凯的《卡夫卡与少女们》一书。


作者分析认为,卡夫卡对少女有着几乎病态的迷恋,然而他既不是恶人也不是性虐待狂,他只是一个有着强烈主观意志和独特精神追求的病人。他折磨少女,却并不以此为乐,因为他也感受着同样的不幸,就像“落水遇险的人那样不顾一切地抱住碰到的漂浮物,那是因为他知道少女局有一种堪称决定性的力量”。《卡夫卡与少女们》中文版的译者管筱明在序言中写道,“对于卡夫卡的文学创作,少女不仅是灵感,是素材,而且是力量。”卡夫卡死于生命中最后一位少女朵拉的怀抱里,堪称“死在迟来的浪漫精神之顶点”。


《卡夫卡与少女们》

[法] 达尼埃尔 · 德马尔凯 著  管筱明 译

一頁folio | 北京联合出版公司 2019-09

《弗兰茨与卡夫卡》


文 | [法] 达尼埃尔 · 德马尔凯   译 | 管筱明


文学、少女与死亡:弗兰茨·卡夫卡就在这个三角中游戏人生,消耗人生。他只愿意自己创作,即使搁了笔,也还在写作:一部日记,给一些少女的书信。在这个文学的边缘地带,


我们听见一颗孤独的、得不到慰藉的心在跳动,在喘息。在这里我们寻找什么呢?卡夫卡熬夜写就的东西与文学的秘密混在一起,而他自己也与文学成为同一。卡夫卡就是文学本身,正如莫扎特就是音乐本身。法国作家勒内·夏尔说,他是“我们的金字塔”。而一座金字塔,就是一座陵墓:在它黑暗的墓穴里,埋藏着一个谜,一个吞吃人的谜。当我们走近卡夫卡,就预感到几乎可以用指头触摸他。对于文学,他提出没法满足的要求,正如对少女们,他提出不可能答应的要求,虽然这些要求是私下提出的,相互间却联系在一起。


如果少女仅仅是绝望者的慰藉,她早就得到赞美了。她就是沙漠中的绿洲。她身体的幻影在与写作的力量对抗,可惜这只是微不足道的保护体。作家之所以执意地追求她,像个落水遇险的人那样不顾一切地抱住所碰到的漂浮物,那是因为他知道少女具有一种堪称决定性的力量。他从她眼睛里、嘴唇上和皮肤上得到的东西,不仅是一种幸福的允诺。作家与少女的结合不仅较为大胆,甚至迹近乱伦:两者都很相像,简直你就是我,我即是你。也许这就是他们互相着迷的原因。少女因为希望得到爱慕,在作家的眼睛里看到了一个盟友,而作家则在递给她的镜子里,认为自己认出了一个同谋。卡夫卡说,我们“既对她生出觊觎之心,又装出满不在乎的样子”。


年轻的卡夫卡

海明威、福克纳或者川端康成(仅举这几个人就行了)都在这种“奇特之乡”冒险。他们和纳博科夫一样,都企图捉住那只蝴蝶,把它别在标本纸上。漫无止境的追求。如果不是一份好感,像蜉蝣一样执着的好感解释了这种不懈追求的原因,如果一纸书页或者一部作品没有通过一个少女之口说出这种追求的代价——河那边,大树下,正是海明威隐约窥见的天堂——这种崇拜就难免有几分可笑。另一个,别处的一个,同样的追求,同样的魔法。与其说作家追求的是一只蝴蝶,不如说是一只黄蜂。作家永不满足地要求得到它的螫刺。这样一来,少女就在文学火热的心中架好床铺,在人家迫不及待地观察她的时候,她却假装睡着了。从她身上长出浇灌作品和作者的血管。


19世纪法国作家热拉尔·德·奈瓦尔身边也是姑娘如云。他曾指望在她们那里看到同样的奇迹:让我们重读他的《西尔薇娅》,围绕一幅“图像”跳起那圈令人难忘的圆舞。为了保留这份魔力,他怕走近“真实的女人”。我们知道这种“柏拉图式的悖论”会引发什么灾难:天使是魔鬼的造物。法国诗人安德烈·布勒东头一个看出了奈瓦尔与卡夫卡的相似之处。卡夫卡年轻时坐在布拉格的一座山丘上,承认生活是“一个梦,一种漂浮不定的状态”。在日记和书信里,他记下了自己的梦境。他“清醒的睡者的幻觉”给他的内心生活蒙上了某种“梦幻色彩”。他受奈瓦尔的影响,也迷上了戏剧和女演员。和奈瓦尔一样,他相信一切都是征兆,尤其是少女。这是一些危险的征兆,因为它们展现了疯狂和死亡。这种交往,卡夫卡把它发展到了极致。


“面对大多数少女,”卡夫卡对密伦娜承认说,“我始终感到慌乱。”她们近在眼前的身体让他困惑不安。从她们的目光里看到焦渴的期待,他不免大吃一惊。少女们是偶然出现的,但这种出现既是机会也是威胁。这是朝未知世界打开的一面窗户:一种可能性得以生成。卡夫卡对少女的信任,对女性使者天然的信任与他对性的恐惧不相上下。不要触碰少女,把决定命运的时刻推迟,但是要把她抓在手里,而且要不惜一切手段。卡夫卡梦寐以求的少女若有所思,微低着头,露出一截颈项。其实卡夫卡是准备以另一种方式来占有她的。问题并不在于她是否“纯洁”,而是在于她的魅力、引力。他要求少女助他抵达写作的福地,给他写作的力量。借助少女被唤醒的欲望,他来打开自我写作的大门,而用自己的放弃,来作竞技场上的腾挪跳跃。怀着这份始终是欲望的欲望,他可以埋头在孤独之中,专心写作。少女因为置身在远处,反倒比他更现实:书信与相片成了魔鬼的工具。法国哲学家吉尔·德勒兹在他对吸血鬼卡夫卡的看法里,是如此真切地感受到了这一点:“书信也许成了原动力,通过它们所吸过来的血,驱动了整架机器。”可怕的机器,在那样大的压力下运转。卡夫卡对爱情的要求只有一个:接受少女的辐射,服从她的情欲冲动。


卡夫卡书信

不论与哪个少女相处,卡夫卡都听任自己使出这个魔法。在点缀他一生的那些少女之星中间,卡夫卡从一些星星身上得到了自己所企盼的光辉。只是这种光辉转瞬即逝,冲劲总是难以持久,这也许部分解释了他的大多数作品总是没有写完的原因。他把生命力和保护力给了那些少女,可是少女们得到的善待却并不比他多。他给她们带来的苦难不能说不残酷。少女总是无比脆弱,与美好的韶华一样稍纵即逝。在他对她们的爱慕之中,怜悯是否因此而占了上风呢?作为陀思妥耶夫斯基的忠实读者,他探询自己为何对她们生出这种感情:是因为她们“会变为女人”,因为她们“命中注定有这种转变”吗?对此纳博科夫回应道:“美加怜悯,这是我们可以得到的最接近艺术本身的定义。何处有美,何处就有怜悯。道理很简单,美总要消失,形式随着内容的消失而消失,世界随着个体的死亡而消失。”打开写作之门的少女也是让卡夫卡隐约窥见了死亡的少女。因为他说,他一辈子在保护自己免遭“了却生命的意念”侵扰,所以正是因为这些美丽的女子,他才在自杀的念头前悬崖勒马吗?其中一些少女让他感受到了一些幸福时光。这是他一辈子,直到躺在灵床上感受过的唯一的幸福。他曾企图向她们要求更多的东西:像德国作家克莱斯特一样,在一个少女的守护下死去是卡夫卡最后的愿望。写作、少女与死亡就在这一点上交会。这是他命运的重力中心。在这个深渊里面,他的谜像个黑太阳一样闪闪发光。


作家的想象就是现实与梦想的交会场,是通过长篇小说的自由把与少女们的交往加热到白炽状态的洪炉。文学就是少女们引力的证明,欲望渗入作品,赋予其活力。活生生的少女变成了白纸黑字的少女,注入了更为透明更让人心慌的情欲力量。在他们的孤独之中,在他们有所控制(作出决定就像少女们一样羞涩)但是混乱的关系里,卡夫卡长篇小说中的人物成了一种缠人扰人之欲望的猎物。他们并不冲破把他们与作家绑在一起的束缚,却也企盼从少女那里得到帮助。他们在暗暗守候一种征兆,哪怕是必然带来不幸的征兆。


在《审判》的末尾,K.被捕之后,瞥见的是一个姑娘的身影。他站住不动,似乎决定反抗两个夹着他的男人,这时姑娘从一条小巷的暗处走了出来。她很像走道里那位女邻居。某天晚上,K.曾像一头“饥渴的野兽”扑上去,贪婪地把嘴唇压在她脖子上。面对新出现的这个人影,他明白“自己的反抗是徒劳的”,于是顺从地在两个默不作声、听任他选择道路的捕快之间走起来。K.领着他们跟着姑娘走,这并不是要追赶她,也不是为了尽可能长久地注视她,“而只是为了记住她对他的提醒”。她走进一条侧巷不见了,不过这有什么关系,他“现在可以不要她了”。这时他们来到城市边缘,于是他听任两个刽子手处置,“像条狗一样”,当胸挨了一刀。跟着姑娘走,就是去受刑。她是一种劝说,劝他接受心里经常惧怕的命运。


《审判》

[奥]弗兰茨·卡夫卡 著  文泽尔 译

天津人民出版社·果麦 2019-04

这些偶然遇到的少女,指示一条道路或者用一种可能的援救来引诱人的少女,贯穿于卡夫卡的作品始终。她们经过,引诱人或者让人引诱,轻轻地拉住你,像《诉讼》中那个手指之间长着蹼的随和的列妮一样,她蜷曲在K.的膝头上,以她的方式来帮助他。每个少女都被卡夫卡以困扰他的双重形象来描绘,不是姑娘就是妓女。有时,她们像《诉讼》中纠缠K.的蒂托雷里画室里的那些堕落姑娘,邪恶性情突然爆发出来。如果性是人最大的困惑,是最为隐秘的东西,那么在长篇小说中,尤其是在他的日记或者散见于书信的告白里,卡夫卡则探索了性的需求及其模棱两可的地方,让它最充分地展示了自己。卡夫卡是个现代人,给予性欲以很高的地位。用米兰·昆德拉的话来说,他并没有掩饰其“可怕的无聊”和“吓人的力量”,亦未遮盖其“令人陶醉的黑色之美”。


《城堡》里的土地测量员K.,到小客栈后,就是这样落进金发白肤的侍女弗丽达的诱惑之中。在柜台后面,就在地上,在一摊摊啤酒汁中间,他几乎立即感到怀里的陶醉,他试图挣脱出来,可是无法抽身,因为这个“小小的肉体”热情似火,很难对付。“两人的气息交织在一起,两人的心一同跳动”,他迷失在一个“怪异的国度”,走不出来,只好继续“迷失下去”。这是让人不安的幸福:“他觉得弗丽达如果抛弃他,他所拥有的一切就会和她一起抛弃他。”在被剥夺幸福权利的人那里,一具肉体是最后的救生浮筒,性是一切。在肮脏的地上滚了一夜之后,K.来到外面的雪地上,觉得自己“呼吸稍稍顺畅一点了”,似乎那一片洁白抹去了身上的脏污。在那个忧郁的早上,一切都失落了。他们再次拥抱,尽管非常疯狂,却没有头一次拥抱那样放松。他们激烈地交缠着,运动着,“就像两只拼命在地上刨来刨去的狗”。干完好事,一个女侍进来见到他们精疲力竭的样子,出于“怜悯”,往他们身上扔了一条毯子。几天的共同生活,让弗丽达的容颜憔悴,再说,她偶然间也梦见自己变丑了,甚至面对K.的固执,她也梦想住在城堡附近,住在“一条又窄又深的壕沟”附近,因为那里埋藏着他们的爱情。弗丽达失败了,她认为自己妨碍了K.的寻访:“我没法帮您,我总是妨碍您。”


除了一个姑娘,一个最普通的姑娘,还有谁能够安慰K.,让他忘记这种抛弃,并阻拦他去巴纳巴斯那帮被社会排斥的人那里堕落呢?面对K.的失望,小说最后几页好像蒙上了同情。小佩碧没有答应领他去城堡,只是提出让他与保姆合住那窄小的安着双层铺的房间。弗丽达与K.分手以后,回到小客栈,向接替自己当侍女的佩碧表明幻想的终结:她收好漂亮的连衣裙,把头发上的系带解下来。从K.开始,所有人都曾试图给她解头上的饰带。可怜的佩碧,纵使生着压都压不住的金红鬓发,射出可以满足那些只想从“一个姑娘眼里找到某种东西”的人的目光,现在也只好重新拿起水桶和扫帚了。在K.身上,佩碧看到的是一个“不幸的伙伴”。她像从未爱过人一样爱他,准备为他放弃一切。她说,与弗丽达在一起,K.发现了她的空虚;而她则会教K.知道什么是“真正的爱情”。只要他来自己的小房间,她会拿出咖啡和糕点招待。他们会热烈地挤在一起,看弗丽达的照片,讲故事。有K.陪伴,佩碧和她的女友们就不会惧怕黑夜。一种不事张扬的温馨生活。没有谁能够留住他。来年春天,他可能会动身。而佩碧会告诉他一个地方,在那里,她的帮助和她的爱情诡计都在等着他。


《城堡》令人赞叹的结局,就像卡夫卡当年搁笔时一样完美。我们永远不清楚K.会不会接受佩碧的邀请,并且,在放弃他的寻访之后,会不会在无所事事之中等待漫长的冬季结束。在正要举步的当口——或是跟着佩碧走,或是离她而去——是什么事情阻止卡夫卡作出选择?是什么事情让他喉头哽塞?我们只记得这部绝望的长篇小说是在这种沉默中合上的,而不是在一个姑娘的呼唤声中,在她伸出手的情况下结束的。K.并没有碰“稚气的佩碧”,只是摸了摸她的耳环,但他在第一次见到她的时候,还是不得不遮住眼睛,因为他贪婪地看着她,预感到搂着这个圆润的细小躯体,可以增添“对付崎岖道路的勇气”。可是他顶住了这种诱惑,佩碧,或者与弗丽达作对的姑娘。


《城堡》

[奥] 卡夫卡 著  高年生 译

人民文学出版社 2018-03

从第一部长篇小说《美国》开始,卡夫卡就以一种生硬的、几乎是报复性的方式,写出了困扰他的女性形象,其笔触甚至到了过分的地步,好像是要摆脱这些形象。性方面的不如意使卡夫卡走上了流亡之路:性始终是流亡的同义词。在大西洋彼岸,卡尔永远地告别了童贞,因为一个保姆“引诱他,并使他做了父亲”。她像个行事果断的吃人女妖,把卡尔领进自己房间,脱去他的衣服,让他睡在自己床上。卡尔被鸭绒被罩住,陷在枕头窝里,透不过气来,还遭到了姑娘的攻击:她把自己的乳房递给他,将光溜溜的肚皮压在他身上,还“令人不快地”在他胯间掏来掏去。受到强暴之后,他非常沮丧,流着眼泪回到自己床上。


有天晚上,卡尔受人邀请,来到纽约附近的一所别墅,在那里,等待他的几乎是同样的命运。由于他不愿意跟美丽的克拉拉进房弹钢琴,事情演变成了打斗:嘴唇涂得血红的“悍妇”,穿着贴身裙袍的“泼妇”把他按在长沙发上,勒得半死。“难道您不喜欢我了吗?”她咆哮道。卡尔受了侮辱,只有一个愿望:逃走,睡觉。


与克拉拉不同的是善良的特蕾泽。这个小打字员一副小女生模样,和卡尔一样,也是流亡来的。她主动来敲他的门。卡尔有些犹豫,因为他在床上,没穿睡衣。特蕾泽挨着他坐下,他就往墙壁上退,并把被子一直拉到下巴上,听她流泪讲述自己的苦难。


由于想不出什么安慰话,他只好“抚摩”她的手臂。“有些事我干得来。”特蕾泽暗示说,手在被子上摸着。可是她白费了功夫,卡尔没有反应。机会就这样过去了。没有办法,特蕾泽只好教卡尔商务英语。


如果我们没有遇到大块头布鲁娜妲叉开两腿,坐在扶手椅上,那么这部小说中的女性形象就会显得索然无味。这个从前的歌唱家、任性而专横的女人一身赘肉,“两片嘴唇之间伸出一条又厚又红的大舌头”,一人就把女性的全部可怕之处、魅力与侵略性表现了出来。在这部青春作品里,卡夫卡只是致力于揭露并驱走女人身上让他恐惧的东西。这使人透不过气来的肉感女人,已经不再是少女的女人。因此,重新找到一个少女所带来的幸福感就变得更为显著了。在游历结束时,空中出现了法妮的面孔,似乎是要修饰这个迷住费里尼的怪诞形象。在俄克拉荷马大戏院,也就是卡尔去应聘的马戏场,在打扮成天使模样、吹着金光闪闪的铜号的姑娘中间,卡尔认出了法妮。他总算在天堂有了一个女朋友,于是他开心地笑了。


在接下来的书页里,写弗兰茨的文字与写卡夫卡的一样多。我们把作家的面孔还给他,只留下他的孤独和秘密:这些秘密使我们关注卡夫卡,并且把少女们像尺蛾一样留住。要走近他,做梦是最可靠的路径。让我们逐一唤醒过去那些少女,直到朵拉,那最后一个少女为止;我们听见他和那些少女一起笑闹。她们虽然增添了他的烦恼,可是没有她们,弗兰茨·卡夫卡会更加为人所抛弃。


卡夫卡最喜欢的书是福楼拜的《情感教育》。也许,这部小说最能给我们提供认清他真实面貌的机会,因为弗兰茨就是弗雷德里克,那个像渴望生命一样渴望爱情的年轻人的兄弟。福楼拜伤感的音乐陪伴着他。他虽然声称自己在音乐方面的天赋不会超过在爱情方面的天赋,但还是从中认出了自己的命运。失败只是表面的,写作并没有搞乱他的生活。我们在卡夫卡的微笑里读到的,就是对文学的这份确信,这份无限的自信。即使遇到灾难,这份自信也使他显得不同凡响。


当我们偶然翻开日记,会寻找什么呢?当我们由后往前翻阅他的日记,并且以诗人保罗·策兰的方式来翻阅我们的日记,又会寻找什么呢?卡夫卡微微低着头,看着我们走近。有时,他像华托笔下的吉尔,有时又像贾科梅蒂手下的某个人影,至少在他不像梅诗金公爵那样微笑的时候。他和我们生活在一起。我们有时在梦里碰到他。我们谈论弗兰茨,就像谈论让-雅克或者热拉尔一样——这种亲近是个征兆,表明作家不仅会得到我们的赞赏,还会赢得我们的心。文学的第二生命:卡夫卡原来认为,作品的“真正生命”始于作者逝世之后。可是他的面孔还没有磨灭,作品的生命就已经开始了。少女们继续为他——也许还为我们说情。即使我们予以否认,我们在所喜爱的作家身上寻找的秘密,也是我们自己的秘密。这大概就是我要引用亚历山大·维亚拉特的话的原因。他是这么说的:“出于需要,我曾对卡夫卡形成了一些错误的看法。”

金准产业研究 数据治理存在问题与应对策略分析报告

前言

许多大数据公司在过去一段时间都得到了较好的发展,究其原因是因为恰逢专注于业务流的信息化建设正在向数据化转型。

但在很多时候,数据其实还只是IT化的“副产品”,早期的工作思路仍然围绕如何将业务IT化,而数据只是这个过程中自然而然产生的结果,即所谓的“副产品”。

由于在数据生产的过程中并未做到足够重视,数据质量与可靠性则很难得到保证,这也是数据治理在现在得以被重视的重要原因。

在业务IT化的过程中,企业通过第三方厂商、自研等方式构建多种数据系统,采用多种系统中的数据化治理,是实现数据效能、数据驱动业务的关键步骤。

早期,企业用信息技术去构建业务流,而现在,我们试图用信息技术,特别是互联网行业中的一些大数据处理以及分布式处理技术构建数据流,但在构建过程中,过多强调技术本身而忽视了对数据的治理。

数据治理是整体性问题,并非仅是技术问题,市面上数不胜数的商业组件可以解决如何对数据进行存储、查询等问题,但是在实际的业务情况下对于数据治理这样一个系统性工程,目前却并无现成的产品或技术可以直接解决。

 

我们可以尝试用数据治理的角度来解读上图。

构建数据流的过程,很大意义上是为了解决分布在IT系统里各个不同子系统之间的数据孤岛问题,用一条完整的数据流将不同子系统之间的数据孤岛打通,同时应用于不同的应用场景,这个打通的过程,就是某种意义上的数据治理。这也反映了金准产业研究团队推崇的一个观点——构建数据仓库本身就是一个数据治理的过程。

另外,对于数据的本质,有如下两个定义:第一“信息是用来消除不确定性的”,第二“大数据的本质,就是用信息来消除不确定性”。

同样,对于数据驱动在业务决策和产品智能两大方面的应用,也都将建立在数据治理的基础上才有意义。

 

一、什么是数据治理?

数据治理的本质是组织对数据的可用性、完整性和安全性的整体管理。

1.1数据治理的本质

可用性指数据可用、可信且有质量保证,不会因为分析结果的准确性造成偏差,从业者可以放心地根据数据结果做业务决策;完整性分为两个方面,一方面指数据需覆盖各类数据应用的需要,另一方面指不会因为数据治理没有到位而造成数据资产的流失,也即影响数据资产的积累,这也是神策数据在创业伊始便开展私有化部署的原因;安全性指治理和分享过程需安全可控,不侵犯用户隐私,且不会给组织留下安全隐患。

1.2数据治理的重要性

数据治理是所有数据应用的根基,数据治理的好坏直接影响所有数据应用的价值。

金准产业研究团队认为,无论是基于数据看报表,还是做交互式的多维分析,还是做更复杂的个性化推荐,所有的数据应用都需要有一个良好的数据治理结果。

神策本身就拥有一款推荐产品——神策智能推荐,通过这款产品的实践,我们发现,它的实施周期相比其它几个产品普遍偏长,这也是因为个性化推荐对于数据的质量和准确性要求相对更高。

简而言之,数据应用做得越深入,所需数据就会更多,对数据质量也会有更高的要求。

数据治理是组织数据资产沉淀的基础,数据治理的好坏直接决定了组织的数据资产能否得到沉淀,能否充分地发挥价值。

金准产业研究团队认为,在经费条件允许的情况下,当然可以将企业的所有数据整合在一起,通过良好的权限管控,充分的共享,聚合所有的业务部门一起去探索数据的应用,因为数据中台本身就承载着组织内部所有数据的整合分享角色。

二、数据治理面临的挑战

本部分的内容将数据治理面临的挑战分为两类,一类因“技术”而起,一类因“人”而起。

由客观的技术问题对数据治理带来的挑战普遍较好解决,比如如何采集数据、如何存储数据等,都可通过更先进的工具、更新的技术等方式解决。

而由人或组织架构带来的问题相对复杂,它的背后包含的是企业在文化、流程上的问题,可以通过以下实例说明。

2.1多业务系统多数据源的整合挑战

企业想要做的数据应用越多,所需的数据就会越多,所要去获取的数据源也会增多,而相应的数据处理也会越多,这是一个极为显而易见的问题。

对于神策数据而言,我们在数据应用方面相对“单纯”,主要针对用户行为领域,采集用户行为数据,从客户端、服务端、数据库等做对接。

但即使是这样一个限定特殊领域的应用,我们在整合多方面数据源上也会碰到非常多的挑战,可想而知在面对多业务系统多数据源的情况下将更加困难。

 

2.2数据采集技术上的挑战

近年来,许多公司都在尝试将自己的业务线上化,都需要通过数据对用户进行分析与运营,如何精准采集可用的用户数据以及其他相关数据,都将是数据采集在技术层面上面临的挑战。

 

2.3用户隐私与安全挑战

用户隐私与安全不仅是对技术挑战,更多的是一种意识上的挑战。企业需要准确把控数据采集的红线,比如针对欧盟范围内的国际业务,就需要参考GDPR的相关规范。

在国内,很多银行券商等企业也同样拥有一套完善的数据合规要求,甚至已经细化到“某个特定字段对于某一个特定人可看但不可下载”的程度,这些都是需要在进行数据治理时考虑的因素。另外,如果需要在公网传输交换数据,也同样需要思考数据如何防止窃取和伪造的问题

 

2.4组织架构与部门隔阂带来的配合

部分组织在数据治理的过程中速度过慢,成效不好,其中一个很重要的原因是权责、部门配合等方面存在问题。很多情况下,生产数据、使用数据、分析数据的工作人员分布在不同的职能线与部门,角色不同,立场也不同,这些客观存在的影响因素都会影响整个数据治理的最终结果。

 

2.5业务持续迭代中带来的挑战

在互联网行业中,尤其是业务迭代较为迅速的团队里,通常存在“1.0版本的数据质量最优,1.1版本不行,2.0版本完全不可用”的说法,说明第一次做数据治理时,极重视数据质量,会有完善的流程来保证埋点的准确性,本身也没有太多的包袱;而在后续的产品迭代中,如果流程和标准的迭代相对滞后,整个数据治理的结果也会随着受影响,最终导致整个数据质量低劣,直至所谓的“完全不可用”。

 

下面举两个具体实例说明。

实例1.

某公司的业务部门向第三方数据分析平台提出数据需求,该公司内部有多个App频道,每个频道隶属于一个单独的部门,而第三方数据分析平台在埋点采集阶段需要不同部门的团队相互配合。由于缺乏统一各部门需求与任务的统筹角色,实施过程中很难清楚划分相关责任,再加上管理、测试等工具的缺失,最终导致每次发版都会发生埋点丢失和报错。

实例2.

某企业的所有用户相关数据分散在不同的系统里面,试图通过第三方数据分析平台整合统一的用户标签数据系统。然而在收集数据的过程中,每跨一次部门就需要提一次全套的审批流程,好不容易收集齐各部门各系统中的数据之后,却发现数据统计口径不一致,无法得到一个公司统一的用户标签数据。

三、数据治理与组织架构

上述内容已经提到关于组织架构的内容,因其重要性将在本部分单独说明。

3.1数据治理是一个动态的过程

数据治理实际反映的是组织问题、文化问题,这也是许多公司为了明确权责划分而建立数据治理委员会的原因。同时,还需要明确的程序与执行程序的计划,明确的程序指对数据进行治理所需经历的阶段、问题有明细的了解,执行程序的计划指每一步需要解决哪些问题。当公司的主流业务发生变化时,组织架构会随之改变,接而带来数据治理层面的变更,所以,数据治理是一个动态的过程,伴随整个业务变更与组织架构变更。

3.2数据治理中的两个核心角色

第一,数据使用者,通常集中在产品经理、数据分析师、营销经理、运营经理等岗位,有查看报表、数据分析、用户画像、用户运营等需求,他们属于数据治理的受益者。

第二,数据生产者,通常集中在前端开发、后端开发、数据工程师、ETL工程师,有埋点、打日志、做数据ETL的需求,他们属于数据治理的付出者,可能看不到直接收益,反而增加工作负担。

由于数据使用者属于数据治理中受益的一方,多数情况下需由其来推动数据治理任务进行。

在神策数据的具体实践中,我们非常强调对客户接口人,通常情况下也就是数据使用者的培训,由他去推动整个流程,去了解数据生产者的实际情况,从而让数据治理工作更好地进行。

四、数据治理中的应对

4.1数据治理中的应对策略

首先,数据治理的核心认识是,数据治理是一个持续并且长久的一个过程,不同的产品可以解决比如采集、传输等数据治理层面上的不同问题,但并不存在一款所谓的“数据治理产品”,可以用来解决所有问题。

其次,数据治理的整体方法论是“从应用倒推”。先确定数据应用、数据资产的需求,接着确定需要哪些数据,之后确定需要从哪种数据源获取数据,最终确定具体的数据治理方案。

神策凭借近年在实际业务中的经验,围绕用户行为分析领域,总结出一套数据治理方法论。

 

第一步,确定分析需求。通过了解数据使用者需要看哪些指标、用在哪些场景、使用哪些分析模型等方面来了解具体的数据使用需求,完成需求梳理。

第二步,映射数据模型。在该步骤需确定采集的事件和属性,并完成事件设计。

第三步,确定数据采集技术方案。根据要采的事件和属性,结合现有实际业务系统,去确定到底要从何种系统里以何种技术方案采集数据。

第四步,数据采集与集成。这一步就是指具体的开发、集成工作,包括完成相应的SDK集成、数据采集工具的开发、数据ETL开发等。

第五步,数据校验和上线。这一步中需要使用必要的测试工具、利用埋点管理平台做数据对比等。

4.2数据治理原则

下面,举例说明数据治理的三大原则:

数据治理原则1:不要先污染后治理,要从源头控制

在创立神策数据之前,我们曾长期参与百度的日志数据相关的工作。在最开始的阶段,所谓的日志处理就是通过中控机器,从不同的业务系统里下载文本日志,跑完脚本后生成报表,再通过邮件的形式分发。

2008年,团队解决了之前方案中的技术架构的问题,把以前的单机系统变成了分布式系统,提高了整体性能与计算效率,用分布式的方式下载日志,用分布式的方式来计算报表。但是,我们本质上只提供了一个计算的调度平台。就数据本身而言,没有人知道这些海量数据其中的细节,数据没有得到充分的复用,造成了许多计算资源的浪费。所以,这部分的工作其实只是解决了一个技术问题,但并没有解决任何数据治理方面的问题。

意识到数据治理的问题之后,团队中开始了百度用户数据仓库的构建工作。有工程师每天将文本日志用程序转成结构化日志,并在进行必要的数据清洗、Union、Join等ETL的工作之后,将这些结构化日志统一映射到一张大表(今天event模型前身),并对外提供集中访问。

但随着产品线不断增多,入库周期变得更长,到后期,每增加一条产品线,都需要付出至少一周时间去解决。同时,由于数据在产生后需要做ETL,从产生到传输到统一的Hadoop集群需要时间,ETL的计算也同样需要时间,即使在最佳情况下也只能保证半小时的时效性。

这是一个典型的数据“先污染后治理”的例子,不仅在治理上需要付出更多的代价和成本,数据本身的可用性和时效性也会受到影响。

之后,我们尝试通过推行全百度统一的Logging平台,从打日志开始就保证数据的正确性,并且直接将数据传输到分布式集群上以保证数据的可用,这就是从源头来治理数据的思路。

在创立神策之后,我们就充分吸取了这些教训,通过SDK或者其他工具去严格控制数据埋点格式及数据模型,尽最大努力减少ETL的代价,从而保证查询时效性与导入时效性。所以,数据治理要从源头开始,不要先污染后治理。

数据治理原则2:数据治理的过程要贯穿到整个业务迭代的过程中

以软件开发流程为例。

首先,在产品需求阶段,同样需要去明确数据需求。在具体设计阶段,完成产品交互系统架构变更的同时,去确定要加哪些日志、字段等。

在实际开发阶段,完成相应的代码开发、日志变更,单元测试应包括相应的日志变更部分,并进行日志审计,不要将埋点当成一个单独的开发任务,而是伴随的过程。在测试阶段,当测试整体性能的正确性的同时,测试数据、日志的正确性,确保功能符合预期、日志打印正确,可以满足分需求。

在上线阶段,要实际查看上线的埋点、日志是否正确,并对功能进行确认。

最后,在项目总结阶段,用数据说明转化率变化、流程优化情况,对功能完成程度的总结,尝试真正地用数据说话。

数据治理原则3:以产品化、组件化的思路来解决,不能依赖于人工

以产品的方式解决客户端数据采集问题。

神策的开源SDK被许多业界同仁参考学习,究其原因是因为它用产品的方式解决客户端数据采集问题的思维,无论是电商、社交、金融、游戏,还是哪一种产品,都会在客户端采集用户数据时面临匿名ID生成、基础属性采集、数据打包压缩加密、本地缓存、网络传输、时间校准、根据数据模型限定了采集数据的Schema、通过全埋点等方式提供了对常见数据的自动采集功能、结合后端提供了对于采集端调试功能等场景,所以,可以用产品思维来解决的问题,不依赖人工。

 

 

金准产业研究 2019年金融科技价值分析报告

前言

这是最好的时代,也是最坏的时代。2019年,全球金融市场风起云涌,各种因素躁动不安。全球贸易保护主义仍在升级,国际贸易、制造业生产、消费投资信心等降至近年来低点。中国同样变化巨大,金融市场跌宕起伏。虽然中美贸易谈判暂时告一段落,但中美贸易谈判仍存在变数,任何一次反复都将影响市场预期,都将导致市场动荡。

如何破解实体经济增长困局,需要全球共同努力。金准产业研究团队认为,以金融科技、区块链和5G等新兴技术为代表的先进科技,正在重塑全球价值链,代表全球经济未来发展方向。

2013年的互联网金融元年,到2016年金融科技展露头角、再到2019的成熟态势,短短几年,我国的金融科技迎风生长,一路蜕变,随着蚂蚁金服、陆金所、恒昌等为代表的一批优秀的金融科技企业兴起,我国也已经逐渐成为全球金融科技领域的领跑者之一。

一、中国金融科技发展历程

回溯中国金融科技发展历程,金融业务的技术应用从IT基础建设向前沿科技的逐渐过渡,经历了“IT电子化-互联网金融-金融科技”三个发展阶段,技术在金融业务环节中实现了越来越深层次的渗透,金融科技已应用于营销、风控、金融产品设计、业务协作等方方面面,金融科技在业务中的应用价值凸显。

 

从金融机构Fintech投入上来看,整体以头部金融机构为主。银行方面,除国有大行、大型商业银行等头部银行外,部分地方银行也在探索人脸识别、区块链等金融科技的应用,整体技术资金投入与增速均领先其他领域;保险公司呈现“强者愈强,弱者愈弱”的态势,头部保险公司IT建设完善且自主,前沿科技投入逐年增加,中尾部保险公司仍需不断完善IT建设;证券与基金行业目前仅头部企业在金融科技方面有少量投入,特别是证券行业受监管政策的影响,相对制约了新技术的使用。但整体来看,金融科技市场空间较大,金准产业研究团队认为,随着技术不断成熟及金融业务创新的不断尝试,金融科技市场规模在未来1~3年将进一步增长。

 

二、金融科技发展和业务价值

技术发展方面,中国金融科技专利申请量全球遥遥领先,说明了中国在Fintech自主发展上具备一定领先优势,此外,头部金融科技企业也在积极推进开源生态建设,让金融机构及企业可在开源架构基础上开发出适用于自身业务的技术方案,降低了技术使用门槛及成本,也加速了国产金融科技底层平台的创新发展。

金准产业研究团队分析头部金融科技企业成为推动技术开源和创新发展的主力军。如微众银行在2019年FinTech Day上发布了包括联邦学习技术FATE开源平台、区块链中间件平台WeBASE、金链盟底层开源平台FISCO BCOS等10款开源技术,同时也发布了金融科技加速器“We 加速”,首批七家企业加入其中,可依托微众银行的平台和技术优势,帮助企业实现科技化升级。此外,微众银行AI团队自主研发的全球首个工业级联邦学习框架 - 联邦学习开源项目FATE(Federated AITechnology Enabler),旨在为联邦学习架构体系和各种机器学习算法的安全计算提供强有力支持,帮助社会各界在符合数据安全和政府法规前提下,有效和协地进行数据使用和联合建模,同时为立法和监管提供技术依据,微众银行AI团队已于2019年6月将其自研的FATE捐赠给Linux Foundation。

业务价值方面,金融科技已经渗透到金融业务各领域,以借贷、理财、保险、支付等为代表的典型金融领域在快速发展的同时仍面临不少业务问题,金融科技在各业务领域中的创新与应用使业务痛点得到了不同程度上的解决。在全球经济增速放缓、中国经济进入新常态的宏观背景下,金融科技可提供更优质的金融基础服务能力、简化金融业务流程、降低金融服务成本的同时提升金融服务效率,不断驱动业务发展。

我们基于金融科技在不同业务中的创新应用和对业务痛点的改善,总结提炼了金融科技在业务中的价值主要体现在获客效率的提升、风控效果的提高、产品设计的精细化/差异化、成本结构的优化和更高效的多方业务协作。

2.1智能营销精准捕捉用户画像、深度挖掘用户需求

智能营销可精准捕捉用户画像、深度挖掘用户需求,通过整合多方数据,从多个维度实现对一个用户的深度理解和精准化定位,洞察用户潜在需求,并针对性地推出个性化品牌营销策略,有效降低获客成本、提高获客效率。

 

2.2智能风控助力风控升级

传统风控主要依靠人工进行身份信息匹配与查验,风控效果有待提升。随着金融科技的发展,利用多维度数据及AI风控模型实现智能风控的应用,帮助机构精准排查潜在风险用户。如微众银行推出了基于舆情的贷中风控平台,辅助识别贷中用户画像,提升风控效果。

 

2.3金融科技让金融产品设计去同质化,更加满足用户需求

通常保险、基金等金融产品的品类较为固定,同质化严重,缺乏产品创新。通过移动端、物联网设备等多方终端数据采集,利用大数据与AI技术实现用户需求深度分析,进而在一定程度上改善产品同质化现象。该应用目前处于行业早期阶段,保险为主要的应用方向之一,虽无法形成“千人千面”的金融产品,但一方面可以通过更加精准的用户需求定位设计出更加符合大众需求的金融产品,另一方面,可在一定程度上增加产品品类,让金融产品在更加贴近用户需求的同时,更加多样化。

 

2.4技术催化金融企业优化成本结构、增强版块协同

随着金融科技在业务中的逐渐渗透与应用,银行、保险等传统金融机构对于大量人力的依赖正逐渐变小,冗杂的业务流程和运作逻辑正被优化,大量重复性、机械性的工作被技术工具承担或替代,与此同时,获客效率、风控效果、业务增长等方面也受到了科技的促进作用。金融科技极大地降低了金融业务的获客、人力和运营等成本,技术支出在企业成本结构中的重要性越来越强,金融企业的成本结构正被逐步优化、各版块的协同性越来越强、企业的工作效率也随之不断提高。

 

 

 

2.5区块链通过组建联盟链网络,提升多方业务协作效率

如供应链金融、ABS等业务都需要多方参与并进行业务协作。由于传统IT技术的数据存储方式无法满足各金融业务参与方需求,所以无法构建一套企业间的业务协作系统。而区块链通过联盟链组网,可构建一套便于多方参与的链上业务协作系统,数据可经授权查看,智能合约等技术让业务协作链上化成为可能。

 

三、金融科技发展趋势

3.1监管科技成蓝海市场

2017年5月,央行成立金融科技委员会,在重点关注金融科技发展的同时强调了监管科技的重要性。之后,一系列鼓励监管科技发展政策文件陆续下发,2018年8月《中国证监会监管科技总体建设方案》的印发等一系列举措都为监管科技在中国的发展提供了有力的支持。与以美国、英国为代表的金融业发展成熟度高的企业相比,中国的监管科技企业起步晚、数量少,2013-2017年美国以外地区全球监管科技融资企业分布中,中国还不到4%。此外,金融科技在业务中的逐渐应用让传统的监管模式无法满足监管需求,监管升级迫在眉睫。政策与需求的双重推动下,监管科技将成为一个争相涌入的市场。

3.2区块链成金融科技重要战略方向

目前政策利好区块链技术发展,且区块链在金融服务和实体经济深度融合、解决中小企业贷款融资难、银行风控难、部门监管难等问题上都具备一定应用价值,这将带动金融机构对区块链技术投入的增加。2018、2019年中,银行业一直都是金融机构中区块链技术投入的主力军,保险、证券的刚需场景虽少于银行,但整体技术投入仍会在政策带动下呈增长趋势。随着金融机构加大区块链的技术投入与落地探索,也将加速区块链金融基础设施建设的完善。

 

3.3金融RPA价值逐渐显现

金融业务中流程化、重复性工作较多。相比于人工操作,RPA结合OCR、NLP等技术可降低业务执行错误率及非法操作。通过艾瑞对金融机构的调研发现:约68%的金融机构认为RPA可以对金融业务产生较大的价值且愿意尝试,以银行居多;约15%的金融机构对RPA的使用持中立态度;约17%的金融机构认为RPA在部分业务领域中很难落地,主要原因为监管制约以及目前RPA技术无法适应业务规则的快速变化,持该态度的以证券、保险公司居多。虽然目前看来中国金融机构RPA技术资金投入力度并不大,但是,RPA落地的业务场景正在逐渐丰富,且其可以加速AI等技术与金融业务的融合。因此可以预见,随着金融科技的进一步发展,未来金融机构对RPA的投入会逐渐增加,RPA所产生的价值也将更加可观。

未来的金融科技会有三个新的方向:第一,金融科技做真做实;第二,智能化,智能化会体现在三个方面,就是智能财务、智能风控、智慧银行;第三,上云、上链、上网,云计算和区块链会大幅提升互联网科技的基础能力。

金准产业研究团队表示,第一年与第二年的榜单中主要是金融科技公司,去年和今年的榜单开始出现变化的是金融科技创新从金融科技公司主导,走向金融机构与金融科技公司深度合作、领先金融机构主动推动并输出等多种模式并举。金融机构从观察者迅速转变成为了参与者和领导者,并在细分垂直领域,今年的榜单中出现了一些快速成长的“新星”企业。

以云计算、人工智能、区块链、大数据以及移动互联网等为代表的科技已经开始广泛的运用到金融服务各个领域中,促进了智能风控、智能保险、智能投研、智能客服、智能合规等各个领域科技应用的升级发展。

2019年8月22日,中国人民银行印发《金融科技(FinTech)发展规划(2019-2021年)》,提出到2021年建立健全中国金融科技发展的“四梁八柱”。随后不久,央行、监管机构及政府的有关部门就快速推进了多项工作,包含监管沙箱、金融科技技术标准化、金融科技认证体系、持续推进互联网金融风险专项整治、移动互联网应用收集个人信息基本规范(草案)以及金融APP专项治理等工作。

对于金融科技的创新方向,金准产业研究团队认为有四个新的努力方向:第一个是区块链,区块链当中最主要解决的是应用场景适用性的问题,如何满足批量处理;第二自然语义识别技术(NLP),目前一些头部科技企业的识别准确率可以达到98%左右,还差的1%到2%是最艰难和关键的,如果能突破最后的关口,NLP的应用前景会非常广阔;第三是生物技术,比如声纹技术,虹膜技术的应用,目前虹膜技术还主要用于要求较高的安保系统;第四是知识图谱,知识图谱是金融机构要解决的一个难点,关联关系以及交易的复杂性怎么通过知识图谱的能力去解决,一旦突破就能大大提高识别管理企业的信用风险能力。

金准产业研究团队认为还有第五个创新方向,正在到来的5G时代,有感场景入口的多元化多维度发展,将实现场景与大数据应用的更深层次结合,重塑金融行业生态格局的关键变量。特别在消费金融与供应链金融两个板块中,消费金融企业应整合迭代现有科技技术,构建新的业务模式,同时加强合规能力建设,提升企业自身竞争优势。

供应链金融企业将通过5G和区块链科技的结合,可能由产业供应链金融生态圈进一步发展到跨行业供应链生态圈的链接,信息高度融合也会催生出新的金融服务模式,从而进一步解决小微企业融资难题,促进核心企业的产融结合。

金准产业研究 达摩院报告分享 2020十大科技趋势

前言

2019年,各大公司的AI、云计算、大数据走向下沉市场,空中博弈进入到地面作战,技术的商业化成为生意成败的重要考量。其间,产业与场景成为大漏斗,好的技术得以被筛选重用。 

回首相望,过去的365天,产业AI与产业互联网成为AI落地的关键词,AI芯片规模化应用,专用芯片起势,机器学习、深度学习在工业、能源等各个场景进行实战;云计算成为百行千业数字化转型的核心纽带,云一跃成为巨头的核心赛道;5G2019年迎来正式商用,牌照相继发放,5G也在带动物联网、车联网的爆发,城市的数字化、孪生化成为共识;此外,区块链在2019年褪去热火,进行理性时代,并上升至国家战略,想象空间巨大。

这些,也刚好在此前阿里达摩院发布的《2019十大科技趋势》中被言中。 

但是,在2019这一整年,科技发展形势“一片大好”的背后,我们也试图追索那些深藏在暗处的隐忧,并为之提出更好的应对之策,对未来尽责。 

2020年1月2日,一元初始、万象更新的时刻,阿里达摩院又再度重磅向业界发布《2020十大科技趋势》,对AI、芯片、云计算、区块链、量子计算以及工业互联网等科技领域的未来发展做了重要预测。 

一、什么在掣肘技术的发展? 

阿里达摩院(Alibaba DAMO Academy for Discovery, Adventure, Momentum and Outlook)作为致力于探索科技未知,以人类愿景为驱动力的,立足于基础科学、创新性技术和应用技术的研究院,从诞生第一天起,就有3个重要使命:“活得要比阿里巴巴长”、“服务全世界至少20亿人口”、“必须面向未来、用科技解决未来的问题”。 

2年多的科研经历中,达摩院在机器智能、数据计算、机器人、金融科技等领域进行了诸多前沿的探索,并在此期间引进技术大牛,建立了完善的多学科人才基础,在技术前瞻性上,达摩院走在业界前列。 

达摩院也注意到,AI领域在取得不错成绩的今天,“拦路虎”依然众多。 

比如,AI的感知智能虽然超越人类水准,但是认知智能天花板依然存在,须从认知心理学、脑科学以及人类社会的发展历史中汲取更多的灵感,并结合跨领域知识图谱、因果推理、持续学习等研究领域的发展进行突破,以推动下一代具有自主意识的AI系统的建设。 

再比如,存储和计算中的冯·诺伊曼“瓶颈”(或“内存墙”)问题依然严峻,越往后,AI运算中数据搬运更加频繁,需要存储和处理的数据量远远大于之前常见的应用,AI要有突破,须对设计模式、计算架构维度做出创新。 

芯片是计算的核心,受到成本和市场压力的驱使,半导体产业在积极寻找新的芯片开发模式,来满足低成本、快速的需求。特别是随着芯片制程从10nm缩减到7nm,接下来还要进一步缩减到5nm,每一次制程缩减所需要的成本和开发时间都在大幅提升,但模块化将是个好思路。此外,随着摩尔定律逐渐失效,以硅为主体的经典晶体管缩放已经越来越难以维持,这对芯片材料提出挑战。 

在目前,工业互联网发展迅猛,甚至推动第四次工业革命的到来,但其依然面临制造企业内部的IT软件系统与OT设备系统须打通、厂外上下游产业链须优化组合、产品的设计和产品生命周期须优化管理等问题。 

当然,今天的芯片、数据库、网络、物联网等技术都无法离开云。 

随着传统IT接口开始逐渐被云端接口取代,软件技术和硬件技术之间的依赖程度被大幅度降低,云平台、技术开源、云用户三者形成驱动技术创新的新三角。全面上云时代,应用复杂、算力要求极高,算法、软件和硬件的隔阂造成巨大算力的浪费,已经无法满足在超大规模计算场景下提升IT计算效率、降低计算成本的诉求。 

此外,区块链技术应用已延伸到数字金融、数字政府、智能制造、供应链管理等多个领域,主流厂商纷纷进入区块链领域推动技术突破和商业化场景落地。区块链将正式面对海量用户场景的考验,这将对系统处理量提出了更高的要求,并加剧参与节点在信息存储、同步等方面的负担。 

二、2020十大科技趋势

技术发展有瓶颈,但不应成为止步不前的理由。面对科技向前的浪潮,总有人在理性思考,明灯指路。 

此次达摩院2020十大科技趋势报告,就是对以上掣肘技术发展问题的最好回答。回答中,还将诸多前沿性技术进行解构、彼此串联,以找到牵引产业创新的最新逻辑,金准产业研究团队认为值得详读。  

2.1人工智能从感知智能向认知智能演进

人工智已经在“听、说、看”等感知智能领域已经达到或超越了人类水准,但在需要外部知识、逻辑推理或者领域迁移的认知智能领域还处于初级阶段。认知智能将从认知心理学、脑科学及人类社会历史中汲取灵感,并结合跨领域知识图谱、因果推理、持续学习等技术,建立稳定获取和表达知识的有效机制,让知识能够被机器理解和运用,实现从感知智能到认知智能的关键突破。 

相较于感知能能这一人工智能1.0,人工智能2.0将更多基于数据,自动将非结构化的数据转变为结构化的知识,做到真正意义上的认知智能。探索如何保持大数据智能优势的同时,赋予机器尝试和因果逻辑推理能力,实现认知智能,成为当下人工智能研究的核心。

认知智能的机制设计非常重要,包括如何建立有效的机制来稳定获取和表达知识,如何让知识能够被所以模型理解和运用。这需要从认知心理学、脑科学以及人类社会的发展历史中汲取更多的灵感,并结合跨领域知识图谱、因果逻辑、持续学习等研究领域的发展进行突破。

认知智能将结合人脑的推理过程,解决复杂的阅读理解问题和少样本的知识图谱推理问题,协同结构化的推理过程和非结构化的语义理解。它也需要解决多模态预训练问题,帮助机器获得多模感知能力,赋能海量任务。

大规模图神经被认为是推动认知智能发展强有力的推理方法。图神经网络将深度神经网络从处理传统非结构化数据(如图像、语音和文本序列等)推广到更高层次的结构化数据(如图结构等)。大规模的图数据可以表达丰富并蕴含逻辑关系的人类常识和专家规则,图节点定义了可理解的符号化知识,不规则图拓扑结构表达了图节点之间的依赖、从属、逻辑规则等推理关系。以保险和金融风险评估为例,一个完备的AI系统需要分析个人的履历、行为习惯、健康程度等,还需要通过其父母、亲友、同事、同学之家的来往数据和相互评价进一步进行信用评估和推断。基于图结构的学习系统能够利用用户之间、用户与产品之间的交互,做出非常准确的因果和关联推理。

未来人工智能热潮能否进一步打开天花板,形成更大的产业规模,认知智能的突破是关键。认知智能可以帮助机器跨越模态理解数据,学习到最接近人脑认知的“一般表达”,获得类似于人脑的多模感知能力,有望带来颠覆性的产业价值。认知智能的出现使得AI系统主动了解事物发展的背后规律和因果关系,而不再只是加单的统计拟合,从而进一步推动实现下一代具有认知能力的AI系统。

2.2计算存储一体化突破AI算力瓶颈

冯诺伊曼架构的存储和计算分离,已经不适合数据驱动的人工智能应用需求。频繁的数据搬运导致的算力瓶颈以及功耗瓶颈已经成为对更先进算法探索的限制因素。类似于脑神经结构的存内计算架构将数据存储单元和计算单元融合为一体,能显著减少数据搬运,极大提高计算并行度和能效。计算存储一体化在硬件架构方面的革新,将突破AI算力瓶颈。 

经典的冯洛伊曼计算机架构中,存储单元和计算单元泾渭分明。运算时,需要将数据从存储单元赌球到计算单元,运算后会把结果写回存储单元。在大数据驱动的人工智能时代,AI运算中数据搬运更加频繁,需要存储和处理的数据量远远大于之前常见的应用。当运算能力达到一定程度,由于访问存储器的速度无法跟上运算部件消耗数据的速度,即使再增加运算部件也无法充分利用,从而形成所谓的冯诺依曼“瓶颈”,或“内存墙”问题。这就好比一台马力强劲的发动机,却因为输油管的狭小而无法产生应有的动力。

计算机瓶颈以及功耗瓶颈已经对更先进、复杂度更多的AI模型研究产生了限制。例如,最先进的自然语言处理模型XLNet有约4亿模型参数,每次训练需要数百个深度学习加速器运算三天。而据估算人脑中细胞间互联轴突个数更是高达百万亿到千万亿数量级。显然AI 在认知问题上离我们追求的所谓通用人工智能还有巨大差距,未来计算能力和计算系统的效率需要比现在至少提高几个数量及。因此人工智能要进一步突破,必须采取新的计算架构,解决存储单元和计算单元分离带来的算力瓶颈。

计算存储一体化,类似于人脑,将数据存储单元和计算单元融合融合为一体,大幅减少数据搬运,极大提高计算并行度和能效。计算存储一体化的研究无法一蹴而就,对于广义上计算存储一体化架构的发展,近期策略的关键在于通过芯片设计、集成、封装,拉近存储单元与计算单元对的距离,增加宽带,降低数据搬运的代价,缓解由于数据搬运产生的瓶颈。中期规划,通过架构方面的创新,设存储器于计算单元中或者置计算单元存储模块内,实现计算和存储你中有我,我中有你。远期展望,通过器件层面的创新,实现器件既是存储单元也是计算单元,不分彼此,融合一体,成为真正的计算存储一体化。近年来,一些新型非易失存储器,如阻变内存,显示了一定的计算机存储融合的潜力。

计算存储一体化正在助力、推动算法升级,成为下一代AI 系统的入场券。它提供的大规模更高效的算力,使得算法设计有更充分的想象力,从而将硬件上的先进性,升级为系统性的领先优势,最终加速孵化新业务。

更进一步,计算存储一体化是一个game=changer,开辟了一条新赛道。它的出现将重构当前处理器和存储器相对垄断的产业格局。再次过程中,可以帮助芯片行业中更多中小企业获得发展。

2.3工业互联网的超融合

5G、IoT设备、云计算、边缘计算的迅速发展将推动工业互联网的超融合,实现工控系统、通信系统和信息化系统的智能化融合。制造企业将实现设备自动化、搬送自动化和排产自动化,进而实现柔性制造,同时工厂上下游制造产线能实时调整和协同。这将大幅提升工厂的生产效率及企业的盈利能力。对产值数十万亿乃至数百万亿的工业产业而言,提高5%-10%的效率,就会产生数万亿人民币的价值。 

由于工厂环境复杂,现有工业系统之间的通信布线成为痛点。工厂的搬送机器人或一个工矿的掘机需要在一个大范围内频繁移动,wifi难以较好覆盖,而4G/Lora/NB的数据传输速率和延时达不到机器人想用的要求。随着5G技术的成熟,可以满足工业系统对于高可靠低时延的需求,DTU(无线传输设备)无论在部署上还是在运维上,较原本的有限方案都有着明显优势和极高性价比。可以预见的是,工业系统的互联将随着5G的建设而得到快速普及。

工业互联网主要解决三个问题:一是打通制造企业内部的IT软件系统与OT设备系统,进行自动派单,从而实现柔性制造;二是在工厂外实现上下游产业链的优化组合;三是更好的管理产品的设计和产品生命周期。

随着IoT PaaS的成熟,云端已经兼容了WiFi、BLE、Zigbee、Modbus、OpcUA、RS232等网络和链接协议。这些协议可以通过5G的模组非常方便的帮助原有的IT系统与云端打通。APS(自动排产软件)和MES(制造执行系统)可以从云端或边缘服务器直接下发工艺包和生产计划至每一个机台,从而实现IT(信息化)与OT(工控软件)的融合和工厂内部垂直集成。通过轻松把设备数据连到云上,将设备作业的数据连到业务系统(云上的IT系统)里面,可实现派工自动化,从而实现生产的实时调整,满足个性化需求定制。

每个企业处于核心技术保密受限于使用的生产系统软硬件不统一等原因,无法构成紧密的价值网络,导致价值网络整体的竞争力难以提升。利用分布式账本等技术,解决信任问题后,可以突破单个工厂的限制,将价值网络中的上下游企业工厂的制造系统连接起来,进而可以实现上下游制造产线的实时调整和协同,上游的流水线变慢,下游的流水线也可以速度放缓,从而使整个价值网络的竞争力得以提升。

现有生产模式中,产品价值链由产品设计、上产规划、生产工程、生产执行、服务等多个环节所构成,各环节数据来源不同,异构性强,难以互通,整个价值链的信息无法全透明。但是,基于工业互联网和数字孪生技术,在产品的设计阶段使用CAD软件设计产品的解析模型;在产品的使用阶段,利用5G和IoT PaaS采集关键参数,并且输入至云端的模型解析软件里,偏可以在该产品额全生命周期中很好地跟踪产品的性能和设计指标之间的差异变化。进一步,这些使用过程的信息便成为下一次产品迭代的重要的数据来源,如此周而复始,推动产品不断迭代进步。

工业系统通过工业互联网得以互联,工业互联网第一次让人类拥有并掌握了一个具备实时调整工业系统能力的工具,从而大幅度促进了生产效率、降低了库存、提高了质量。对于产值规模达到数十万亿乃至数百万亿的工业产业而言,即使效率仅仅只提高5%-10%的效率,也会增加数万亿人民币的价值。

2.4机器间大规模协作成为可能

传统单体智能无法满足大规模智能设备的实时感知、决策。物联网协同感知技术、5G通信技术的发展将实现多个智能体之间的协同——机器彼此合作、相互竞争共同完成目标任务。多智能体协同带来的群体智能将进一步放大智能系统的价值:大规模智能交通灯调度将实现动态实时调整,仓储机器人协作完成货物分拣的高效协作,无人驾驶车可以感知全局路况,群体无人机协同将高效打通最后一公里配送。 

随着人工智能发展迎来又一次浪潮,越来越多的智能设备参与到人类日常生产活动中,影响着人们生活的方方面面。随着“万物互联”概念的提出,大量的智能设备被连接起来,形成一个智能设备网络,实现信息共享、统一控制。

在大规模智能设备网络中,机器与机器之间的交流与写作将十分重要。这种协作奖优化整体的长期目标,涌现群智,从而进一步将智能系统的价值规模化放大。以城市级别的交通灯控制任务为例,它关注长期城市交通的车辆通行顺畅度。现实环境中,一个城市级别的交通灯控制规模巨大,不同时期又有不同的控制策略,每个路口红绿灯的控制策略取决于实时车流信息及邻近范围内其它路口的交通控制策略。这种要求动态实时调整的大规模智能网略,使用原有的基于规则的方法很难实现,而基于多智能体强化学习的大规模交通控制技术可以解决这一难题。

未来5年,多智能体协作在城市生活的方方面面落地发展,仓储机器人的高效协作完成货物的快速分拣,提升物流效率,降低存储和运输成本;道路上的无人车能够决定并道时是否让其它车先行,提升无人驾驶的安全性和交通效率;交通灯根据当前路口和邻近路口的实时交通情况来决定调度信号,真正盘活猪呢个股城市高峰时期的交通;网约车平台会根据城市不同地点各个时间的打车需求来优化给每辆车的派单,降低用户等车时间,提升司机收入。

多智能体协同及群体智能这样全新的人工智能范式的发挥在那和普及将会带来整个经济社会的升级,让人工智能不再只是单个的工具,而是协调整个人类工作网络的核心系统。

2.5模块化降低芯片设计门槛

传统芯片设计模式无法高效应对快速迭代、定制化与碎片化的芯片需求。以RISC-V为代表的开放指令集及其相应的开源SoC芯片设计、高级抽象硬件描述语言和基于IP的模板化芯片设计方法,推动了芯片敏捷设计方法与开源芯片生态的快速发展。此外,基于芯粒(chiplet)的模块化设计方法用先进封装的方式将不同功能“芯片模块”封装在一起,可以跳过流片快速定制出一个符合应用需求的芯片,进一步加快了芯片的交付。 

AIoT时代世间万物足部走向在线化、数据化、智能化,不仅将带来芯片需求的爆发式增长,形成巨大的市场空间,同时其碎片化和定制化的特点,也对芯片设计模式提出了新的要求。芯片行业传统的比投资、比品牌、比工艺的“大鱼吃小鱼”格局,正逐渐被比市场灵敏度、比需求适配、比速度和价格的“快鱼吃慢鱼”格局所取代。在应用驱动的趋势下,谁能快速推出专用芯片,就能抢占市场先机。越来越多的胸和应用服务公司在推出专用芯片,例如苹果、谷歌、阿里巴巴、亚马逊、特斯拉等应用企业开始进入芯片设计领域,自研或联合开发芯片产品。

现有的芯片设计模式存在研发成本高、周期长等问题,开发一款中档芯片,往往需要数百人年、数千万甚至上亿美元的研发投入,严重阻碍了芯片创新速度。特别是随着芯片制程从10nm缩减到7nm,接下来还要进一步缩减到5nm,每一次制程缩减所需要的成本和开发时间都在大幅提升。受到成本和市场压力的驱使,半导体产业在积极寻找新的芯片开发模式,来满足低成本、快速的需求。基于IP的可重用的设计方法学,解决了芯片功能模块重复设计的问题,使得芯片可以以模块化的方式进行设计,不同功能的IP模块可以在不同的芯片中被重用,这种方法推动了系统芯片对的普及。

近年来,以RISC-V为代表的开放指令集及其相应的开源SoC芯片设计、以Chisel为代表的高级抽象硬件描述语言和基于IP的模块化的芯片设计方法,推动了芯片敏捷设计方法,推动了芯片敏捷设计方法与开源芯片生态的快速发展,越来越多芯片企业开始尝试开源硬件架构进行设计。

面向未来,一种“小芯片”的模块化设计方法正在成为新的行业趋势。这种方法通过对复杂哦功能进行分解,开发出多种具有单一特定功能的“小芯片”,如实现数据存储、计算、信号处理数据流管理扥功能。把这些不同功能的小芯片进行模块化组装,将不同的计算机原件集成在一块硅片上,来实现更小更紧凑的计算机系统结构。当前的芯片设计模式,需要从不同的IP供应商购买IP,包括软核IP或硬核IP,再结合自家研发的模块,集合成一个SoC,然后在某个制造工艺节点上完成芯片设计和生产的完整流程。未来计算机的系统结构,可能不是由单独封装的芯片制造的,而是在一块较大的硅片互联成芯片网络的Chiplets制造的模块化的芯片技术最终可以实现像搭积木一样组装芯片。

模块化的设计模式可能带给从上游EDA工具、IC设计到制造工业、现金封测等产业链环节颠覆式的创新革命,重塑芯片的产业格局。由此带来的芯片设计门槛的降低可以让设计者以更低的成本和更高的效率定制领域专用芯片,引发一场芯片设计模式发展,释放市场创新活力,繁荣芯片产业。

2.6规模化生产级区块链应用将走入大众

区块链BaaS(Blockchain as a Service)服务将进一步降低企业应用区块链技术的门槛,专为区块链设计的端、云、链各类固化核心算法的硬件芯片等也将应运而生,实现物理世界资产与链上资产的锚定,进一步拓展价值互联网的边界、实现万链互联。未来将涌现大批创新区块链应用场景以及跨行业、跨生态的多维协作,日活千万以上的规模化生产级区块链应用将会走入大众。 

2019年是区块链历程白的一年,区块链技术正式被定位为国家战略,为区块链产业的发展打开额巨大的想象空间。区块链连技术应用已延伸到数字金融、数据局政府、智能制造、供应链管理等多个领域,主流厂商纷纷进入区块链领域推动技术突破和商业化场景落地。以JP Morgan Coin和Facebook Libra为代表的企业稳定币与国家主权数字货币正在试图重构全球金融基础设施网络。区块链将正式面对海量用户场景的考验,这将对系统处理量提出更高要求,并加剧参与节点在信息存储、同步等方面的负担,在现有技术环境下会导致系统性能和运行效率的下降。

区块链的路线之争逐步清晰,从颠覆到补充,从去中心到去中介,联盟链架构成为行业主流技术路线。聚焦研发高吞吐、低延时大规模共识网络,各行业内提升多方协作效率的价值链接局域网逐步呈现。在传统物理世界中,链外到链上锚定过程中的信息真实性保障一直是全行业技术攻关的重点。目前各个行业中正在逐步形成的局域网,通过更好地实现数据共享,帮助价值网络的无障碍流动,有望形成真正的价值互联网络。在商用网络中,区块链保证所有信息数字化并实时共享,使得离散程度高、链路长、涉及环节多的多方主体仍能有效合作,但与此同时,也带来了存储成本、秘钥安全、数据隐私等方面的压力。

展望2020年,区块链BaaS服务将进一步降低企业应用区块链技术的门槛。在商业应用大规模落地的同时,区块链玩过的“局域网”和“数据孤岛”问题将被新型的通用跨链技术所解决。自主可控的安全与隐私保护算法及固化硬件芯片将会成为区块链核心技术的热点领域,保障基础设施的性能和安全。以端、云、链的软硬件产品为基础的一站式解决方案,进一步加速企业上链与商业网络搭建的进程。区块链通过于AIoT技术融合实现物理世界资产与链上资产的锚定,进一步拓展价值互联网的边界实现万链互联。这也将进一步夯实区块链在数字经济时代数据和资产可信流转的基础设施地位。

在电气时代,用电量是衡量经济水平的核心指标;在4G时代,互联网上的活跃用户数是繁荣的标志;在数字经济时代,面对即将到来的海量用户场景,我们相信很快将会井喷式地涌现大批创新区块链应用场景以及跨行业、跨生态的多维协作。与此而来的,一批日活千万的区块链规模化生产级应用将会走入大众。以区块链为基础的分布式账本,将在数字经济中进一步推动产业数字化形成的价值有效传递,从而构建新一代价值互联网和契约社会。

2.7量子计算进入攻坚期

2019年,“量子霸权”之争让量子计算在再次成为世界科技焦点。超导量子计算芯片的成果,增强了行业对超导路线及对大规模量子计算实现步伐的乐观预期。2020年量子计算领域将会经历投入进一步增大、竞争激化、产业化加速和生态更加丰富的阶段。作为两个最关键的技术里程碑,容错量子计算和演示实用量子优势将是量子计算实用化的转折点。未来几年内,真正达到其中任何一个都将是十分艰巨的任务,量子计算将进入技术攻坚期。 

通过利用量子力学中非经典的性质,量子计算有望颠覆当前的计算技术,给经济和社会带来变革性的进步。目前量子计算正处于从实验室走进实际应用的转变之中。2019年谷歌宣称达到“量子霸权”的里程碑,即其量子计算器件可执行一个任何景点计算机都无法完成的任务。另一领军团队IBM当即反驳,称该任务仍在景点算力之内。且不论争论的是非,谷歌在硬件上的进展大大增强了行业对超导路线以及对大规模量子计算实现步伐的乐观预期。2020年的量子计算将蓬勃发展,主要特点是技术上进入攻坚和产业化的加速阶段。

技术方面,超导量子计算仍将继续占据中心舞台,并对其他硬件路线造成严峻的压力。因为谷歌在超导方向上的成果皆为已知技术,多个追赶者将按图索骥,在2020年或作出令人钦佩的复制性结果,或陷入高度复杂的工程噩梦。而领先团队的目标依然锁定在比“量子霸权”更重要且毫无争议的梁哥里程碑:容错量子计算和演示实用量子优势。前者指的是如何通过量子纠错,避免硬件错误的累积,技术上需要同时在“高精度”和“大规模哦”两个维度上突破。后者指有力地证明量子计算机可以用超越经典计算的性能解决一个有实际意义的问题。至于演示实用量子优势是否能绕过纠错,还有待历史证明,因为实际问题要求的规模可能如此之大,导致对精度的要求不低于纠错的要求。早2020年,乃至未来几年,毫无争议地达到这两个目标中任何一个都非常艰巨,故而量子计算将进入技术攻坚时期。

产业和生态方面,政府、企业和学术机构的规则和投入将升级、扩大。竞争将在多个维度激化:领军团队规模扩充的同时透明性下架;认为设障的风险上升。产业分工将进一步细化:制冷、微波、低温电子控制、设计自动化、制备代工等领域在资本推动、政策扶植和生态滋养下蓬勃发展。各行龙头企业家里探索应用,助力算法和软件。

国际上工业界-学界-开放性平台和服务三方将相互赋能。工业界的工程复杂度任何纯学术团队无法企及;学界将探索颠覆性的方向;开放性平台和服务将降低研究和创业的时间和资本,加速整个领域的迭代和创新速度。这一生态依赖于人才的自由流动,深厚的基础研究能力,和强大的企业执行力;并将得益于大面积且高效的政府投入,及以降低门槛、激励创新、带动民间投入为目标的政策引领。

预期和现实总在上下交替的舞蹈中螺旋上升。过去两年硬件的进展为量子计算赢得了未来一段时间攻坚作战的粮草。2020年的技术进展将主要是基础技术的突破。虽然不一定为大众津津乐道,但将助推量子计算未来的又一个高潮。

2.8新材料推动半导体器件革新

在摩尔定律放缓以及算力和存储需求爆发的双重压力下,以硅为主体的经典晶体管很难维持半导体产业的持续发展,各大半导体厂商对于3纳米以下的芯片走向都没有明确的答案。新材料将通过全新物理机制实现全新的逻辑、存储及互联概念和器件,推动半导体产业的革新。例如,拓扑绝缘体、二维超导材料等能够实现无损耗的电子和自旋输运,可以成为全新的高性能逻辑和互联器件的基础;新型磁性材料和新型阻变材料能够带来高性能磁性存储器如SOT-MRAM和阻变存储器。

半个世纪以来半导体产业都在竭力遵循摩尔定律,在取得巨大经济效益的同时也从根本上改变了人类社会的发展进程。人工智能及大数据兴起为云端及终端装置带来更多创新的同时也使得半导体产业的发展面临着摩尔定律放缓导致的产品升级困难以及大数据导致的算力和存储需求爆发的双重压力。以硅为主体的经典晶体管缩放已经越来越难以维持,从而难以实现半导体产业的持续发展。

从近期来看,新材料可能会代替传统的硅作为晶体管的同道材料以提升晶体管的速度。新的介电材料可能会导致超陡的亚阈值坡度以降低晶体管的能耗。新的金属材料可能会替代钨和铜作互联导线以增强稳定性和减缓信号延迟。二维材料或外延生长的纳米层材料可能会导致3D堆集的架构以增加芯片的密度。这些器件的物理机制答题清楚,但是大规模应用还需要半导体厂商来解决工艺实现、工程配套等方面的挑战。

从更长远的角度来看,更具挑战性的材料及全新的物理机制将是半导体产业能够保持加速指数式的增长额关键。新物理机制是全新的高性能的逻辑和互联器件的基础,比如基于量子效应的强关联材料和拓扑绝缘体、新发现的二维材料中魔幻角度下的超导现象等会导致无损耗的电子和自旋输运。利用新的磁性材料的自旋-轨道耦合现象可以制备全新的高性能磁性存储器如SOT-MRAM,而利用新的阻变现象使得全新的高密度、高稳定性的阻变存储器(RRAM)成为可能。虽然这些全新的工作机制还处在早期的探索中,但他们能从根本上解决传统器件在物理原理层面所受到的限制,实现对摩尔定律的突破。

新材料和新机制将会对传统的半导体产业进行全面洗牌,包括材料的生长、器件的制备以及电路的工作原理都会发生根本性的变化。这对设备厂商,晶圆厂及电路设计公司都会带来历史性的挑战和基于,也会为新兴的公司及产业提供振奋人心的发展机会。

2.9保护数据隐私的AI技术将加速落地

数据流通所产生的合规成本越来越高。使用AI技术保护数据隐私正在成为新的技术热点,其能够在保证各方数据安全和隐私的同时,联合使用方实现特定计算,解决数据孤岛以及数据共享可信程度低的问题,实现数据的价值。 

数字经济时代,数据成为社会经济发展的新生产要素,数据流动价值也越来越受到人们的重视。然而在企业数字化建设过程中,由于规划、设计、管理等方面存在的问题,导致业务系统在功能上不关联互动、信息不共享互换,在各个系统之间容易形成孤岛问题,进一步制约数据共享所带来的流动价值。

在越来越多对数据隐私的担忧声中,政府开始行动制定数据使用合规法案,大量的数据因为需要依法保护而无法被联合在一起计算。针对“数据孤岛”现象,目前大部分数据共享平台本质上都是基于中心化的数据交换机制,存在过程复杂、通信成本高、效率低、所有权模糊化、数据泄露风险大的缺点,而且无法保护用户的个人隐私。保护隐私的AI 安全技术能够在保证各方数据安全和隐私的同时,联合使用各方数据来达到特定的训练与使用AI 的目的,从而充分发挥数据的价值,解决数据孤岛以及数据共享可信程度低的问题。

保护数据隐私的I 安全技术拓展传统分布式计算以及信息安全范畴,为网络协作计算提供一种新的计算模式。它可通过多方计算、差分隐私、同态加密、混淆电路、加密搜索与计算、可信软硬件等;也可利用人工智能保障模型鲁棒与安全性,如模型加固、数据毒化防御、对抗性样本防御等。基于隐私保护技术为核心构建数据安全体系,必将成为发展大数据、云计算和物联网的基石。

一直以来,平衡发展效率和安全风险四大数据产业的核心问题,拥有海量数据的政府企事业等组织一方面对数据的隐私负有重要额保护责任,另一方面也享有数据的使用价值;作为终端用户的个体在法律法规的保护下可以控制个人数据的访问权,也能参与价值分配。而在AI 安全技术的保障下,组织或个人不必转让数据的拥有权,而是通过出租数据的使用权参与价值分配。以联邦学习为代表的安全多方计算应用,能解决行业大数据聚合过程遇到的挑战,例如购物平台和银行等金融机构的产品推荐所面临的数据属性维度不足,以及医疗诊断和语音助手行业的数据用户量不足等问题,并促使公共政务数据得以开放惠民新业。

2.10云成为IT技术创新的中心

随着云技术的深入发展,云已经远远超过IT基础设施的范畴,渐渐演变成所有IT技术创新的中心。云已经贯穿新型芯片、新型数据库、自驱动自适应的网络、大数据、AI、物联网、区块链、量子计算整个IT技术链路,同时又衍生了无服务器计算、云原生软件架构、软硬一体化设计、智能自动化运维等全新的技术模式,云正在重新定义IT的一切。广义的云,正在源源不断地将新的IT技术变成触手可及的服务,成为整个数字经济的基础设施。

在传统IT时代,随着计算机技术的发展,业界为计算机定义了标准的软硬件接口,让软件技术和硬件技术之间的依赖程度大幅度降低,可以分离演进,并行发展。在全面上云的云计算时代,传统的软硬件分离迭代的模式逐步显现出局限性,现今的应用越来越复杂,对算力的要求越来越高,而算法、软件和硬件的隔阂造成算力的巨大浪费,已经无法满足在超大规模计算场景下提升IT计算效率、降低计算成本的诉求。同时随着大多数企业开始全面拥抱云计算,如何最大化发挥“云”的价值实现应用的快速上线和高效运行、业务的秒级启动等是企业从容地应对市场快速变化的关键。

在软硬件核心技术领域,通过自主可控的技术重新设计软硬件之间的系统接口,使算法、软件和硬件设计的沟通更加紧密,让现有硬件的算力发挥到极致,打造适合云基础设施的新型计算机。一方面通过大幅提升计算效率,有望突破传统IT时代摩尔定律的计算力增长曲线,凸显云计算的整体优势。在过去的几年中,用于机器学习加速的AI芯片以及新一代虚拟化专用芯片等都是充分利用软硬件协同设计模式带来计算效率提升的典范。另一方面,软硬件协同设计有利于加强对底层技术的控制能力,提升云的可靠性和易用性。

在云资源交付方式上,云原生让云计算变得越来越标准化。基于无服务器计算的应用开发和交付方式进一步解放云计算能力。Serverless通过更高层次的抽象,由云平台来负责计算资源的分配、管理和伸缩,让开发者只需关注自己的业务逻辑,而无需显示地保有计算资源,免去资源管理、系统运维等工作,按需付费的计费方式也可以帮助开发者实现成本优化。无服务器计算进一步简化微服务应用架构,用户只需书写事件驱动的函数实现即可,及大地降低构建云应用的难度。同时无服务器计算进一步推动事件驱动应用架构的发展,有效解耦事件源和事件处理者,为企业提供一个灵活的系统,能够快速适应变化并实时做出决策。

未来的软件一定是生长于云上的,云原生和无服务器计算正在重塑整个软件生命周期,从软件需求设计、研发、发布、构建分发到运维等。在ALL-in-Cloud的时代,基于软硬一体化重新设计的云计算基础设施以及通过云原生的崭新资源交付方式在提高计算效率、易用性的同时降低计算和运维成本,进一步巩固成为数字经济时代基础设施。

对话谷歌CEO皮查伊:管理大公司碰到无数成长烦恼

据外媒报道,搜索广告巨头谷歌首席执行官桑达尔·皮查伊(Sundar Pichai),于2019年12月3日成为母公司Alphabet的掌舵人,开始接替联合创始人拉里·佩奇(Larry Page)和谢尔盖·布林(Sergey Brin)打理两家公司的日常业务。升职后在谷歌位于加州山景城的总部首次接受采访中,皮查伊与记者进行了广泛的交谈,讨论了他的登顶之路、肩负的沉重管理负担,以及经营一家不再年轻的大型科技公司的利弊。


以下是专访皮查伊的采访摘要:


问:拉里·佩奇和谢尔盖·布林是什么时候告诉你,他们打算辞去当前职位的?


皮查伊:随着时间的推移,我们进行了一系列对话。谷歌在2018年庆祝成立20周年,我们当时开始就更长期目标展开对话。而当谷歌在2019年9月份庆祝成立21年时,那是个重要的里程碑。他们确实是在公司满21岁的时候和我谈过这件事,就像对待准备独立外出闯荡的孩子那样。他们确实想扮演不同的角色,既是顾问,也是创始人。


对新老板的期望


问:Alphabet成立后,你在2015年成为谷歌首席执行官。现在你同时管理这两家公司,那么现在Alphabet还有存在的理由吗?


皮查伊:我肯定认为需要。这让我们不必组建庞大的管理团队,试图扩展和处理许多不同的、独立领域的挑战。有时,我们需要已完全不同的方式对待这些领域。它们是不同的业务,囊括不同的范围。Alphabet让我们可以用我们需要的不同结构来进入其他领域。举例来说,我们有非常成功的风险和成长型投资组合,这使我们能够与数百家公司建立真正的合作伙伴关系。


我们可以用投资公司的纪律和严谨来管理他们。我还认为,有了“其他赌注”,我们肯定可以进入这样的状态:在我们着眼长远目标的同时,我们也希望能将确保它们做得好的纪律结合起来。Alphabet结构允许我们将其中某些东西作为独立公司剥离出去,并从外部投资者那里筹集资金。因此,以Verely为例,我们有像银湖(Silver Lake)和淡马锡(Temasek)这样的世界级投资者,我们有独立的董事会。它是可以正常运作的公司。


技术专家兼高管


问:你提到了投资纪律。Alphabet旗下的非谷歌业务损失惨重。现在,既然你掌权了,我们应该期待看到更多的投资纪律吗?


皮查伊:问题是,你如何评估你正在创建的实体的价值,你的其他合作伙伴和其他利益相关者又是如何评估的?这是我们已经前进的一个方向。但是你会看到我更多地关注这一点,并更多强调它。


问:你会为更多的Alphabet实体寻找外部投资者吗?


皮查伊:我们预计,随着时间的推移,大多数“其他赌注”公司都会遵循类似的过程。


问:我们了解到,虽然你是工程师出身,但你并不是计算机科学家。你学的是材料科学,那你为何选择的职业是高管而不是担任技术人员?


皮查伊:我在工程部工作了很长时间,我是一名半导体工程师。我早期的工作是构建1 GB的DRAM芯片。但随着互联网的出现,我意识到它将对我们所做的一切产生深远的影响。我看到了这种转变,并希望更直接地参与互联网的发展之中来。


问:你在谷歌扬名的原因是领导了Chrome浏览器的开发,为什么这件事这么重要?


皮查伊:2004年,Flickr、Google Maps和Gmail都是这个激动人心的努力的重要组成部分。在这个过程中,网络正在从仅仅关于内容转向实际运行应用程序。就在这一刻,我们意识到浏览器实际上是个平台,一个用于互联网的现代操作系统。我们大约在2005年开始研发Chrome,但它在2011年或2012年才真正站稳脚跟。这些事情需要时间,这就是创新的场景。


规模化管理


问:谷歌比你刚加入的时候扩大了很多。作为高管,你是如何面对其迅速增长的?


皮查伊:首先,规模优势很大。它使我们能够有长远的眼光,坚持以用户为中心,并追求更多项目,即使在短期价值不清楚的情况下也能够如此。例如,我们很早就开始投资人工智能(AI)。当我接任首席执行官时,我所做的重大转变之一就是真正接受了“AI优先”战略,并将AI融入到产品构建过程中。


许多年前,我们不得不投资数千万美元来建造特殊的AI芯片。那是在我们还不清楚我们会把所有这些都用来做什么之前,但规模化是让你作为公司能够在某种程度上押注于这些趋势的重要原因。随着规模的扩大,挑战无疑也随之而来。规模化的执行难度更大。


但你经常会发现,当公司规模较小时,他们会做出更多更像是将整个公司都押上的决定。然后,他们在规模上往往会变得更加保守。那么,你如何确保作为一家公司,你始终能够保持雄心勃勃,愿意承担风险,愿意犯错,在拥抱成功的同时容忍失败?


问:除了在“其他赌注”中,还有什么例子可以说明你在谷歌“核心”是如何做到这一点的?


皮查伊:量子计算对我们来说已经是努力了13年的项目。许多年前,我们看到了向其他公司提供我们的云计算技术的机会,但我们意识到,推动这一转变的是,我们首先要成为云计算领域的“企业优先”公司。这就是你所做的承诺和你所走过的旅程。所以我们总是下大赌注。但你必须更加努力地工作,以确保你的工作效率。


问:对于一位首席执行官来说,这肯定也是个艰巨的个人挑战。你有多少直接下属?


皮查伊:现在大约有16人。


问:你想要个2号人物,或者说首席运营官吗?


皮查伊:我们有许多非凡的领导者,他们真正有权经营自己的企业。我们有世界级的职能领导者。我确实认为这是一项团队运动。例如,如果你想在Google Pixel的上下文中构建出色的“助手”体验,我们需要不同的团队联合起来才能实现这一点。我们有非常能干的领导人。以托马斯·库里安(Thomas Kurian)运营云计算平台为例,他可以为克劳德做决定,我和他密切合作。


问:我听到你说现在不是优先考虑在你和你的16个直接下属之间安排“中介”?


皮查伊:我们有运作良好的企业结构。


问:让我们来谈谈谷歌著名的企业文化。去年,您戏剧性地改变了公司的TGIF全体员工大会的传统。这是为什么?


皮查伊:我们将继续举行TGIF大会,并且我们将始终对TGIF进行更改。大多数员工,当他们从外部进入谷歌时,无论他们进入时的级别是什么,他们都会被公司内部的透明度所震撼。这些都是公司珍视的传统。只是当公司员工超过十万人的时候,你还能如何坚持做这些事情?


问:但您当时很清楚,TGIF存在信息泄露的问题。这意味着某些员工不再值得信任。


皮查伊:在如今这种规模上,TGIF肯定变得更加困难。没有背景介绍的透明度也不容易保持。当你有1000名员工时,每个人都有共同的背景来决定做什么。试图在10万人中做到这一点并不容易,这些就是它的细微差别。因此,这是我们将要改变的东西,并不断发展和继续。


问:你认为谷歌员工的权利是否太大了?


皮查伊:哦,不。我感到幸运的是,员工非常关心他们所做的工作和工作所产生的影响。


问:你认为谁是你们最大的竞争对手?


皮查伊:我一直担心,作为一家规模较大的公司,最大的竞争对手可能来自内部:你不能很好地执行决策,专注于错误的事情,而且会分心。我认为,当你专注于竞争对手时,你就会开始追逐和奉行别人擅长的东西,而不是让你作为一家公司变得优秀的东西。


问:你有没有考虑过监管机构以反垄断为由拆分Alphabet的情况?


皮查伊:在达到当前这种规模时,我们意识到将会有审查。我们总是建设性地参与,并在某些领域有时可能不同意的情况下接受反馈。但显然,我们理解监管者的角色。


问:你如何才能让怀疑者相信谷歌可以被信任,把用户的数据交给他们呢?


皮查伊:如今,我们为用户提供许多最重要的服务。每天都有用户来到谷歌,向我们询问深刻的问题。保护隐私是我们不断发展并努力做得更好的东西。我们认为,随着时间的推移,我们可以使用AI给数据较少的用户带来更多好处。这就是我们正在努力的方向。


问:你对云计算的看重似乎清楚地表明,亚马逊拥有值得与之竞争的业务。


皮查伊:我们是拥有原生云计算服务的公司。作为一家公司,我们运营着许多服务,每项服务都有10亿用户,我们和其他人一样长时间地从事云计算业务。这是个巨大的机会,但我们之所以这样做,是因为我们真诚地认为,当我们审视我们的技术时,我们看到我们可以提供与众不同的东西,而且我们的能力是世界级的。我们显然有竞争对手。但是你做某事的目的是为了关注用户。你想要从那里开始,因为那才是真正的前进方向。


问:在采访结束之前,我注意到手腕上的Fitbit,但我没在你的身上戴着类似设备。


皮查伊:我对自己穿戴的设备很谨慎,因为我们一直在测试东西,我从来不知道什么东西发布了。我们显然对利用技术帮助数百万人改善健康状况的潜力感到兴奋。


问:最后一件事。你上个月获得了巨额加薪,你和你的妻子对如何处理你的财富有计划吗?


皮查伊:我一直认为,社会在帮助我取得今天的成就方面发挥了重要作用,我们的目的是回馈社会。我一直认为我的生活已经进入这样的状态:我正在努力工作,并试图通过我们制造的产品在我所做的工作背景下产生影响。但在我生命中的某个阶段,我想退后一步,这将涉及到回馈社会。

紧跟潮流,iPhone或将推出海军蓝配色

Facebook 四季报营收好于预期,但增速仍低于30%

北京时间1月30日,Facebook发布了2019财年第四季度财报。


财报显示,截至12月31日的第四季度,得益于Instagram和视频广告业务营收大幅增长的推动,其营收达到210.82亿美元,相较同期的169.14亿美元增长25%,超出市场预期的209亿美元。不过,这也是该公司营收连续第四个季度增速低于30%。


其中,其广告业务的营收为207.36亿美元,比上年同期的166.40亿美元增长25%;来自于其他业务的营收为3.46亿美元,比上年同期的2.74亿美元增长26%。


财报显示,Facebook第四季度净利润为73.49亿美元,比上年同期的净利润68.82亿美元增长7%。Facebook第四季度每股美国存托凭证摊薄收益为2.56美元,比上年同期2.38美元的每股美国存托凭证摊薄收益增长8%。


财报显示,Facebook第四季度总成本和支出为122.24亿美元,比上年同期的90.94亿美元增长34%;2019财年的总成本和支出为467.11亿美元,比2018财年的309.25亿美元增长51%。伴随着总成本和支出的同比大幅增长,Facebook的运营利润率从2018年的45%,降至2019年的34%;净利润同比增速降至7%,远低于2018年第四季度的61%。


财报显示,其日活跃用户为16.6亿人,月活跃用户为25亿人, 平均每位户营收为8.52美元。其首席运营官谢莉尔·桑德伯格(Sheryl Sandberg)表示,该公司目前已拥有超过800万广告主,高于截至2019年10月末的700万。


过去一年,Facebook在众多监管挑战中挣扎。该公司去年6月宣布了数字加密货币“天秤币”项目。但该项目受到全球立法者和监管者的抵制,并在过程中失去了关键合作伙伴。去年7月,Facebook同意向联邦贸易委员会支付50亿美元罚金,目前,Facebook还面临着4宗单独进行的反垄断调查。


当前,美国民主党总统候选人指责扎克伯格决定继续允许政治广告中的错误信息。此外,该公司退出了全美排名前10名的雇主名单,并承诺出资1.3亿美元为内容政策监督委员会提供资金。


财报发布后,公司董事长兼首席执行官马克-扎克伯格(Mark Zuckerberg)、首席运营官谢丽尔-桑德博格(Sheryl Sandberg)和首席财务官大卫韦纳(David Wehner)召开了电话会议,介绍了公司第四季度的经营和财务状况,并现场回答了分析师提问。


电话会议中,扎克伯格表示,对数据保护和隐私监管制度带来的大部分影响都进行了研究,并且进行了战略调整。现在他们充分利用第三方网站上的用户数据,识别主要用户活动,来进行广告投放。


同时,他表示,目前监管对公司带来的影响主要有三点:一,最近出台数据管理制度比如GDPR继续带来了很大的影响。第二,浏览器和第三方供应商中的移动运营系统,苹果和谷歌对此已经做出了产品调整,去限制客户对数据的使用;最后,Facebook对自己的产品进行了调整,这样一来用户对数据的使用受到了一定的限制。这三个因素对其广告定点投放造成了一定的影响,也对公司整体的营收起到了负面作用。