• 项目
首页>>文章列表
文章列表

5G手机最快明年入市:小米OPPO完成5G信令连接

OPPO、vivo、小米等中国手机厂商相继宣布了商用5G智能手机的研发进展,根据三家手机公司的研发时间表,5G手机最快明年和消费者见面。


9月3日,小米(01810.HK)宣布,小米手机已于8月31日成功打通5G信令和数据链路连接,这也是小米在5G研发历程上一个重要进展。本次连接使用高通骁龙X50 5G调制解调器及配套射频方案,并针对手机主板堆叠、射频/天线设计做了针对性优化,为2019年正式推出5G手机打下了坚实基础。


此前的8月28日,OPPO广东移动通信有限公司宣布,公司成功基于可商用手机完成了5G信令和数据链路的连接。此次连接利用基于OPPO R15开发的可商用5G智能手机实现,该手机集成了骁龙X50 5G调制解调器,验证了可用于加速5G智能手机开发的相关技术。OPPO研究院院长刘畅表示,这将为2019年发布可商用的5G产品奠定基础。


8月30日,vivo宣布,基于最新旗舰手机vivo NEX平台,vivo已经初步完成了面向商用的5G智能手机软硬件开发,包括架构规划、主板堆叠、射频和天线设计以及优化电池空间等方面的工作,并且在尺寸和外观上也已经达到了可商用级别。接下来,vivo 5G手机即将进入和网络设备联调测试工作阶段。按照此前规划,2019年,vivo将会推出5G预商用手机。到2020年,配合中国5G网络的规模商用,vivo将正式推出5G商用手机。


技术层面,澎湃新闻记者注意到,小米和OPPO均采用了5G NR n78频段,该频段是目前全球最广泛使用、最先部署的频段之一,对第一批5G产品的商用具有重要意义。


5G NR(New Radio),即5G新空口,是3GPP等国际标准化组织专为5G制定的无线信号传输规范。


作为通信技术更新的重要节点,5G将全面提升网络的速率(理论下载速度要比4G快十倍以上)、稳定性、可靠性和低延时,实现包括3D通信、4K+超高清视频观看、在线AR/VR、云办公、云游戏等全新体验。随着国际通信标准化组织3GPP在去年12月份和今年6月份分别冻结非独立组网(NSA)和独立组网(SA)标准,5G产业化迎来全面冲刺。


中国手机厂商对5G领域的研发投入已有时日。


2016年,vivo在北京成立了5G研发中心,参与5G核心技术标准的研究。2017年,vivo已经成为了3GPP技术贡献最大的手机企业之一。2017年,vivo启动了5G天线和射频关键技术的预研。在5G手机产品化方面,vivo也与电信运营商以及芯片方案厂商合作,共同推进5G原型机、商用手机的研发进程。


OPPO从2015年开始对5G领域进行投入。今年5月,OPPO宣布成功实现了全球首个采用3D结构光技术的5G视频通话演示,并基于FPGA的原型验证平台成功演示了下行1.4Gbps和上行160Mbps的峰值传输速率,推动行业对全新5G应用和终端形态的探索。


小米在3GPP尚未开始讨论5G标准之时,就成立了预研团队,提前对5G标准展开了研究工作。小米参与了5G标准制定,小米作为召集人领导了一些技术课题的讨论,主导了部分技术方向的制定。小米还是业界仅有的几家具备5G仿真能力的终端公司之一,目前小米在5G新技术尤其是毫米波天线阵列的研发上具有领先优势。小米还在探索NB-IoT在智能家居场景下的应用。在国内市场,小米已和中国移动签署了5G相关备忘录。


按照工信部规划,预计我国2019年元旦前进行首批5G芯片的流片,并在春节前后完成;2019年上半年开展商用基站建设,下半年生产出首批5G手机。


如此看来,国内手机厂商的5G计划也和工信部规划、运营商测试的时间节点相吻合。除了上述厂商,华为也宣布将在2019年下半年发布首款支持5G网络频段的手机。


据市场调研公司Counterpoint Research此前发布的报告,5G智能手机将在2019年进入初步商业化阶段,经历初期缓慢增长之后可能于2021年呈爆发增长趋势,出货量也将突破1.1亿部。

号外|美国警方:随时传唤刘强东 未宣称其“无罪”

9月4日讯  京东集团(NASDAQ:JD)昨日对外发布声明,称在美国涉嫌性侵而遭到警方调查的董事长刘强东已经离开美国回到中国,开展正常工作。声明同时表示,刘强东“遭遇到了失实指控,经过当地警方调查,未发现有任何不当行为”。


对此,北京时间昨日晚间,网易号外再次致电美国明尼阿波利斯警察局发言人约翰·埃尔德(John Elder),他表示并不清楚刘强东回国一事,目前刘强东案仍在调查当中,刘强东尚未被指控任何罪名,因此是自由的,可以去任何地方。但在调查期间,如果有需要,刘强东将随时被传唤到案。


至于刘强东“经过当地警方调查,未发现有任何不当行为”一说,John Elder称警方从未对外发布过刘强东“无罪或没有不当行为”的声明。


关于刘强东已经回到中国正常工作的消息,John Elder表示,“他可以去任何他想去的地方,没有对他有限制。我不知道他是否回到了中国,他有权利回到中国。我们还在继续调查此案,但是目前没有发现需要传唤他的证据。”


“我们不知道刘是不是真的无罪,我们还在调查,这个调查没有截止日期。在调查期间,如果他想回到中国,他可以回去,如果需要的话我们会传唤他。”John Elder说,“目前为止他还没有被指证任何罪名,所以我们不可能限制他的人身自由。我们相信如果需要的话我们肯定能联系上他来协助这个调查。”


至于京东在声明中提到刘强东在美国“遭遇到了失实指控,经过当地警方调查,未发现有任何不当行为”,John Elder向网易号外证实,“目前为止警方没有对外发布任何声明,证明他无罪或没有不当行为”。

快播破产清算 深圳中院裁定即日生效

这一次快播要退出市场了。王欣出狱近7个月,无力挽救曾红极一时的快播。9月3日,新京报独角鲸科技获悉,快播科技将正式清算破产。


全国企业破产重整案件信息网披露,深圳金亚太科技有限公司对深圳市快播科技有限公司(以下简称快播公司)提出的破产清算申请,被广东省深圳市中级人民法院裁定即日起生效。


快播拖欠深圳金亚太科技逾1000万元


民事裁定书披露,2014年7月7日,深圳市南山区人民法院作出(2014)深南法民二初字第410号民事调解书,该调解书确认快播公司欠付申请人货款9737742.68元及逾期付款利息300000元。其后,深圳金亚太科技有限公司向深圳市南山区人民法院申请强制执行。


2014年10月8日,深圳市南山区人民法院作出(2014)深南法执字第2412号执行裁定,以快播公司名下所有的银行账户已被其他机关依法冻结,目前无可供执行的财产为由,裁定中止(2014)深南法执字第2412号案件的执行,但深圳金亚太科技有限公司主张的债权至今未得到清偿。


广东省深圳市中级人民法院认为,申请人对被申请人享有的债权已经生效法律文书确认,且已经过执行程序,仍无法清偿。被申请人快播公司不能清偿到期债务,且明显缺乏清偿能力,故申请人的申请符合法定条件。依照《中华人民共和国企业破产法》第二条、第七条第二款、第十条的规定,裁定受理申请人深圳金亚太科技有限公司对被申请人快播公司提出的破产清算申请自即日起生效。


资料显示,快播成立于2007年,巅峰时期曾拥有3亿用户,被誉为“宅男神器”。


2013年11月,当时数十家正版视频网站和版权方发起“中国网络视频反盗版联合行动”,对百度影音和快播盗版采取技术反制和法律诉讼。


2013年12月,国家版权局认定,百度和快播公司构成盗版事实,分别对二者处以25万元罚款,并责令其停止侵权行为。


2014年4月22日,据群众举报,快播涉嫌传播淫秽信息遭警方调查。2014年6月26日,深圳市市场监管局正式对快播公司送达《行政处罚决定书》。2014年8月8日,王欣在逃往境外110天后被抓捕归案,经国际司法合作渠道由相关国家移交中国警方。


2016年1月7日,北京市海淀区人民法院对快播涉黄案的庭审实行了网络直播,快播公司及王欣、吴铭、张克东、牛文举等出庭,被告单位深圳市快播科技有限公司犯传播淫秽物品牟利罪,判处罚金人民币一千万元;被告人王欣犯传播淫秽物品牟利罪,判处有期徒刑三年六个月,罚金人民币一百万元。


记者通过天眼查信息显示,快播公司法定代表人已经变更。2018年7月12日王欣退出。


快播破产清算 律师称公司债务依法消灭股东可东山再起


中国人民大学商法研究所所长刘俊海认为,快播科技的破产清算程序启动意味着该企业无法进入破产重整程序,不再“活着”,关门大吉。


刘俊海称,深圳金亚太科技申请对快播破产清算,债务人提出申请,法院进行裁定符合《企业破产法》规定,也就是债务人达到了资不抵债的程度,同时又丧失清偿债务能力,这两条都具备了:一方面企业负债,另一方面,进入法院判决之后转入强制执行程序,依然不能履行法院生效判决。所以,申请人请求法院裁定,企业进入破产清算程序合乎法律规定。


他认为,申请债务人企业破产,法院可以按照企业破产法规定的法定程序,启动债权人保护机制,委托指定管理人收回保全破产财产,然后由债权人打折受偿,不可能100%受尝偿,总比一分钱拿不到好。另一方,防止破产企业继续产生债务负担和风险外溢,这也是僵尸企业出清的有效措施。


按照《企业破产法》一百一十三条规定,破产财产在优先清偿破产费用和共益债务后,依照下列顺序清偿:


(一)破产人所欠职工的工资和医疗、伤残补助、抚恤费用,所欠的应当划入职工个人账户的基本养老保险、基本医疗保险费用,以及法律、行政法规规定应当支付给职工的补偿金;

(二)破产人欠缴的除前项规定以外的社会保险费用和破产人所欠税款;

(三)普通破产债权。破产财产不足以清偿同一顺序的清偿要求的,按照比例分配。破产企业的董事、监事和高级管理人员的工资按照该企业职工的平均工资计算。


“破产最重要的作用有两个,一个债权人公平获得打折清唱,另一个,债务人企业的债务依法消灭,不再依法赖债。股东将来可以东山再起,对于债务人和债权人都是好事”。刘俊海说。


2018年2月7日,快播CEO王欣刑满出狱,多次被爆或创业,比如区块链领域。

央财教授:赞成个税起征点动态调整 过两三年调一次


个税法第7次修订尘埃落定。此次修订包括:新的个税起征点提高到5000元,低档税率适用范围扩大,把教育、医疗、住房、养老等支出设为专项附加扣除。


5000元的个税起征点标准是否真正考虑了民意?专项扣除的实施难度有多大?围绕这些热点问题,记者对中央财经大学财政税务学院副教授张广通进行了专访。


60S要点速读:


1、五千元的个税起征点我赞成动态调整,建议人大授权国务院,过两三年调整一次。另外,调整主要参考哪几项指标也要对民众公示,即便具体数据没法公示,但是五千元的标准怎么测算的,考虑哪几个主要的因素这个总是可以公布的。


2、从减负角度来说,专项扣除与个税起征点上调至五千元的效果是一样,甚至真正落地了比五千元的效果更好。但是费用扣除的标准,里面有很多细节,闭着眼睛就能想出来这件事很难操作。


以下为采访精编(有删减):


问题一:个税法二审稿出台后,民众对5000元的个税起征点争议非常大,可是这次新个税法依然维持在5000元不变,这样的话,之前向社会公开征求意见是不是成了走过场?


张广通:个税起征点上调,受益的人群范围肯定是比较宽的。工资是大多数民众的稳定、持续的收入,也是人们最主要的生活来源,可计量、可查询,所以不管是富人还是穷人,大家都很关心个税起征点。


2011年,个税起征点由2000元调高到3500元,七年后,个税起征点上调到5000元。随着社会发展,人们的的收入水平不断提高,生活开支的范围、标准也会提高,过去一个月花一两千块钱就行了,现在一个月四五千块钱可能都没法维持正常的生活,所以大家普遍希望免征额的标准提得越高越好。


公众普遍建议,将个税起征点提高到八千、一万元,这表达了以工资为主要收入来源的人们,在收入增长的同时,生活负担越来越重,希望通过大幅度提高个税免征额标准缓解焦虑情绪的诉求,这是可以理解的。


但是为什么主张提高到五千、八千、一万、两万甚至五万元,没有理由依据,没有经过调查研究,也没有详细的科学测算,就是一种情绪化的表达,我觉得是不严谨的。


从立法角度来说,尤其涉及个税扣除的标准是多少,必须要有一个科学的测算,所以我并不完全赞成公众的情绪表达,但是个税起征点的制定也是有缺陷的——财政部、税务总局掌握纳税人的收入和纳税情况,出于各种原因无法向社会公开,这样的话,即便他们说进行了非常详细的调查、研究、模型、测算,大家也还是不太信任,因为我们也不是很清楚政府有关部门是怎么测算的。


中国的个税免税额标准不能无限度地上调,一味地顺着公众的愿望也是不合理的,立法机关应该在客观公正、综合考虑各方面的因素的基础上再决定,可能在现有情况下,提高到五千元是比较适度的。


这次个税法改革有一个亮点是增加了专项扣除,这个措施的范围挺大,涉及的人群也挺多的,到底那么操作还等待细则。这些因素考虑到一起,我们应该这样理解,个人所得税改革的主要目标就是,给收入比较低的广大城镇居民或者工薪阶层较大幅度的减负。


提高个税免征额的标准只是其中的一项,而且这个标准提高过多可能还产生相反的效果。个税起征点普遍提高之后,给穷人减税了,富人的边际税率大幅度下调,穷人也减税、富人也减税了,最后改革的结果贫富仍然两级分化,富人收益最大、穷人收益很小,人们可能感觉少交了两百块钱税很舒服,但是富人可能更高兴,因为一个月减了上千甚至上万块钱的税。


五千元的个税起征点不是吹牛吹出来的,他有一定的依据,但是五千元这个标准我赞成动态调整,建议人大授权国务院,过两三年调整一次。另外,调整主要参考哪几项指标也要对民众公示,即便具体数据没法公示,但是五千元的标准怎么测算的,考虑哪几个主要的因素这个总是可以公布的,这样就能让个税改革的难度、矛盾、意见尽量的缓和。


只能说,个税改革又前进了一大步,与2011年仅调整免征额、修改个别条款相比,有重大的突破。


问题二:您刚刚提到各种专项扣除,个税法草案二审时增加了赡养老人的费用扣除,有专家就指出这个制度的出发点是好的,但是可能比较难落地,有关部门会不会因为专项扣除涉及金额比较少、程序比较复杂,出现打包扣除或者干脆不扣的结果?


张广通:增加专项扣除是这次个税法改革的第二大亮点,但也是个难点。除了每人每月五千元的免征额之外,还体现个人家庭的特点,家庭成员有没有老人,有没有孩子上学,有没有住房贷款、租金支出等,涉及到养老、教育、房子等民生热点问题。


从减负角度来说,专项扣除与个税起征点上调至五千元的效果是一样,甚至真正落地了比五千元的效果更好,因为现在中国的房贷利息很高,贷款买房的人日子难过,年轻人、大学毕业生没钱买不起房子,需要租房等等。把专项抵扣纳进来以后,有利于个性化减轻负担。


专项抵扣是大家多年以来渴望的,也借鉴了国际上各种国家的经验,财政部、税务总局要去考虑我们应该怎么操作。但是费用扣除的标准,里面有很多细节,闭着眼睛就能想出来这件事很难操作,因为中国是一个人口大国,中国人普遍不是很富裕,中国的家庭情况也很复杂。


比如赡养老人的费用扣除,谁来确定每个家庭赡养老人的数量呢?


再比如子女教育支出,首先说义务教育,小学初中是义务教育,国家免了学费又免了书本费,自己就掏了个午餐费、买点学习用具,这部分的费用没法扣除,所以在我看来,义务教育根本就不属于扣除的范围。


如果你的孩子上课外培训班,国家也没有提倡你上,这部分的费用不可能扣,也没法扣。


再来看非义务教育,高中交学费和书本费,拿教育部门出具的学籍证明、缴费的收据等,可以考虑给你扣。


再来说大学教育,大学一年交5000多元的学费,按道理来说大学一年出5000元的学费根本就不够办学需要,国家实行的也是低学费制度,剩下不足的是靠教育经费,但是这个5000元可以考虑扣除,因为每个学校的收费标准是经过物价局、教育部审批的,有收费的文件,然后你交学费会有发票或收据,再加上录取通知书、学生证,有这几项证明就可以进行专项扣除,这都还是比较靠谱。


至于硕士博士,据我了解,现在是先交学费,如果你学习成绩优秀,学校再给你奖学金,这就相当于又返回来了,这部分费用怎么扣,就要考虑了。除此之外,还有博士后、职业教育、函授大学等等,这些情况都要做具体分析。


其实,专项扣除还连带着另外一个问题,那就是我国的个税申报模式是自然人申报,按照个人申报收入,在自然人申报之下又给你增加这么多的专项扣除,这个是矛盾的,西方国家有好多个税申报模式,比如自然人申报、家庭申报、夫妻联合申报、自由职业申报、单亲家庭申报等等,这也是这次改革不到位的地方。


个税改革,老百姓期望值很大,政府也很焦虑,但是个税就像一个鸡肋,弃之可惜,食之无味,为什么这么说呢?因为个税不是我国税制体系里面非常重要的税种,收入规模小,一年也收不了多少钱,占总税收的比例达不到7%,现在可能更低了,5%到6%。跟其他税法比较起来,个人所得税收入虽然年年增长很快,但是比例很小,可以说它的重要性没有我们想象的那么大,但是因为它涉及到的千家万户,大家很关注。


另外,如果把个人所得税免征额和专项扣除搞得过大,收税又少,纳税人又少,个人所得税调节的作用发挥不出来,这也不是政府所希望的。


金准人工智能分享在金融行业深度学习的技术应用

前言

金准人工智能专家主要从主流深度学习算法在金融量化领域的局限性、解决方案探索、树模型在可解释性探索上的贡献、敏感性分析在可解释性上的价值、基于深度学习的低频事件学习五个方面介绍,首先讲一下主流深度学习算法在金融领域的局限性,然后针对这些局限性所做的探索解决方案,以及在探索过程中主要围绕可解释性和低频学习这两点的展开讲解。

一、主流深度学习算法在金融量化领域的局限性

金融领域面临的问题可能和传统互联网公司面临的问题可能不一样,比如深度学习可以大致分为三块:卷积神经网络、递归神经网络、深度神经网络。其优缺点都应该很明显,简单讲卷积神经网络对空间结构相关性的探索比较强,递归神经网络对时间相关性探索(时间序列)较强,深度神经网络在全局相关性探索较强。它们的主流应用都集中在计算机视觉、自然语言处理等方向,特点是先验知识很鲜明。要识别猫或狗,其特征很明显,可以构建这样的数据集,在自然语言方面,词汇是有限的,文章也是可以无限挖掘。但是在金融领域,绝大部分没有先验知识的,不知道样本的特征区分好不好,有时通过长期的积累可能会知道知识比较明显。比如信用方面,一个人总是不还款就有问题,这可能是一个比较好的先验知识,但是这样的知识非常少,无法发掘。同样的我们无法造数据,如果要对宏观经济走势的预测或股指感兴趣,但是我们无法把股指造出来,不知道成交量与股指的点数到底有何关系。除了可解释性不强外还有对专业知识的匮乏,因此在深度学习做决定时一定要知道为什么,更愿意知道模型如何做决定。

 

二、解决方案探索

那么围绕这些难点如何解决这些问题呢,首先介绍下我们的难点问题。可解释性问题、低频时间、稀疏性、特征的时变性和数据的有效性,以及数据的不可扩展性,今天主要围绕这两个点,其他四个点也是很重要的。在可解释性方面的探索分为两个方面:局部特征探索和敏感性分析,这两者是相辅相成的,局部探索其实是对可解释性做了不可磨灭的贡献,今天金准人工智能专家主要介绍一些树类的贡献。敏感性分析主要在方差分析算法上面,低频学习有很多类别可以做,今天主要是围绕助力机制,主要介绍一些最新的研究情况。

 

三、树模型在可解释性探索上的贡献


首先,树模型为什么在可解释性方面做了很多贡献?之所以不说作用因为它不是直接在这个体系起到可解释性的作用,但是它可以做一些解释。目前算法主要分为深度学习和非深度学习,主要围绕决策树。深度学习拟合能力非常强,但是解释能力较差;决策树可解释、训练快,但是拟合能力受限。之前两个流派很对立,后来两者去相互学习,利用各自的优点。如在解释方面Jefreeheten提出asab Tree算法,大致学习深度学习在图像学习如何做预测和分析,做树模型也在拟合能力方面做出相应的探索。还有阿里巴巴、以及其旗下的卖金服在树模型探索和与Deep learning结合方面也做了很多工作。结合我们自身,金准人工智能专家的解决思路是利用树模型很好地可解释性对局部的探索能力去挖掘特征,将价值发挥到最大,深度学习去探索局部特征还是有一些问题,主要是低频特征影响。利用混合架构wide&deep或者其他对稀疏化或者稠密的数据进行学习,最后利用敏感性分析对其进行解释,对预测值归类的依据是什么。为什么不直接利用深度学习对其敏感性进行分析呢,敏感性分析有一个问题就是重要性差异不大,敏感性不强。而且在金融领域有个特点就是没有先验特征,很难有明显特征区分类别,这也是树模型所起的作用。

 

那么,如何将树模型利用到极致?Wide&Deep模型是16年提出的,将稀疏数据和稠密数据联合训练,找到低频特征,我们就是基于这个思想实现相关算法和模型。不同的树模型有不同的特点,但是很多算法都是基于GBDT算法,以chartputs为例,涉及不同的subsimpling和subcorling局部特征采取和垂直种子选取,最后结果是完全不一样,因为会从很多角度去挖掘不同数据组合信息。那能不能将所有算法都拿来使用呢,如同周志华教授提出在gcForest中不外乎两条树是完全随机的,可以有更大的探索空间。我们也是尽量用所有不同的模型,将相似的节点合并构成一个知识库,这个知识库有很多无向边将之间的特征关系连接,与节点配合形成一个大的体系。这样做的一个好处就是可以忽略算法、数据,而在知识库中绝大部分的特征是无用的,会有很多干扰。

 

我们的业务范围大都几种在金融领域,金融领域有个特点就是数据有时变性,几乎没有一个特征是稳定的。因此我们可能会做一个简单的筛选,一般用规则法和评分法将明显无效特征做一个筛选。其核心就是分布的稳定性以及重要性的稳定性和良好的趋势性,评分法能够更加量化,有些时候很难衡量分布稳定和重要性稳定该取什么样的比值,最后直接用评分法打分。有时训练一个模型会引入上百个树模型,支点会有很多,叶子节点有时会有几十万个,就算通过筛选也会有几万个特征,如果进入深度学习会崩溃。因此还要进行进一步的筛选,借助的是Auto-Encoder编码器压缩,目的是去掉比较相似的特征。虽然很多算法不同,但是其分裂方式是很相似的,会找到很多相似的叶子节点,引入的模型越多,产生的相似节点就越大。以两个相同的GBDT模型引入差异参数最后会产生1-2%的相似叶子节点,重要的叶子节点重复会严重影响模型精度,权重估计也会出现很大的偏差。就会出现你认为这两个东西很重要,但是这两个特征确实相似的。在金融领域描述一个问题,感觉是从不同基础数据衍生出来,但是其逻辑可能会是一样的。

基于上面这个问题,金准人工智能专家基于Wide&Deep架构依据自己业务需求构建了一些模型架构Conditional Multi-Fields Deep Neural Network。将稀疏化的数据做一个压缩,取得Auto-Encoder编码器压缩的中间隐藏层作为输入,正常稠密格式就用正常格式,如果有时间连续的特征会有skm做一个embedding,然后利用DNN进行训练。虽然架构有很多模型,但是并不需要使用所有模型,有时只用左边的模型就能满足需求。如果直接利用Google的原始架构Wide&Deep算法,不同的模块运用不同的优化算法,如果权重更新调整不好,整个训练过程会出现很大的扰动,会出现距离的波动,很难出现稳定状态。这样出现的原因是在联合训练时梯度更新不一致,会出现左边调整好出现一个扰动就会破坏左边的稳定,最后通过coding later去限制优化的比例,使更新的比例尽量一致。

四、敏感性分析在可解释性上的价值

敏感性分析偏统计方面,在工业领域用的比较多,在纯计算机领域用的比较少。一个输入性的变动扰动,输出是怎么样变动、以及变动的程度是怎么样的,这种情况敏感性分析用的比较多。敏感性分析用的不多但是并不陌生,如线性回归,在信用卡评分模型中,对特征做WE分箱,会用线性回归,会看权重判断输入对输出的影响程度是多少,这也是敏感性分析的一部分。再者再深度学习,对抗样本在图像识别的干扰作用,背后也是利用的敏感性问题,再深度学习领域会将局部权重无限放大,会出现显著特征,如果攻击点正好对应显著特征,结果会出现很大的偏差。

Worst case analysis、可靠性分析这两个分析更偏工业性些,在金融领域比较罕见。敏感性分析在工业领域尤其是量化领域应用较多,引入敏感性分析目的就是解释黑箱的DN。DNN也是一个黑箱问题,知道大概机理,但内部如何运作原理不清楚。其实在这块早就有研究,真正火起来是在15年,《Sensitivity Analysis for Nerual Network》的作者在10年就提出来,讲述了如何利用敏感性分析去阐释神经网络。敏感性分析目的是将变量的敏感度量化起来,规划为线性回归的模式,提供重要性指标,利用线性加权。常用的方法有偏微分、回归模型、One-At-A-Time、方差分析、散点图、Meta-model,前面三个为一阶分析,变量对其自身变化敏感性分析,这样应用的假设是变量之间基本没关系。在金融领域变量间基本都有关系,会用到方差分析和Meta-model,散点图是为了直观分析。这是为了适应应用场景非线性、局部相关性(局部高阶)、高纬度、可量化、模型复杂、难解释,今天主要是将Analysis of Variance和Gaussian Process,这两块可以独立模块,后续会将其联合讲解。

 

方差分析理论基础是任何一个模型都由一些常量关系加一些单变量输出以及变量两两输出等,比如输入一个X,输出一个Y,fn是差值,如果扰动xi, fi是如何变化的。如果把所有的方差放在一起,改变一些参数,输出扰动变化程度是多少,这就是方差分析的工作。方差分析由于输入的参数不同,最后会有很大差异,因此利用Sobol Index技术将其归一化,就是用求出的方差与自身方差做比值。方差分析的优点:适用于复杂非线性模型,敏感度可以被量化,取值范围通常在[0-1],可以细化到对某个参数/变量取值区间敏感性进行度量,能衡量依赖关系;缺点是:需要足够多的数据才能保证计算精度,随着维度增加,需要的数据也指数级增长,对重要性不够强的变量/参数区分能力较弱。

 

针对方差分析的缺点如何解决呢,尝试用一个模型去描述模型的分布情况,用一个模型去监测变化的状态,利用一个模型学习模型进行替代。这样的模型有很多,我们选择是Gaussian Process,它输出的是你输入一个变量所产生的期望的均值以及方差,这也是敏感性分析所需要的信息。不用朴素贝叶斯或者其他原因是我们的对象是复杂的非线性模型,朴素贝叶斯拟合能力有限,Gaussian Process需要设置很多的操作树和function,这些function是为了拟合变量的均值和不同情况出现的方差,能够很好地拟合现实中的分布。其原理是基于朴素贝叶斯,将变量进行了更复杂的空间映射,找出后验的权重分布,用Inference 去估算由输入/参数改变带来的输出在分布上的改变,其具体原理和思路可以参考论文《Probabilistic Sensitivity analysis of system availability using Gaussian Process》。敏感性分析核心就是输入的变化对输出有怎样的改变,可以用很多方法得出近似的重要性。深度学习如果从机理上证明是很困难的,大都是在选取适合自己业务情况下用不同的方法去阐释。

 

五、基于深度学的低频事件学习

低频事件在金融领域太过常见,在做量化股指期,需要对拐点期进行预测判断,拐点出现的次数非常少,特征也很模糊。在反洗钱领域,拐点出现也很稀少,但是有些特征会很明显,如果直接拿模型去学习是无法得到结果的。我们之前一直尝试用attention做低频事件学习,但是有一个难点低频事件很难出现,而且很多是基于先验知识,在金融领域先验知识又很少。近期由谷歌研究员提出的《Attention is all you need》与 Deep Mind 团队的研究成果《Relational recurrent netrual network》将Attention机制对特征记忆的延续性做更好的探索。这两篇文章主要解释的是时序相关,但是我们领域不需要关注时序相关,只对某一些我总分错有很重要的数据样本感兴趣。为了提高对低频事件的学习能力,我们基于上述研究成果设了一套的适合自己的算法,目的为了将容易被分错的重要的小数据样本中的显著特征进行学习,并将学到的特征进行保留与传承。我们将该算法称为《Low Frequent Events Detection with attention mechanism》。Scaled Dot-Product Attention很早就开始用了,就是给你一个请求,对应会有一些key,观察每一个query对key的响应程度是多少,将这种影响随value传递下去,最后改变value实际输出值。Mult-Head Attention是多个组合,做了一些线性变化,目的使特征更加丰富。

 

在《Relational recurrent netrual network》中利用了memory core机制,给一个以前对数据特征分布情况,给一个当前输入情况,两个一起考虑学习。这种如何和我们低频事件学习相结合呢,attention机制是对query形成一个key矩阵,然后计算权重归一化处理去影响输出值。我们的模型是对一个输入,经过MLP最后输出结果,加入attention机制后,在MLP模块会做一个二分类,将中间的embedding提出来进入discriminator,机制类似于gate网络。利用其它特征去判别那些分对了哪些没分对,就可以知道你对那些样本敏感那些不敏感,通过设置阈值,将分错的特征放到memory core中学习进行修正。找到那些分错的独有的但又有共性的特征来纠正,对output进行纠正,这就是模型的整个思路。MLP是中间隐藏层出现的embedding,利用discriminator进行分类,从空间改变样本分布情况。

 

在整个优化过程中分为三块,一个是正常MLP优化过程,discriminator优化过程,以及MC优化过程。分为三个损失函数,第一个实际真是情况,第二个是分没分对的情况,经过mc优化后拟合的真是情况。模型训练需要注意的事项有:(1)由于第二个损失函数需要依赖于模型的预测结果。因此模型的训练过程由3个独立的模块异步训练。(2)由于各个模块的目的不一样,因此所用到的优化算法和优化策略所有不同。(3) 选择合适阈值t对模型训练很重要(推荐t>0.8)。(4) 选择适当数量的Query和keys。(5)MC模块仅会使用满足判别器要求的样本。(6) 各个模块训练开始时间不同:当MLP训练模块趋于稳定时,激活discriminator的训练;当discriminator训练趋于稳定时,激活MC模块评估的方法主要有:Discriminator的评估除了看损失值以外,还需要监控Accuracy的变化。损失函数(1)与损失函数(2)之差可用于评估MC模块的作用。

 

 

下面介绍一个案例,寿险内部某推荐任务,2分类目标(0或1),样本总量170W,目标样本39W,不算很低频。算法架构:主框架基于Conditional Multi-Fields DNN, 稠密数据部分使用了:(1)DNN(2)Attention Mechanism 训练细节:在引入Attention机制后,在MLP模型训练到1000步后,激活了判别器(Discriminator),并对判别器进行了预热训练。在判别器Loss稳定后,激活MC模块并进行预测训练。随后模型每轮进行异步更新。基本很平稳没啥区别,但是单看accuracy慢慢增长说明模型取得一定效果,但是没有证明要达到多少才能证明有效果,目前定义要高于本身MLP准确效果。同时difference改变越来越大就说明memory模块起作用。

 

模型结果(1)由于数据样本的标签并非1:1关系,基于数据的基准准确率为77.06%;(2)利用DNN处理稠密数据时,模型整体准确率为82.35%(得分前23%的预测样本为正样本)。但是不是按0.5,需要根据样本实际情况定义阈值;(3)其中正样本的预测准确的样本约为24W,准确率约61.53%;负样本预测准确率为88.54%;(4)判别器能够准确区分91.04%的样本被判断对错的情况。换句话说,在被错误归类的样本中,有8.96%的样本在当前低维映射空间下与被归类正确的样本极其相似;(5)从结果(2)和(4)的结论中可以得出,有机会被MC纠正的样本量的上限为8.69%;(6)经过最终统计,有6.97万的样本通过MC得到的纠正。占总样本的4.1%。其中正样本占2.1万。得到纠正的正样本占总正样本的5.38%。

 

总结

最后总结一下算法局限性:低频事件的挖掘一定需要和实际情况结合起来,不是所有的场景都适合使用此类算法。归纳起来,需要满足以下情况时,才可以考虑使用该算法。①低频事件需要有一定的数量(饱和度不能过低)且存在共性;②低频事件的特征不能与高频事件的特征过度相似;③主模块(MLP)的准确率不能过低;④判别器(Discriminator)的分类效果需要保持一定的精度,至少应该稍大于模型整体的预测准确率。

金准人工智能专家认为算法也有很多优势, 与单一的attention结构相比,有以下优势。① 采用判别器,将样本进行区分,主要针对被错误归类的样本。而非直接使用Attention模块。②MC模块仅对小量且重要的样本进行学习,而非整个数据集,降低了学习难度,提高了学习的效率。③异步训练使得训练更加稳定,针对不同的网络结构、数据结构与功能采用不同的优化策略。④记忆模块将对整个低频数据集的特征进行学习,并将学习到的信息有效的传递下去,从而更有效的对数据特征特点做出区分,增强泛化性。

 

57岁李开复论AI:做个更深刻的人,随便的你会被AI取代

李开复举例称,不是说AI会全面打败所有的记者、作家、艺术家,而是说大部分阅读和购买的人,没有很深的造诣分辨98分跟76分的差别,因而每个人都要让自己做一个更深刻的人,无论是记者、诗人还是画家,如果随便写一写,肯定会被AI取代。

少年听雨歌楼上,红烛昏罗帐;壮年听雨客舟中,江阔云低、断雁叫西风;而今听雨僧庐下,鬓已星星也。”南宋词人蒋捷不同时期听雨,听出了不同况味;今年57岁的创新工场董事长兼CEO李开复今日(9月2日)也表达了他在不同年龄阶段对AI的差异化心得体会。


在昨日的新书发布会上,李开复表示,他不再认为AI取代大脑就是一切,也不再认为拼命工作就是一切。但他并未放弃价值实现,他说:“每个人都要让自己做一个更深刻的人,无论是记者、诗人还是画家,如果随便写一写,肯定会被AI取代。”


说AI估值:目前处于调整期


在新书《AI·未来》中,李开复提到,中国人工智能技术快速发展,成为全球人工智能领域的重要拼图之一。过去三年,中国各地掀起一波人工智能热潮,从科技界、商界、各级政府机关开始,一直延伸到各行各业,甚至中小学和幼儿园的小朋友都在学习人工智能知识。


值得注意的是,与此同时,关于AI是否存在估值过高的疑问也随之而来。“有关AI泡沫,其实不是真的泡沫。”在李开复看来,目前AI处于估值调整期,当任何一个概念特别火后,很快就会被玩坏。因而很多创业者都要包装AI,每个投资人都要布局AI项目。


在这样的背景下,李开复称,AI公司越来越会讲故事,VC也开始抢占AI赛道,但存在“不知道怎么投,很多人争相入局一个好公司”的情况,因而就出现了AI融资新模式——某一个好的AI项目,可能会有10个VC来投资,每个投资机构的投资额为1000万元~2000万元左右,项目缺少领投方的这种模式,存在不可持续性。


“去年著书的时候,我说AI的泡沫可能也不会太远,这意味着太多人用AI来包装,造成估值过高情况,这也将会得到调整。”李开复说,而在眼下,当时的预言也是比较准确的,现在正进入年底,AI也将步入估值合理化阶段。


“AI在发展的过程中是出现过泡沫,但AI就跟互联网一样,还有很远的路要走,只是在走的过程中,每一波小浪潮可能会有一些波动,但长期十分乐观。”此外,李开复提到,过去三四个月AI企业整体估值下降约20%~30%左右,未来再下降20%-30%,就意味着AI即将进入估值合理化时期,也将有更多的机会投更多公司。


谈AI作用:也可能带来巨大破坏


毋庸置疑,经历了逾半个世纪发展历程的人工智能,已经从发明阶段步入商业落地阶段,并迎来“深度学习”这项重大技术突破,使其可以在真实世界里解决过去人们遇到的棘手问题。


回顾人工智能发展的历程,李开复提到,“我非常相信乔布斯说的‘很多点能串成一根线’的演讲,他的意思是,你很难在年轻的时候策划你未来的每一个点,把未来都设计好,但当你年纪大的时候,回去看你做的每一件事情,这个点确实可能可以串起来”。


因而,李开复在不同阶段,对于AI产生了不同的理解。“我20多岁的看法可能是AI就是来取代大脑,懂了AI,我们就是世界最有价值的科研;我30多岁看待AI,可能觉得这个技术论文很好写,但做出产品好像怎么做都有各种问题;到了40多岁的时候,可能看到的是这个AI其实在有一些数据领域,比如搜索还是可以产生相当大的价值;然后到了50出头的时候,可能看到的就是生了一次病,对整个人生有了不同的看法,也对过去取代人大脑就是一切、拼命工作就是一切也有了不同的认知”。


对于刚刚过去的三年,李开复认为,短期来说,AI带来巨大的财富,但会取代大量的工作,这需要得到人类足够的认知;长期来看,AI如果能够真的把重复性工作取代了,那么人类的时间可以更好地花在有兴趣的事情上。


此外,李开复提醒,自从深度学习发明以来,越来越多的人工智能算法和设想进入到生活中,大幅提升了工作与生活的效率。但人工智能带来的并不仅仅是巨大的财富和高效的生产力,同时还可能带来巨大的破坏,甚至可能导致严重的社会撕裂:人工智能的四波浪潮已经改变了世界,即将对全球经济展开前所未有的冲击。而最可能发生的人工智能对社会的大冲击,是人工智能带来的大规模失业。


讲AI创造:需要高门槛


在大数据和互联网+时代,即便不存在AI元素,很多企业也处于争相追赶的过程中,在这样的背景下,传统行业如何建立技术壁垒,更好跟上AI时代是不得不思考的问题。


“很多行业都会被AI所改变,它不见得是一个AI的技术改变一个人,而可能是用整个AI的技术颠覆了整个行业或产业。”对于这一点,李开复以出版业为例称,整个阅读人群的阅读习惯过去这两、三年改变得非常快,眼下今日头条的估值已经大于所有媒体估值,一些读书大号的估值可能也大于一些出版社估值。而这些事情都要促使出版社反思,重新思考怎样成为颠覆浪潮的一部分,而不是思考怎么做微调,微调已经不能成就没落的传统行业。


“你要把门槛降低,AI也可以创造,你继续降低,3岁的孩子也可以创造。”谈及AI创造,李开复不断强调,AI创造需要高门槛,AI会做重复性的工作是比较低门槛的创造,但真正渗透情感和思想的创造非常不易。真的有创意的东西肯定是艺术家的作品,比如毕加索打造新派系,优秀作家写了专栏评论,科学家发明解决某种癌症的药物,这些是否能被AI创造,显然面临较高的门槛。


此外,李开复举例称,不是说AI会全面打败所有的记者、作家、艺术家,而是说大部分阅读和购买的人,没有很深的造诣分辨98分跟76分的差别,因而每个人都要让自己做一个更深刻的人,无论是记者、诗人还是画家,如果随便写一写,肯定会被AI取代。


李开复总结称,人工智能像一把利刃,将时代划分为泾渭分明的两个板块:人工智能到来之前,世界上的一切循规蹈矩,有序进行;人工智能到来之后,未来势必是一个大变革的时代,所有的秩序和契约都将被重新改写。

内忧外患!Facebook出现高管离职潮

曾经自诩“亲如一家人”的Facebook高管层,如今越来越多人选择“离家出走”。今年至今,Facebook至少有七位高管宣布离职。


CNBC报道称,尽管Facebook发言人表示,这些高层的出走,都在计划当中,公司也将此视为增加领导层多样性的机会,部分出走的高管还将出任顾问的角色。


但是,对于深陷泄露用户隐私丑闻、用户增长乏力的Facebook来说,高管频繁出走,对于这家以高管层稳定著称的公司而言,无疑是重大的“地震”。


Facebook高层出走,开始于泄露用户隐私丑闻爆发后,在7月Facebook发布的财报显示用户增长几乎陷入停滞后,高管出走速度加快。


4月 Facebook董事会成员、WhatsApp联合创始人 Jan Koum

今年4月,Jan Koum宣布将从Facebook离职的消息。《华盛顿邮报》称,Jan Koum 离职原因,可能是在数据隐私政策上与Facebook有分歧。


2014年,Facebook以190亿美元收购了WhatsApp,领导WhatsApp近十年的Jan Koum加入Facebook管理层,并成为唯一一个被Facebook收购的公司加入董事会的创始人,是当时Facebook的三名董事之一。


董事会另外两人是Mark Zuckerberg和首席运营官 Sheryl Sandberg,WhatsApp在Facebook内部受重视可见一斑。


6月 Facebook负责沟通和公共政策的副总裁 Elliot Schrage

6月15日,Elliot Schrage宣布辞职。当时,Elliot Schrage在他的Facebook主页上表示,选出继任者后,他将继续担任管理团队的“顾问”。


Elliot Schrage现年57岁,曾在Facebook工作10多年。此前,Elliot Schrag还曾在谷歌工作了8年,2000年至2008年担任谷歌负责全球沟通和公共事务的副总裁。


7月 Facebook首席法务官 Colin Stretch

7月26日,在加入Facebook八年多后,Colin Stretch宣布将在今年年底离职。


去年,Colin Stretch也曾作为Facebook代表,出席国会听证会,接受有关俄罗斯干预美国2016年总统大选的质询。


8月 Facebook 资深首席安全官 Alex Stamos

8月初,自2015年开始担任Facebook公司的资深首席安全官Alex Stamos宣布将离职。


有关Stamos离职的消息,最早在今年三月就传开了。据说,在俄罗斯干扰美国2016年总统选举这一事件的调查和披露过程中,他与公司其他高管产生了不小的分歧。


具体说来,他更倾向于公司对外提供质量和透明度更高的披露消息,因而反对公司在过去一年中所采取的效率较低的半道歉应对态度。


8月  Facebook元老、商务高管 Dan Rose

8月23日,入职Facebook最早的高管之一、同时也是Facebook重量级人物的商务高管Dan Rose宣布即将离职。


Dan Rose于2006年加入Facebook,一直负责Facebook与媒体公司,以及与合作伙伴苹果和谷歌等分销商的合作业务。


此外,他还负责Facebook的并购集团,主导了2012年Instagram并购等交易,直接向Facebook首席运营官Sheryl Sandberg汇报工作。


8月 Facebook企业通讯主管 Rachel Whetstone

8月28日,Facebook企业通讯主管Rachel Whetstone宣布将离职,去Netflix担任公关负责人。


Rachel Whetstone大约在1年前加入Facebook,之前她在Uber最困难时期担任过类似的职务。在加入Uber之前,Rachel Whetstone还在谷歌担任过通讯及公共政策资深副总裁。


8月 Facebook新闻产品主管 Alex Hardiman

8月30日,Facebook新闻产品主管 Alex Hardiman 跳槽《大西洋》(The Atlantic)杂志,担任首席商务和产品官,将负责产品、观众体验和消费者收入。


Alex Hardiman 在Facebook担任新闻产品主管期间,负责与出版商一起开发新闻产品,以及阻止假新闻在Facebook平台上泛滥。