• 项目
首页>>文章列表 >>金融科技
文章列表

监测报告创业公司激流勇进,遇上Azure被秒成渣?

此次监测报告由T客汇和云鸽企业头条监测中心联合发布。本周我们继续推出云计算市场监测情况分析,时间段从2017年5月10日至2017年5月16日。



从百度整体搜索指数来看,占据第一阵营的百度云、阿里云、网易云和腾讯云排名未见改变。

相比之下,第二和第三梯队的厂商搜索指数排名一直在起伏跌宕中渡过,如微软Azure云在上周还处于落后状态,5月11日有了大幅上升。

该期间,微软推出了全新AzureIOTEdge云服务,可将人工智能和高级分析功能提供给支持该服务的设备。在市场方面,微软官方宣称未来12个月要将云计算在中国内规模翻番一倍,现已推出60余项云服务,拥有8万家企业用户。在营收方面,预计商业云业务营收将在上半年达到148亿美元,较上一财年的95亿美元增长约55%,而这项业务中就包括Azure,虽然微软并未单独将其营收进行公开,但研究机构关于Azure增速不断加快的消息,使外界将其视为未来有望与AWS单挑的对象。

相比同一时代入场的创业公司则在市场体量上的差距正一步步拉开。2017年年初,青云公布实现年度盈利,并积极准备IPO。UCloud则一步步迎着风口开始收割,2017年3月获得9.6亿元融资,资本的注入无疑给UCloud自身增添了强大动力。不过,这也向外界预示着:云服务供应商之间的厮杀开始于互联网巨头,但结束并不止于他们,创新公司也进入到了寸土必争的阶段。

从微信搜索指数上看,榜上有名的数十家云供应商排名变化幅度更为明显。

5月12日,华为云搜索指数陡然上升。5月15日,阿里云搜索指数也实现了一个大跃进。

从这两家公司本周的动作可以看到,5月13日

伴随马来西亚数字经济发展局、杭州市政府和阿里巴巴三方合作的签署,eWTP全球两大“数字中枢”——马来西亚数字自由贸易区和杭州跨境电子综合试验区正式开启互联互通。

而自从华为云正式宣布进入公有云市场,其市场品牌宣传动作就一直停不下来。其先后在大连、青岛建立华为云服务创新中心,5月12日华为云又在甘肃庆阳建立云计算大数据中心。

此外,从一周时间波动上可以看出,普遍云供应商在非工作日百度和微信搜索指数均有大幅下滑,而第一梯队的云供应商则基本不受节假日影响,侧面体现出品牌对用户市场的影响力巨大。

中国最具核心竞争力的行业龙头公司

1.$贵州茅台(SH600519)$     国酒第一品牌,无人能敌。


2.$伊利股份(SH600887)$     乳业国内第一品牌。


3.恒瑞医药 (SH600276)   国内化学药品综合竞争力第一品牌。


4.海天味业 (SH603288)  调味料行业市场占有率绝对第一品牌。


5.中国平安 (SH601318)  保险综合竞争力最佳品牌。


6.工商银行(SH601398)   中国规模最大行业第一银行品牌。


7.长江电力 (SH600900)  中国电力行业最佳第一品牌。


8.万科A      (SZ000002)  中国最佳地产开发商。


9.上汽集团  (SH600104) 中国汽车行业综合实力排名第一品牌。


10.格力电器(SZ000651) 中国空调行业第一品牌。


11.美的集团(SZ000333) 中国家电行业综合竞争力排名第一品牌。


12.福耀玻璃 (SH600660)全球汽车玻璃行业第一品牌。


13.中国国航  (SH601111) 中国航空业市场占有率第一品牌。


14.上海机场 (SH600009) 中国进出航班数最多的机场。


15.上港集团  (SH600018) 中国最优质最繁忙的港口。


16.云南白药  (SZ000538) 国药第一民族品牌。


17.片仔癀    (SH600436)  中药国粹第一品牌。


18.国泰君安   (SH601211)    券商综合实力排名第一(个人意见)。


19.海螺水泥  (SH600585) 建材市场份额最大第一品牌。


20.中国石化    (SH600028)    中国石化行业绝对第一品牌。


21.中国石油   (SH601857)  中国石油能源综合服务第一品牌。


22.山东黄金   (SH600547)    中国黄金冶炼及综合能力第一品牌。


23.海康威视   (SZ002415)  安防国内综合实力第一品牌。


24.汇川技术 (SZ300124)  智能装备国内行业综合实力第一品牌。


25.鱼跃医疗  (SZ002223) 国产医疗器械行业第一。


26.万达电影  (SZ002739) 国内院线综合实力第一品牌。


27.烟台万华  (SZ600309) 中国聚氨酯材料行业第一品牌。


27.安信信托    (SH600816) 国内信托行业实力第一品牌。


28.中国人寿  (SH601628)中国寿险第一品牌。


29.双汇发展    (SZ000895)   国内肉制品行业第一品牌。


30.中兴通讯  (SZ000063)我国通讯设备行业绝对第一品牌。



ICLR-17 最佳论文详解:理解深度学习要重新思考泛化

「干货」ICLR-17 最佳论文详解:理解深度学习要重新思考泛化


“泛化好的神经网络和泛化不好的神经网络有什么区别?对这一问题做出满意的回答,不仅有助于更好地理解神经网络,还可能带来更正确(principled)可靠的模型架构设计。”

作者说“泛化好”的意思,就是简单指“是什么原因导致在训练数据上表现很好的网络,在(没有接触过的)测试数据上表现也很好?”(与迁移学习不同,迁移学习做的是将一个训练好的网络用于另外一个相关但不同的问题)。

花点时间想一下,这个问题基本可以归结为:“为什么神经网络效果这么好?”至于泛化,一个是只记住部分训练数据而后将其重复出来,一个则是真正对可以用来进行预测的数据集产生一些有意义的发现(intuition),这两者的区别就是泛化。

所以,要是我们对“为什么神经网络表现(泛化)这么好?”给出的回答是:“我们真的不知道!”——事情就有些尴尬了。

不可思议的随机标签案例

故事从一个熟悉的地方开始——CIFAR 10(含有 5 万幅训练图像,分为 10 个类,1 万幅验证图像)和 ILSVRC(ImageNet)2012(1,281,167 训练数据,5 万幅验证图像,1000 个类别)数据集和 Inception 网络架构的变体。

使用训练数据训练网络,然后在“训练数据集”上错误为 0,这没什么好奇怪的。这充分说明了过拟合——记住训练样本,而不是学习对特征进行真正的预测。我们可以使用正则化技术应对过拟合,设计出泛化性能更好的网络。这个话题我们稍后再说。

仍然使用相同的训练数据,但这次将标签打乱(使标签和图像中的内容不再具有真正的对应关系)。使用这些标签随机的数据训练网络,会得到什么?训练错误还是 0!

“在这种情况下,实例和分类标签之间不再有任何关系。因此,学习是不可能发生的。直觉告诉我们,这种不可能会在训练过程中很清楚地表现出来,比如训练不收敛,或者收敛速度大幅减慢。让我们感到意外的是,有多个标准架构的训练过程的好些属性,在很大程度上都没有受这种标签转换的影响。”

正如作者所言,“深度神经网络很容易拟合随机标签”。从第一个实验中可以看出以下 3 个关键点:

  1. 神经网络的有效容量足以记住整个数据集;

  2. 对标签随机的数据进行优化很容易。事实上,与标签正确的训练过程相比,随机标签的训练时间也只增加一个小的常数因子;

  3. 将标签打乱仅仅是做了一个数据转换,其他所有关于学习问题的属性都没有改变。

不过,如果你把使用随机标签训练的网络在测试数据集上跑一遍,结果当然不会好,因为网络实际上并没有从数据集中学到什么。用专业一点的话说,就是网络的泛化误差很高。

综上可得:

“……通过将标签随机化,我们可以强制模型不受改变、保持同样大小、超参数或优化器的情况下,大幅提升网络的泛化误差。我们在 CIFAR 10 和 ImageNet 分类基准上训练了好几种不同标准架构,证实了这一点。”

换句话说:模型本身、模型大小、超参数和优化器都不能解释当前最好的神经网络的泛化性能。因为在其他条件都不变的情况下,唯独泛化误差产生大幅变动,只能得出这一个答案。

更加不可思议的随机图像案例

不仅仅打乱标签,把图像本身也打乱,会发生什么呢?或者,干脆用随机噪声代替真实图像??

论文给出的图中,将这一实验标记为“高斯”实验,因为作者为每幅图像生成随机像素的方法,是使用了匹配原始图像数据集均值和方差的高斯分布。

结果,网络的训练错误依然为 0,而且所用的时间还比随机标签更少!对此,一种假说是,随机标签图像都属于一个类别,但由于交换了标签,不得不作为不同类别的图像数据进行学习,而随机像素图像彼此之间更分散。

作者团队做了多次实验,将一系列不同程度和类型的随机性加入数据集:

  • 真实标签(原始数据集,没做修改)

  • 部分损坏的标签(将其中一部分标签打乱了)

  • 随机标签(把所有标签都打乱)

  • shuffle 像素(选择一个像素排列,然后将其统一[uniformly]用于所有图像)

  • 随机像素(对每幅图像单独做一个不同的随机排列)

  • 高斯方法(如上文所述,给每幅图像增加随机生成的像素)

「干货」ICLR-17 最佳论文详解:理解深度学习要重新思考泛化

一路下来,网络仍然能够完美地拟合训练数据。

“此外,我们进一步改变了随机性的数量,在无噪声和完全噪声的情况下平滑地插入数据集。这样一来,标签还是保有某种程度的信号,从而会造成一系列间接的学习问题。随着噪声水平的提高,我们观察到泛化误差呈现出稳定的恶化。这表明神经网络能够理解数据中的剩余信号,同时用暴力计算适应噪声部分。”

对我而言,最后一句话是关键。我们在设计模型架构的过程中,某些决定显然会影响模型的泛化能力。当数据中没有其他真实信号时,世界上泛化性能最好的网络也不得不退回去诉诸于记忆。

所以,也许我们需要一种方法,将数据集真正的泛化潜力梳理清楚,同时弄明白给定模型架构获取这种潜力效果如何。对此,一个简单的方法是在同一个数据集上训练不同的架构!——当然,我们一直都在这么做。但这对于我们初衷——理解为什么一些模型比其他模型泛化得更好——仍然没什么用处。

正则化方法救场?

模型架构本身显然不足以作为一个合格的正则化函数(不能防止过拟合/记忆)。但是,常用的正则化技术呢?

“我们表明,显式正则化方法,如权重衰减、dropout 和数据增强,都不能充分解释神经网络的泛化误差:显式正则化确实可以提高泛化性能,但其本身既没必要也不足以控制泛化误差。”

「干货」ICLR-17 最佳论文详解:理解深度学习要重新思考泛化

显式正则化更像是做调整参数,有助于改善泛化能力,但不使用显示正则化方法也不一定意味着会产生泛化错误。并不是所有拟合训练数据的模型都能够很好地泛化。这篇论文中一个有趣的分析表明,通过使用梯度下降也能获取一定量的正则化:

“我们分析了作为隐式正则化函数的随机梯度下降(SGD)的表现。对于线性模型,SGD 总是收敛到一个小正态(norm)的解决方案。因此,算法本身将解决方案隐性地正则化了……尽管这并不能解释为什么某些架构比其他架构泛化得更好,但它确实表明,要准确理解使用 SGD 训练的模型继承了哪些属性,还需要更多的调查。”

机器学习模型的有效容量

假设有个神经网络,训练样本是有限数的 n。如果网络有 p 个参数(p>n),那么即使是简单到只有两层的神经网络也可以对输入样本的任何函数进行表征。论文作者(在附录中)证明以下定理:

“存在一个激活函数为 ReLU 的两层神经网络,权重为 2n + d,可以对维度为 d 大小为 n 的样本的任何函数进行表征。”

就连线性大小的 2 层深网络也可以表征训练数据的任何标签!

结论:需要新的衡量模型复杂度的方法

“这种情况对统计学习理论构成了一个概念上的挑战,因为衡量模型复杂度量的传统方法不能很好地解释大规模人工神经网络的泛化能力。我们认为,我们目前还没有发现一个精确的正式衡量方法,在这个衡量方法下,这些庞大的模型都很简单。从我们的实验得出的另一个见解是,即使最终的模型不能泛化,在实际操作中优化还是很容易的。这也表明了为什么实践中容易做优化的原因与神经网络泛化能力的原因是不同的。”

论文及 ICLR-17 公开评审简介

「干货」ICLR-17 最佳论文详解:理解深度学习要重新思考泛化

摘要

尽管体积巨大,成功的深度人工神经网络在训练和测试性能之间可以展现出非常小的差异。过去一般将其归功于泛化误差小,无论是对模型谱系的特点还是对于训练中使用的正则技术来说。

通过广泛的系统的实验,我们展示了传统方法无法解释为什么大规模神经网络在实践中泛化表现好。 具体来说,我们的实验证明了用随机梯度方法训练的、用于图像分类的最先进的卷积网络很容易拟合训练数据的随机标记。这种现象本质上不受显式正则化影响,即使我们通过完全非结构化随机噪声来替换真实图像,也会发生这种现象。我们用一个理论结构证实了这些实验结果,表明只要参数的数量超过实践中通常的数据点的数量,简单两层深的神经网络就已经具有完美的有限样本表达性(finite sample expressivity)。我们通过与传统模型进行比较来解释我们的实验结果。

【一句话总结】通过深入系统的实验,我们指出传统方式无法解释为什么大规模神经网络在实践中泛化表现良好,同时指出我们为何需要重新思考泛化问题。

【ICLR 评委会最终决定】作者提供了深度神经网络拟合随机标注数据能力的迷人研究结果。调查深入,有启发性,鼓舞人心。作者提出了a)一个理论实例,显示具有大量参数和足够大的 wrt 样本的简单浅层网络产生了完美的有限样本表达性;b)系统广泛的实验评价,以支持研究结果和论点。实验评价的考虑非常周全。

  • 论文地址:https://openreview.net/forum?id=Sy8gdB9xx¬eId=Sy8gdB9xx

  • Adrian 原文:https://blog.acolyer.org/2017/05/11/understanding-deep-learning-requires-re-thinking-generalization/

特朗普成发推狂魔 Twitter联合创始人:我错了

中国向美国开放四千亿的市场,吃货们有福了,可澳大利亚人急了……

据新华社报道,5月12日中美双方宣布就经济合作“百日计划”达成十项共识。

在这份被称为“贸易大礼包”的清单中,最让美国人感到兴奋的就是,美国牛肉时隔14年后被允许重返中国市场。而近日,中国财政部副部长朱光耀定下了明确期限,表示要在今年7月16号前实现美国牛肉输华。

面对中国规模超过四千亿元的牛肉市场,美国业界兴奋不已,特朗普总统、白宫发言人和美国养牛者协会都公开表达了欣喜和期待。而美国牛肉以物美价廉著称,允许美牛入华势必要对目前中国市场上的进口和国产牛肉产品造成严重冲击。

每经小编(微信号:nbdnews)注意到,作为中国进口牛肉的主要来源国,澳洲媒体和业界开始感到紧张。澳洲牛肉就将会面临着美国牛肉最直接的冲击。面对“危机”,澳洲各大媒体纷纷发声,为本国牛肉产业出谋划策。

可以预计的是,不管美国牛肉、澳洲牛肉,或是风头正盛的南美牛肉在中国如何进行“三国演义”,最大的赢家一定属于中国消费者和“吃货”们。

美国牛肉期待进入中国市场

中国向美国开放四千亿的市场,吃货们有福了,可澳大利亚人急了……

美国牛肉馅(图片来源:视觉中国)

在2003年以前,美国已经成为中国的主要牛肉进口国。只不过彼时中国人对牛肉的需求量微不足道,牛肉行业的市场规模很小。根据美国农业部的统计数据,2003年中国的牛肉进口总额只有1500万美元,其中来自美国的牛肉进口额就占了1000万美元。

2003年底,美国牛肉产品被检测出牛脑海绵状病感染,即人们俗称的“疯牛病”,随后中国停止了对绝大部分美国牛肉的进口。

随着中国社会的发展,牛肉这种高蛋白食物在中国人的餐桌上占据了越来越大的比重。中经先略数据中心发布的《2017-2022年中国牛肉市场运行态势及投资战略研究报告》显示,1996年,我国人均牛肉消费量只有2.82千克。到了2015年,这个数字增长为5.45千克。

中国的牛肉市场规模在2010年以后开始呈现出井喷状态。中经先略的报告显示,2015年,中国的生鲜牛肉消费规模达到4118.8亿元,超过了2010年时的两倍。这其中进口牛肉也占据了很高比重。据北京青年报消息,中国去年牛肉进口量达到82.5万吨,金额约26亿美元。而2003年,全年牛肉进口量仅为1500万美元,相差173倍!

中国向美国开放四千亿的市场,吃货们有福了,可澳大利亚人急了……

图片来源:中经先略数据中心

之前错过中国牛肉市场井喷时期,让面对肉价不断走低的美国业界感到遗憾。好在这次美国牛肉终于要在今年7月前重返中国市场了,美国业界传出振奋的言论。

根据北京青年报报道,不仅美国商务部长罗斯、白宫新闻发言人斯派塞都在记者会上专门介绍了这一消息,甚至特朗普也忍不住表态称“中国允许进口美国牛肉才是真正的新闻”。而美国的全国养牛者牛肉协会更是对中国将解禁美国牛肉进口发表声明,“怎样形容这对全国养牛业者的好处都不过分!”

美牛入华,谁最受影响?

价廉物美,竞争力强的美国牛肉即将进入中国市场,人们自然好奇,哪些牛肉出口国的输华份额会受到冲击?中国国产牛肉会不会受到太大影响?

然而中国养牛业内人士普遍认为,其实最首当其冲的反而是中国市场上的走私进口牛肉。

根据MIG集团的研究报告,2014年,中国市场上通过正规关税渠道进口的牛肉大约为30万吨,但走私牛肉高达97万吨,占全部进口牛肉份额的76%。

中国向美国开放四千亿的市场,吃货们有福了,可澳大利亚人急了……

图片来源:梅特国际集团

目前从国外走私到中国的牛肉基本都是冻肉,有的不良商贩甚至用走私的劣质牛肉冒充高档的日本“和牛”产品,尽管中国并未开放对日本牛肉的进口。

据北京青年报记者在北京各大超市和农贸市场调查发现,走私牛肉在国内的售价大约在40元/公斤,比起国产牛肉价格更为便宜。一旦价格低廉的美国牛肉引入中国市场,其正规渠道进口的价格可能会低于走私牛肉。失去了价格优势后,品质低劣的走私牛肉很难再有生存空间。

绝大多数进口食品在中国的价格要远贵于国货,但牛肉是一项例外。很多逛过美国超市的人都知道,每磅不到2美元的牛肉很常见,折合人民币大约每斤10元左右。而在中国市场,虽然近一两年牛肉价格有所下滑,但目前依然在每斤30元左右的水平。每经小编(微信号:nbdnews)注意到,根据国家统计局最新一期50个城市食品价格统计数据显示,今年5月上旬我国牛(腿)肉的价格为每公斤66.96元,每斤超过33元。

在正规渠道进口的牛肉中,目前我国消费者最熟悉的大概是澳大利亚和新西兰牛肉。但2016年以来,以巴西和乌拉圭为代表的南美牛肉以价格取胜,抢占了澳洲牛肉的市场份额。

中国向美国开放四千亿的市场,吃货们有福了,可澳大利亚人急了……

图片来源:梅特国际集团(MIG)

根据MIG集团数据,2016年1月,巴西成为中国最大的牛肉来源国,份额从2015年的13%猛增至33%,而澳大利亚退居第二。

2016年由于干旱问题带来水资源紧张,澳大利亚政府限制了养牛数量,造成牛肉供应下滑,限制了对中国的出口数量。2016年澳大利亚对中国牛肉出口骤降至6.7亿澳元,下滑幅度达到40%。正是借助这一机会,去年巴西对中国的牛肉出口份额上升至第一。

不过在今年早些时候,巴西警方调查发现当地多家企业存在售卖过期变质肉类食品的违法行为。今年3月份中国商务部表示,作为巴西肉类最大的进口国,中国对巴西肉类出现质量问题表示高度关切,中国已临时采取措施暂停进口巴西牛肉。

因此,不管是陷入质量危机的巴西牛肉,还是在华市场份额下降的澳大利亚牛肉,都在竞争力极强的美国牛肉面前显得有些难以招架。

澳大利亚紧张了,媒体出谋划策

面对美国牛肉的竞争,澳大利亚牛肉行业开始紧张。澳大利亚广播公司(ABC)5月17日作出专题报道称,美国和澳大利亚的牛肉出口商将在中国市场面临激烈竞争。

ABC认为,近两年来美国的牛肉价格正处于低谷。2016年7月份的数据显示,美国肉牛的均价同比下滑了25%。如今中国对美牛开放市场,无异于送给美国牛肉产业一个“大礼包”,也必将有助于提升美牛的价格走势。

澳大利亚《金融评论》认为,中国的进口牛肉市场将演变为美国、澳洲和南美牛肉的“三国演义”,而澳洲牛肉的前景不容乐观。2015年澳大利亚向中国出口的牛肉总量达到10亿澳元,但由于干旱,影响到牛肉产量,2016年该数据骤降至6.7亿澳元。澳大利亚不仅面临南美廉价牛肉的竞争,还要面对美国对澳大利亚牛肉市场产生的“重大压力”。

不过在担忧的同时,澳媒也纷纷肯定澳大利亚牛肉在行业内的优势。澳《金融评论》称,澳大利亚牛肉进入中国市场已经14年,并且已经在中国建立了澳大利亚牛肉“高档”的品牌形象。

澳洲主要农业贷款机构高级分析员贝尔德称,目前美国出口的大部分生牛肉来源是激素牛,而此类牛肉被中国禁止进口;此外美国很多牛肉产品无法满足中国的食品进口标准中“可追溯生产来源”的要求,而澳大利亚养殖牲畜的记录则是完整保留的,这也是澳大利亚牛肉出口的优势所在。

珠海银隆正式申请IPO,董明珠是二股东

全球最具价值品牌排行 苹果屈居第二 中国企业只有它杀入前十