• 项目
首页>>文章列表 >>金融科技
文章列表

就业和通胀表现背离 美联储再度面临熟悉的困境

美国劳动力市场持续改善,而通胀却出现走软迹象,美联储的两大目标再次给出了相互冲突的信号。

受汽油和新车等产品价格的影响,美国PCE物价指标在触及五年最高水平后出现回落。3月核心PCE同比仅增长1.6%,明显低于美联储2%的目标。而与此同时,美国3月失业率则由2月的4.7%降至4.5%,为近10年新低。

高盛认为,美国经济已经实现完全就业,从这个角度来看,进一步收紧货币政策的理由充足。但是从通胀来看,过去多年来,鸽派认为让通胀回到2%应该是更优先的任务。

高盛表示,预计在未来数年中,随着通胀加速至超过2%,这种困境会自然消失。但是如果劳动力市场过热,同时核心PCE指标增幅有限,美联储面临的困境短期内难以消失又该怎么办?

为回答这个问题,高盛就当前这轮紧缩周期以及上一轮紧缩周期分别作了分析。

高盛表示,2013年12月以及2015年,美联储分别决定缩减QE和开始加息。在作出这些决定之前,核心PCE指标长期低于美联储目标。尽管在过去两次加息时核心PCE曾经超过1.7%,不少FOMC成员对加息依然心存犹疑。

要求等待通胀抬头的最典型代表,包括Evans、Brainard以及Tarullo,他们在2016年就开始警告不要过早加息。但是,最后的结果表明,美联储更在意劳动力市场过热会导致未来被迫过快加息。


高盛称,关于美联储在这两个因素上的权衡,2016年底美联储主席耶伦关于“高压经济”的表述是又一个例子,FOMC当时再度决定应该避免出现经济过热的风险。

高盛认为,这表明,在通胀不振和劳动力市场过热这个困境中如何抉择,FOMC已经应对自如。

从历史上看,美联储也曾经面临过同样的困境。

在1999年6月美联储加息之际,美国同样是就业市场表现强劲,而通胀明显疲软,核心PCE指标仅为1.3%。

当时FOMC成员中很多人认为这种情况不可持续,时任美联储主席格林斯潘表示,“有问题的是劳动力市场……我们面临的情况是均衡被打破。我们现在看到的情况如果一直持续下去,必定会在劳动力市场造成问题,并最终会在单位劳动力成本和价格上出现问题。”

高盛表示,尽管当时并不是所有FOMC成员都同意这种说法,但FOMC最终却表示,加息对于减小通胀上行风险是“有必要且审慎的举动”。

到了2000年5月,FOMC累计加息175个基点。高盛称,在这期间美国失业率进一步下滑,但是核心通胀仅小幅上扬。尽管通胀数据疲软,但FOMC担心短期内通胀压力的积累,因而先行采取行动,且“仅在需求放缓到不再有过热风险的程度时才停下脚步。”


高盛表示,从这个时期的情况来看,即便实际通胀没有问题,美联储对市场过热和通胀进一步抬头的担忧就会促使他们稳步收紧政策。

对于市场而言,高盛认为,FOMC似乎习惯于在加息上先行采取行动,而不是等待通胀达标,因而市场价格就容易定的过高。

14部门联合出击!央媒称未来两月严查房地产金融违法违规

在中央高层罕见强调金融安全于治国理政的重要性后,这轮金融监管风暴声势越发浩大。央媒获悉,未来两个月,多个部门将联手打击房地产金融违法违规行为。

据新华社主管的《经济参考报》今日报道,近日,住建部等14个部门联合召开处置非法集资部际联席会议,提出于今年5月至7月组织各省(区、市)政府开展涉嫌非法集资风险专项排查活动,对电子商务、租赁、房地产、地方交易场所等行业企业及关联企业开展全面风险排查,有效减少存量风险、控制增量风险。

报道称,住建部相关负责人在会上表示,将加大对房地产开发企业和中介机构违法违规行为的整治力度,把非法集资问题作为行业监管的重要内容。

也是在这次会上,住建部称,配合一行三会等部门开展互联网金融风险专项整治,严禁开发企业、中介机构提供或协助提供首付贷、众筹买房等违法违规金融产品;认真查处房地产开发企业和中介机构未取得相关金融资质,利用P2P网贷平台和股权众筹平台从事房地产融资业务的行为,或虽取得相关金融资质但违规开展相关金融业务的行为。

以上14部门联合行动是一个月来“史上最强”监管风暴不断升级的又一体现。在中央对金融安全高调表态后,金融和房地产市场迎来更强劲的监管风暴。

上月初至今,“三行一会”不断加码对各自领域的监管,一行三会相继表态要“加强金融监管”。银监会更是密集发文,剑指金融监管套利、委外等,市场人士形容此次强监管“史无前例”。

上月25日,中国国家主席习近平主持召开中共中央政治局会议,中共中央政治局就“维护国家金融安全”进行的第四十次集体学习,习近平还对金融给出最新定调:金融活,经济活;金融稳,经济稳。

这次中央政治局会上,中央对房地产长效机制的表述出现了微妙变化:去年12月中央经济工作会议提到“加快研究建立”,今年3月政府工作报告称“加快建立和完善”,本次会议措辞为“加快形成”。

从以上表述的转变预计,政府将强化房地产的居住属性,抑制投资属性。这意味着,对于金融和房地产市场而言,加强监管或将成为短期内必不可少的重要手段。

本周新华社连发落实习近平金融安全重要讲话精神的系列文章。本周二文章称,习近平强调,切实把维护金融安全作为“治国理政的一件大事”,这则点明了这关系到党和国家工作全局、经济社会发展大局和国家安全战略格局。

昨日发布的最新系列文章则是指出,“打铁还需自身硬”,金融机构做好自身的事情是防范金融风险的根本,不能让本应是风险管控责任主体的金融机构成为风险之源。

全球最大债券基金--苹果公司!

如果苹果公司是一家债券基金,那么它一定碾压所有的竞争对手。

根据苹果公司周三递交的监管文件,该公司拥有的2570亿美元现金储备中,有1480亿美元投资了企业债,规模足以购买全球最大的固定收益共同基金Vanguard Total Bond Market Index Fund的所有资产。后者整体资产规模为1450亿美元,资产类别包括企业债、政府债券和抵押债券。

除了企业债,苹果的现金储备里持仓第二位的资产就是适销债券。苹果将530亿美元投资了美国政府国债,210亿美元投资了抵押债券和资产担保债权。

华尔街见闻此前提及,苹果公司拥有2500亿美元现金及其等价物,比德国的外汇储备总量还要高。

在去年12月,苹果的资产负债表上大概有2500亿美元现金及其等价物;

在2016年的最后3个月份,苹果大概每小时进账360万美元现金;苹果的财报显示,其现金储备在去年四年半中已经翻番;

苹果账上的现金已经足够买下特斯拉和Netflix,而且还有现金剩余。

和众多科技公司一样,苹果拒绝将海外收益带来美国,以避免高额的企业税,该公司将钱都投资于企业债、货币市场基金以及美国国债。

随着特朗普即将推进税改,给予企业收入以更低的税率,很多公司可能开始考虑将现金带回美国。特朗普此前提议资金汇回税率降至10%,以吸引美国大企业将资金回流。

2004年,美国前总统乔治·布什曾进行过类似税改,将资金汇回税率降至5.25%,结果令3000亿美元海外盈利汇回。

而如果像苹果拥有如此大规模现金储备的公司做出任何大举动,将推动整个市场的变化。美国媒体援引分析师表示,这些拥有很大现金储备的公司可能会想要将钱放入美债这类流动性证券。

世界500强全球分布地图:东亚三国分布最密集,占全球近4成

根据美国财富杂志公布的2016年世界500强企业榜单,美国占据134家,中国110家。紧随其后的是日本、法国、德国、英国和韩国等国家。

世界500强全球分布地图:东亚三国分布最密集,占全球近4成

2016年财富世界500强企业情况

只看数字可能还不够直观,那么从世界地图来看看世界500强的分布情况可能更为震撼。另外,除了国家分布之外,各国分地区的情况也更能够体现。总得来说,不仅仅体现了国家的企业实力,也体现了一个国家不同区域的经济分布情况。

下面,我们先来看看世界500强全球分布情况:

世界500强全球分布地图:东亚三国分布最密集,占全球近4成

财富世界500强全球分布情况

很直观的体现,全球500强绝大部分分布在美国、欧洲和东亚地区。其他地区太少了,仅仅零星分布。主要集中在巴西、印度和东南亚地区。

世界500强全球分布地图:东亚三国分布最密集,占全球近4成

世界500强亚洲分布情况

亚洲的世界500强企业主要分布在东亚地区,中日韩三国的世界500强企业差不多200家,约占全球的40%。其他的主要分布国家是印度(7家)、新加坡(3家)。其余的泰国、沙特阿拉伯、阿联酋和印尼分别仅1家企业入选。

世界500强全球分布地图:东亚三国分布最密集,占全球近4成

世界500强在美国的分布情况

美国的世界500强企业主要分布在加州、五大湖区和东北部沿海地区(以纽约为中心),其余的主要分布在西北部的华盛顿州和德州等地。这些地区也是美国经济最发达、最活跃的地区。

世界500强全球分布地图:东亚三国分布最密集,占全球近4成

世界500强欧洲分布情况

欧洲地区的世界500强企业主要分布在西欧,且以德国、法国、荷兰和英国等国家为主要。相比之下,东欧、南欧和北欧的分布较少。同样,这些地区也是欧洲经济实力最强和最发达的地区。

虽然中国大陆入选企业有103家,那么在中国的分布情况如何呢?

世界500强全球分布地图:东亚三国分布最密集,占全球近4成

世界500强在中国的分布情况

从地图分布情况来看,中国的世界500强主要分布在北京及周边地区、长三角和珠三角地区。相比之下。对于中国中西部地区大多数省市而言,世界500强还是一个遥不可及的梦。

以西南地区为例,没有一家世界500强企业,这也充分的体现了中国区域发展的巨大差异。

全球九大共享经济模式

全球最吸金的9大共享经济模式(含吸金数据,转需收藏)

除了基辛格,《第三次工业革命》的作者杰里米·里夫金可能是最受中国欢迎的美国人了。

里夫金认为,协同共享是一种新的经济模式,数十亿人既是生产者也是消费者,在互联网上共享能源、信息和实物,所有权被使用权代替,“交换价值”被“共享价值”代替,人类进入“共享经济”新纪元。

全球顶级战略管理咨询公司罗兰贝格2016年底发布共享经济报告指出,至2018年,全球共享经济规模有望达到5200亿美元(约36000亿人民币)。

全球最吸金的9大共享经济模式(含吸金数据,转需收藏)

全球共享经济行业渗透趋势图

全球最吸金的9大共享经济模式(含吸金数据,转需收藏)

全球共享经济规模&独角兽企业名单

其中,中国已经形成625亿美元(约4300亿人民币)的共享经济市场,并保持54%的高速增长,到2018年中国共享经济市场有望达到2300亿美元(约15800亿人民币),在全球经济中的占比由33%提升至44%,成为领军力量。

根据国家信息中心分享经济研究中心发布的《中国分享经济发展报告2017》,2016年中国分享经济市场交易额约为34520亿元,比上年增长103%。 到“十三五”期末, 共享经济在中国GDP中的占比将会超过10% 。

全球最吸金的9大共享经济模式(含吸金数据,转需收藏)

2016年中国分享经济重点领域市场规模

在国外做得较好的如:共享车Uber,共享空间Airbnb,技能分享Taskrabbit,共享资金价值Zopa(全球第一家P2P网贷公司)等等。

全球最吸金的9大共享经济模式(含吸金数据,转需收藏)

国外共享经济代表企业

在当下的中国,共享租车、共享单车、共享汽车、共享充电宝、共享篮球……共享经济正在成为大众关注的焦点,资本追逐的宠儿。

共享经济应该怎么玩?来看全球最吸金的9大共享经济商业模式。

它们分别是——

共享出行

共享空间

共享金融

共享美食

共享医疗健康

共享公共资源

共享知识教育

共享任务服务

共享物品

一、共享出行

全球最吸金的9大共享经济模式(含吸金数据,转需收藏)

交通出行是共享经济目前在全球范围影响最广、争议最多、也是最彻底贯彻共享经济精神的领域,主要有共享租车、共享驾乘、共享自行车、共享停车位四种类型。

交通出行的共享基于巨大存量市场,把社会上大量闲置的车资源、司机资源、停车位资源等给盘活了,在改变人们出行方式的同时,指数级提升了交通闲置资源的利用率。

Uber可谓是“共享经济”的启蒙,作为世界上最大的出租车公司,通过移动应用,虽没有一部车,却建造了一个共享经济的平台,打破了传统由出租车或租赁公司控制的租车领域。

罗兰贝格认为,目前中国的社会车辆的平均闲置时间约95%,大量运力未被激活。汽车共享出行作为需求最迫切、行业成熟度最高的领域,理应成为中国发展共享经济的率先切入点。

除了共享汽车,中国的共享自行车市场可谓打得正热。以摩拜、ofo为首的约15-20家共享单车品牌共同组成了“彩虹家族”。

全球最吸金的9大共享经济模式(含吸金数据,转需收藏)

全球最吸金的9大共享经济模式(含吸金数据,转需收藏)

几个“彩虹家族”主要成员的创始人背景

支付宝不久前正式宣布,ofo、永安行、小蓝、Hellobike、funbike、优拜等共享单车品牌(摩拜除外)与蚂蚁金服达成合作。4月29日起,用户通过支付宝的扫一扫,就可解锁这些品牌的共享单车。

全球最吸金的9大共享经济模式(含吸金数据,转需收藏)

二、共享空间

全球最吸金的9大共享经济模式(含吸金数据,转需收藏)

空间是无处不在的资源,但它有着明确属性特征,主要包括共享住宿空间、共享宠物空间及共享办公场所空间三种产品形态。

传统空间拥有者想要高频次出售或短租给需求者,或者需求者想要了解房屋真实情况,交易的时间成本就非常高,但空间的共享经济则将传统的壁垒打破了,供需双方可以很快速地建立联系并沟通,信息完全对称。

在 Uber 改造了人们的出行方式之后,Airbnb也改变了人们的居住空间和旅行模式。被誉为“住房中的Ebay”——Airbnb,虽没有自己的房子,却能通过一个网站就能在全世界192个国家,30000座城市为旅行者提供300万套房间,而且都是各具特色的民宿。旅行意味着享受生活,在这些短租平台上选择民宿或短租房,不仅价格比星级酒店更低廉,与房东一家相处,还能体验当地风土人情特色。

而比起这些所谓的“鼻祖”,拼租房屋似乎是目前绝大多数人选择的一种“共享”模式,通过房屋资源的共享来均摊生活成本,在保证私人隐私空间的基础上,还可以进行友情、人脉资源以及彼此之间知识的共享。尤其是北上广深一线城市,在高房价的压力下,共享房屋成为刚毕业、甚至已工作数年的人群的最佳选择。

同时,与 Airbnb的个人房屋共享不同,WeWork开创了人们对工作空间的变革。通过在一些租金较为便宜的地区租用楼面,并进行二次设计,将楼面设计为风格时尚、可定制且社交功能较齐全的办公空间,打破了原有的办公室整体租赁的习惯,按需出租工位,这种办公空间的共享因高效、低成本、便利化再次引领了当今共享经济的潮流。国内的SOHO 3Q、优克工厂等效仿WeWork模式开创的众创空间,也给予了创业公司在资金、政策方面更多的资源。

全球最吸金的9大共享经济模式(含吸金数据,转需收藏)

三、共享金融

全球最吸金的9大共享经济模式(含吸金数据,转需收藏)

金融与互联网模式相互渗透,促使金融的共享经济需求诞生,主要有P2P网贷模式与众筹模式。

金融共享经济通过互联网平台快速高效搜寻和撮合资金的供需方,加快资金的周转速度, 最大程度发挥了资金的使用价值,让更多人享受到金融服务。

在投资、融资和支付领域,共享金融才刚刚开始,并且尚以新生金融机构为主,广大传统机构还没有大批跟上。但可以肯定的是,这一趋势已经形成,而且将以超出大多数人预料的速度呈井喷式发展。有人预测,到2020年,共享金融将发展出丰富的生态圈,细分出巨量业务,总规模将达到数以万亿元计;更有人大胆地预测,未来有一天银行会消失一大部分,作为专业的金融本身也会消失大半,金融会随时附着在各种商业活动中,随时解决金融问题,发挥金融功能。

全球最吸金的9大共享经济模式(含吸金数据,转需收藏)

四、共享美食

全球最吸金的9大共享经济模式(含吸金数据,转需收藏)

OpenTable 创立于1998年,是一家上市公司。消费者可以通过他们的应用查看附近餐厅、菜谱和评价,并预订座位,而 OpenTable 通过向餐厅收取一定费用来实现收入。

国内从2014年开始,爱大厨、好厨师、烧饭饭等应用软件已纷纷上线。

“回家吃饭”利用社区内闲暇中年人的烹饪能力共享家庭厨师,将菜肴以外卖的形式送到办公场所,类似于邻里“搭伙吃饭”的模式,比餐馆的价格更便宜,菜式更丰富,也更安全。

通过这些第三方平台,好手艺的大厨们可以充分发挥自己的特长,在闲暇之余为他人提供高品质的美食,同时,也可以获得收入。把自己的闲暇和才华分享给他人,创造了意想不到的价值。

全球最吸金的9大共享经济模式(含吸金数据,转需收藏)

五、共享医疗健康

全球最吸金的9大共享经济模式(含吸金数据,转需收藏)

国内还在面临排队挂号看病难的今天,远在万里之外的大洋彼岸,纽约市的患者已经可以享受众多医生通过预约平台提供的按需服务。提供此类服务的移动互联网新生代公司Heal,Pager,MediCast等企业被业内一致看好,极有可能成为下一个Amazon、Uber这样能改变人们日常生活方式的互联网巨头。

在Pager平台上,患者只要有需求就可以通过移动应用来预约医生,公司会从签约医生中挑选一位与患者达成1对1连接,并在2小时内提供上门服务。

这些对于没有时间在医生办公室排队的患者来说意义重大,可以节省时间和精力,享受定制化医疗服务;对于医生而言,也可以额外地获得一些收入。

另一种共享模式是对健身场馆及健身教练分享使用,如ClassPass,采用“整进散出”的模式,通过资源整合,将纽约市的健身会馆联结在一起。

全球最吸金的9大共享经济模式(含吸金数据,转需收藏)

六、共享公共资源

全球最吸金的9大共享经济模式(含吸金数据,转需收藏)

马斯克收购的SolarCity公司主要业务是购买闲置太阳能光伏系统,然后租赁给用户并提供安装等周边服务,通过周边服务的附加值将产品提价并从用户手中赚取差价。

Open Garden的目标是建立一个大家可以共享Wifi的网络,手机、平板等设备安装后每台设备都变成一个Wifi热点,同时相互连接就形成一个庞大的Wifi网络,随后,它又推出了不需要网络也可以发送消息的应用软件FireChat。

公共资源的共享让众多分散的用户与数据瞬间成了可利用的资源,同时又不会造成资源的过剩, 让资源的分配更均匀。

全球最吸金的9大共享经济模式(含吸金数据,转需收藏)

七、共享知识教育

全球最吸金的9大共享经济模式(含吸金数据,转需收藏)

国外的Ted、国内的网易公开课,都是典型的知识共享平台。

中国的果壳推出了知识分享产品——在行&分答,将知识分享从线上引到线下。每个人都可能是一个领域的专家,让这些专家将自己的经验和知识与他人不仅在线上而且在线下进行1对1的分享,可达到更好效果。

对于知识共享的未来,知乎一直在朝着“知识变现”、“内容付费”等方面进行探索。

一直深耕于2B市场的直播产品——微吼专注于视频直播和企业服务,帮助企业提供产品发布、大小活动等的直播,而这些活动主要集中于金融、互联网等高知行业,所以微吼的直播具备了知识分享的属性。此外微吼直播还是知识型主播的孵化平台,为知识型“网红”建立专属直播间。

在分享的过程中,让存在于每个人头脑中的知识发挥更大的价值,而且通过互联网的方式, 打破了空间的限制,这种知识的共享可以触及地球每一个角落的人们, 帮助他们提高教育水平和文明程度。这种方式本身除了对个体有价值之外,对于整个世界的发展都有着非常深远的意义。

全球最吸金的9大共享经济模式(含吸金数据,转需收藏)

八、共享任务服务

全球最吸金的9大共享经济模式(含吸金数据,转需收藏)

帮助别人完成任务或提供各种服务。人们在网站上发布工作内容,然后别人可以领取任务,完成任务后获得相应的报酬,美国的TaskRabbit、中国的威客都是这样的企业。

从发布任务者的角度来说, 成本低、解决速度快,而接受任务的人则可以赚些外快。这种模式下,公司也将会更“轻”更扁平。

另外,共享经济下的快递业可以充分利用全社会拥有空闲时间的人员,因而在人员问题上要好于传统快递业,而基于地理位置寻找最近人员的方式也使快递的时间得到了节约。

全球最吸金的9大共享经济模式(含吸金数据,转需收藏)

九、共享物品

全球最吸金的9大共享经济模式(含吸金数据,转需收藏)

物品共享领域其实是最早就出现的共享形态,随着移动互联网的发展,共享物品的商业模式呈现除了物品共享、书籍共享、服装共享等更加多元化的形态。

在共享物品这种模式下, 降低了供给和需求两方的成本,大大提升了资源对接和配置的效率。这不仅体现在金钱成本上,还体现在时间成本上。

在中国,一个谜の共享经济火了——共享充电宝。《金融界》的报道标题总结得好:《10天融资近3亿,IDG、腾讯、朱啸虎、王刚等20家机构入局》。聚美陈欧3亿元投资街电科技,出任董事长后,王思聪放话“共享充电宝要是能做成,我吃翔!”

全球最吸金的9大共享经济模式(含吸金数据,转需收藏)

以上就是全球最吸金的九大共享经济模式,下一个万亿级市场。

回到文章开头。里夫金毫不否认,共享经济肯定会有阻碍,并且在很长一段时间内,阻碍因素和发展会同时存在,大家互相磨合,磨到最后突然某一天你就渐渐地看到它不存在了。

他为我们构想的未来社会生活化图景是这样的:数以亿计的人们将在家里、办公室、工厂生产出自己的绿色能源,并在“能源互联网”上与大家分享。就像当下我们在互联网上发布、分享消息一样。而能源民主化将从根本上重塑人际关系,它将影响我们如何做生意、如何管理社会、如何教育子女和如何生活。

FB开源人工智能框架ParlAI:可轻松训练评估对话模型

Facebook 近日在 GitHub 上开源了一个可用于在多种开放可用的对话数据集上训练和评估人工智能模型的框架 ParlAI

loading...
ParlAI(读音为 par-lay)是一个用于对话人工智能研究的框架,是用 Python 实现的。该框架的目标是为研究者提供:
一个用于训练和测试对话模型的统一框架
一次性在许多数据集上进行多任务训练
无缝集成 Amazon Mechanical Turk,以便数据收集和人工评估
这第一个版本支持超过 20 种任务,也囊括了许多流行的数据集,比如 SQuAD、bAbI tasks、MCTest、WikiQA、WebQuestions、SimpleQuestions、WikiMovies、QACNN & QADailyMail、CBT、BookTest、bAbI Dialog tasks、Ubuntu Dialog、OpenSubtitles、Cornell Movie 和 VQA-COCO2014。
还包括使用 PyTorch 和 Lua Torch 训练神经模型的示例,其包含了在 GPU 上的批训练或在 CPU 上的 hogwild 训练。另外使用 Theano 或 TensorFlow 也是很直接的。
我们的目标是让那些在它们之上训练的任务和智能体能够以一种基于社区的方式成长。
这个版本还是早期的 Beta 版,使用过程中可能会有一些冒险,或遇到一些难题。
目标
用于评估模型的统一框架
可按需下载任务/数据集,且为它们提供了同样简单的接口
统一的数据集输入和评估框架/标准
agents/ 目录鼓励研究者提交他们的训练代码,以便在该 repo 中分享
协助重现
最终目标是实现通用的对话,包括许多不同的技能
无缝地组合模拟的和真实的语言任务
鼓励多任务模型的开发和评估
有助于减少模型在特定数据集上的过拟合
最终目标是实现与人类的真实对话
通过 Mechanical Turk,在与人类的实时对话上训练和评估
只需简单的设置,就可以连接 Mechanical Turk 上的人类与你的对话代理
允许比较不同研究组的 Turk 实验
能够引导一个可与人类交互的对话模型的数据集配置
激励构建将进入本 repo 的新数据集
特性
所有的数据集都像自然对话:单一格式/API
既有固定数据集(会话日志),也有交互式任务(在线/RL)
既有真实任务,也有模拟任务
支持其它媒体,比如 VQA 中的视觉
可以使用 Mechanical Turk 来运行/收集数据/评估
Python 框架
PyTorch 的训练示例
可使用 zmq 与其它非 Python 的工具箱对话,给出了 Lua Torch 的示例
支持模型的 hogwild 训练和批训练
基本示例
从「1k training examples」bAbI 任务的任务 1 中展示 10 个随机样本:
python examples/display_data.py -t babi:task1k:1
同时在 bAbI 任务的多任务与 SQuAD 数据集上展示 100 个随机样本:
python examples/display_data.py -t babi:task1k:1,squad -n 100
在 Movies Subreddit 数据集的验证集上评估 IR 基线模型:
python examples/eval_model.py -m ir_baseline -t "#moviedd-reddit" -dt valid
给出该 IR 基线模型的预测:
python examples/display_model.py -m ir_baseline -t "#moviedd-reddit" -dt valid
在「10k training examples」bAbI 任务 1 上训练一个简单的基于 CPU 的记忆网络,其使用了 Hogwild(需要 zmq 和 Lua Torch),有 8 个线程(Python 进程):
python examples/memnn_luatorch_cpu/full_task_train.py -t babi:task10k:1 -n 8
在 SQuAD 数据集上训练一个「注意 LSTM」模型,其中批大小为 32(PyTorch 和 regex)
python examples/drqa/train.py -t squad -b 32
要求
ParlAI 目前支持 Python3。
核心模组的依赖内容参见 requirement.txt。其中部分模型(在 parlai/agents 中)有进一步要求,比如需要 PyTorch 或 Lua Torch——所有这些模组的要求都可以参见 requirements_ext.txt 这个文档。
安装 ParlAI
首先,复制该 repository,然后进入复制的目录。
链接安装:运行 python setup.py develop 来将复制的目录链接到你的 site-packages。如果你打算根据你的运行修改任何的 parlai 代码或者提交一个 pull request,特别是如果你想在 repository 上添加另外的任务的话,那么我们推荐上述安装过程。所有需要的数据都将被下载到 ./data,而且,如果要求任何模型的文件(目前仅是 memnn 模型),它们都将被下载到 ./downloads。
复制后的安装内容(仅将 parlai 用作一个依赖项):运行 python setup.py install 来将内容复制到你的 site-packages 文件夹。所有数据都会被默认下载到 python 的 site-packages 文件夹中(你可以通过命令行来改写路径),不过一旦对代码作出了任何改动,你都需要重新运行一次安装。如果你仅想将 parlai 作为一个依赖项使用(比如用于访问任务或核心代码),那么目前这样就可以了。但是如果你想要清除下载的数据,那么删除 site-packages/parlai 中的 data 和 downloads 文件夹(如果可以的话)。
Worlds, agents 和 teachers
ParlAI 中的主要概念(类):
world——它定义了环境(它可以非常简单,可以仅两个代理相互对话)。
agent——这是世界里的一个代理,比如一个学习器。(存在很多学习器。)
teacher——这是一种可以和学习者对话的代理,它用于实现前面提到的任务。
在定义完 ParlAI 中的 world 和 agent 之后,一个主 loop 可被用来训练、测试或显示,它叫做 world.parley() 函数。我们在左边的面板中给出了个实例的主要骨架,parley() 函数真实的代码写在右侧面板。
loading...
Actions 和 Observations
所有的 agent(包括 teacher)都以简单的格式互相对话——observation/action 对象(这是一个 python 字典)。这被用于传递 agent 之间的文本、标签和奖励。这和当在对话(行动)或听(观察)时是同类对象,但是不同视角(在这些字段中有不同的值)。这些领域如下所述:
尽管'text'(文本)领域将几乎可能在全部交流(exchange)中被使用,但是技术上来说,基于你的数据集,这些领域中的每个都是可选的。
对于一个固定的监督式学习数据集(比如 bAbI)来说,一个典型的从数据集进行交流(exchange)例子可以像如下这样(该测试集不包含标签):
Teacher: {
'text': 'Sam went to the kitchen\nPat gave Sam the milk\nWhere is the milk?',
'labels': ['kitchen'],
'label_candidates': ['hallway', 'kitchen', 'bathroom'],
'episode_done': False
}
Student: {
'text': 'hallway'
}
Teacher: {
'text': 'Sam went to the hallway\nPat went to the bathroom\nWhere is the milk?',
'labels': ['hallway'],
'label_candidates': ['hallway', 'kitchen', 'bathroom'],
'episode_done': True
}
Student: {
'text': 'hallway'
}
Teacher: {
... # starts next episode
}...
代码
代码被设置进了几个主要目录:
core:它包含了框架的首要代码。
agents:包含了可以凭不同任务交互的代理(比如:机器学习模型)。
example:包含了不同循环的一些基本样例(构建词典、训练/评价、显示数据)。
tasks:包含了可来自于 ParlAI 的不同任务的代码。
mturk:包含了设置 Mechanical Turk 的代码和作为样例的 MTurk 任务。
下面我们会更具体地说明每个目录,我们根据依赖项(dependency)来组织行文。
Core 库
core 库包含了如下文件:
agent.py:这个文件包含了一些可被你自己模型延展的基本 agent。
Agent:这是所有 agent 的基本类,实现了 act() 方法,该方法接受一个观察表(table)并且返回一个作为回复的表。
Teacher:它是 Agent 的子代,也实现了针对返回量度(returning metric)的报告方法。任务实现了 Teacher 这个类。
MultiTaskTeacher:它创造了一个基于「任务字符串」的 teacher 集,该集可以传递给 Teacher。在其中它创建了多个 teacher 并且在它们之间交替轮换。
create_task_teacher:它从一段给定的任务字符串中实例化了一个 teacher(比如「babi:task:1」或「squad」)。
build_data.py:用于设置任务数据的基本功能。如果你的文件系统需要不同的功能,你可以覆盖它。
dialog_teacher.py:包含了用于和固定交谈(chat)日志进行对话(dialog)的一个基本 teacher 类,同时它也包含了一个用于储存数据的数据类(data class)。
dict.py:包含了从观察中构建一般 NLP 风格字典的代码。
DictionaryAgent:在一个字典中跟踪索引和词频的 agent,可以将一个句子解析成它字典或 back 中的指数(indice)。
fbdialog_teacher.py:包含了一个 teacher 类,该类实现了一个 setup_data 函数,这个函数用 Facebook 的 Dialog 数据格式来解析数据。
metrics.py:计算对话的评价量度,比如对排名的量度等。
params.py:用 argparse 来为 ParlAI 解释命令行 argument。
thread_utils.py:用于 Hogwild 多线程(多重处理)的工具类/函数。
SharedTable:提供一个锁保护、记忆分享、类字典的用于追踪度量的的界面。
worlds.py:包含了一套用于内部开展任务的基本 world。
World:所有 world 的基本类,实现了 parley,shutdown,__enter__,和__exit__。
DialogPartnerWorld:用于双 agent 回合交流的默认 world。
MultiAgentDialogWorld:用于两到多个 agent 的循环(round-robin)回合 agent 交流。
HogwildWorld:当使用多线程(多重处理)时。这是用于设置一个对每个线程而言分别独立的 world 的默认 world。
Agents 目录
agents 目录包含了已被认可进入 ParlAI 框架用于分享的 agent。目前有这些可用的目录:
drqa:这是一个很周全的 LSTM 模型,它叫「DrQA」(问答博士,论文地址:https://arxiv.org/abs/1704.00051)。它用 PyTorch 框架实现,在 SQuAD 数据集上,它得到的结果相比其它模型更具竞争力。
memnn:它是在 Lua Torch 中用于端到端记忆网络的代码。
remote_agent:连接 ZMQ 的任意 agent 的基本类(memnn_luatorch_cpu 就使用这个)。
ir_baseline:简单的信息检索基准(baseline),它用 TFIDF-权重匹配为候选者的反馈评分。
repeat_label:仅重复(repeating)发送给它的所有数据的基本类(如连接(piping)到一个文件、调试)。
实例
这个目录包含了部分基本循环的具体例子。
base_train.py:一个非常简单的例子,展示了一个使用默认 Agent 亲本类的训练/验证循环的轮廓。
display_data.py:使用 agent.repeat_label 来显示来命令行给出的特定任务的数据。
display_model.py:显示对一个给定模型在命令行给出的特定任务之上的预测。
eval_model.py:使用命名后的 agent 来计算一个命令行给出的特定任务的评价量度(evaluation metric)数据。
build_dict.py:使用 core.dict.DictionaryAgent 建立一个来自命令行给出的特定任务的 dictionary。
memnn_luatorch_cpu:展示了一些在几个数据集上训练端到端记忆网络的例子。
drqa:展示了如何在 SQuAD 训练集上训练一个周全的 LSTM「DrQA」模型(论文地址:https://arxiv.org/abs/1704.00051)。
任务
这个第一版本支持超过 20 种任务,包括 SQuAD、bAbI tasks、MCTest、WikiQA、WebQuestions、SimpleQuestions、WikiMovies、QACNN、QADailyMail、CBT、BookTest、bAbI Dialog tasks、Ubuntu、OpenSubtitles、Cornell Movie 和 VQA-COCO2014 等流行的数据集。
我们的第一版包含以下数据集,见下图左栏;获取它们也非常简单,只需在命令行的选项中指定对应任务的名称即可,如右栏的数据集展示实用程序所示。查阅当前完整任务列表请访问:https://github.com/facebookresearch/ParlAI/blob/master/parlai/tasks/task_list.py
loading...
在 ParlAI 中选择一个任务非常简单,只需要在命令行中指定它既可,如上图(右)所示。如果该数据集之前没有被使用过,那 ParlAI 将会自动下载它。因为在 ParlAI 中,所有的数据集的处理方式都是一样的(使用单个对话 API),所以原则上一个对话代理可以在这些数据集之间切换训练和测试。还不止于此,你可以简单地通过提供一个逗号分隔的列表来一次性指定许多任务(多任务),比如命令「-t babi,squad」可以使用这两个数据集,甚至还可以使用「-t #qa」命令一次性指定所有的 QA 数据集或使用「-t #all」一次性指定 ParlAI 中的每一个任务。我们的目标是使其可以轻松地创建和评估非常丰富的对话模型。
每个任务文件夹包含:
build.py 文件,用于设置任务的数据(下载数据等,仅在第一次请求时完成,如果某个任务从未被使用,那么就不会下载它)。
agents.py 文件,包含了默认的或特定的教师(teacher)类别,可被 core.create_task 用来从命令行参数上实例化这些类别(如有需要)。
worlds.py 文件,是可选的,可用于需要定义新环境或复杂环境的任务。
要添加你自己的任务:
(可选)实现 build.py 以下载任何所需的数据
实现 agents.py,至少包含一个 DefaultTeacher(扩展 Teacher 或它的一个衍生)
如果你的数据是 FB Dialog 格式的,那么属于 FbDialogTeacher 类别
如果不是 FB Dialog 格式:
如果你的数据是基于文本的,你可以使用扩展的 DialogTeacher,并因此要使用 core.data.TextData,在这种情况下,你仅需要编写你自己的 setup_data 函数,其可根据在 core.data 中所描述的格式而在数据之上提供一个 iterable.
如果你的数据使用了其它字段,那么就要编写你自己的 act() 方法,其提供了当你的任务每次被调用时的观察。
MTurk
ParlAI 的一个重要方面是与 Mechanical Turk 的无缝集成,可用于数据收集、训练和评估。在 ParlAI 中,人类 Turker 也被视为代理(agent),因此在一个标准的框架中可以进行人-人、人-bot、多人和多 bot 群聊等形式的对话,也可以按照需求切换角色,而无需对代理的代码进行修改。这是因为 Turker 也可以使用观察/动作(observation/action)词典中的字段来通过同样接口的一个版本进行接收和发送。我们在这第一版中提供了两个示例——收集数据和人类对 bot 的评估。
loading...
mturk 库包含以下目录和文件:
core:该目录包含了设置支持 MTurk 聊天接口的 AWS 后端的核心代码,以及用于 HIT 创建和许可的代码。
tasks:该目录包含了两个第一版提供的示例 MTurk 任务。
qa_data_collection:从 Turker 获取问题和答案,给出了 SQuAD 的一个随机段落
model_evaluator:在 Reddit 电影对话日志数据集上评估该信息检索基线模型
run_mturk.py:用于调用 mturk 核心代码的文件,包含用户指定的任务模块、对话日志模型代理、HIT 的数量和每个 HIT 的回报。
运行示例 MTurk 任务和代理:
在 run_mturk.py 中,去掉任务模块和你想使用的代理类别的注释
对于 create_hits 方法,如有需要,改变 num_hits 和 hit_reward。如果你想仅在 MTurk 沙箱中运行该样本,那么就将 is_sandbox 设置为 True;如果设置为 False,则就可让 Turker 来处理这个工作并得到报酬。
运行 python run_mturk.py
添加你自己的 MTurk 任务和对话模型:
在 mturk/tasks 目录为你自己的任务创建一个新的文件夹
部署 task_config.py,至少在 task_config 目录中包含以下字段:
hit_title:关于该 HIT 包含的任务类型的一个短的描述性标题。在 Amazon Mechanical Turk 网站上,该 HIT 标题以搜索结果的形式呈现,并且出现在该 HIT 被提及的任何地方。
hit_description:一个 description(描述)包含了该 HIT 所包含的任务类型的详细信息。在 Amazon Mechanical Turk 网站上,该 HIT 描述出现在搜索结果的扩展视图中,并且也会出现在该 HIT 和分配(assignment)屏幕上。
hit_keywords:描述该 HIT 的一个或多个词或短语,用逗号隔开。在 Amazon Mechanical Turk 网站上,这些词被用于搜索 HIT。
worker_agent_id:一个指示 Turker 在对话中的作用的短名字
task_description:一个详细的任务描述,将会出现在 HIT 任务预览页面,并会显示在聊天页面的左侧。支持 HTML 格式。
实现 agents.py,至少有一个从 Agent 扩展的代理类别。
编写你自己的 __init__() 方法以打包你的对话模型代理(具体示例可见 mturk/tasks/model_evaluator/agents.py 文件)。
编写你自己的 act() 方法,其会返回你的对话模型的响应,以及有助于 Turker 了解接下来应该做的事情的帮助文本。
在 run_mturk.py 文件中导入你的任务模块和代理类别,然后运行 python run_mturk.py
团队
ParlAI 目前由 Alexander H. Miller、Will Feng 和 Jason Weston 维护。其他主要贡献者还包括(不完整列表):Adam Fisch、Jiasen Lu、Antoine Bordes、Devi Parikh 和 Dhruv Batra。
证书
ParlAI 采用 BSD 授权。我们也提供了额外的专利授权。

金准数据分享:证监会IPO审核全流程

近期,关于IPO审核“内部标准”的三大传闻在市场上流传,引发种种猜测。昨日,上海证券报记者向证监会相关部门人士求证获悉,这些传闻均与事实不符。IPO审核过程中,对拟上市企业财务门槛和辅导期的要求均无变化,除去年以来对类金融企业融资作出限制以外,证监会并未对不同行业企业作出特别的IPO限制。


澄清!


IPO审核“内部标准”三大传闻与事实不符


近期,关于IPO审核“内部标准”的三大传闻在市场上流传,这个传闻是这么说的:


第一,企业上市辅导后要地方证监局验收合格才能报材料,意味着没有辅导的公司,要至少18个月才能报材料,所有公司一视同仁;


第二,把创业板年盈利3,000万元、主板和中小板年盈利5,000万元作为报材料的基本条件;


第三,影视、传媒、娱乐(含游戏)、文化和互联网企业,原则上劝退。


就此,上海证券报记者向证监会相关部门人士进行了求证,据其澄清,这些传闻均与事实不符。


目前,在发行审核过程中,对拟上市企业财务门槛的要求、上市辅导期的要求均无变化,除去年以来对类金融企业融资作出限制以外,证监会并未对不同行业企业作出特别的IPO限制。


了解到,新股发行正在按照受理顺序、流程,依据相关法律法规明确规定的发行上市条件进行正常审核,依据相关指引,部分行业由于具有一定特殊性(如金融行业)而需要在统一要求的基础上执行特殊的信息披露标准,但发行上市门槛都是统一的。


证监会最新审核环境及审核要点分析