• 项目
首页>>文章列表 >>金融科技
文章列表

CVPR最强总结:5位主席21篇论文,最关注数据

企业关系主席:韩玫(Mei Han)


韩玫是谷歌研究科学家。她已发表超过30篇有关视频分析、视觉跟踪、物体检测、几何建模、图像处理、计算机视觉、多媒体处理以及计算机图形学的会议论文。加入谷歌之前,韩玫曾是美国NEC实验室研究员。韩玫本科、硕士、博士毕业于清华大学计算机科学与技术专业,并于2001年获得卡内基梅隆大学机器人学博士学位。


领域主席:Alexander Toshev, 刘策(Ce Liu), Vittorio Ferrari, David Lowe


我们重点关注谷歌这本届CVPR 所发表的论文:


根据谷歌官方的数据,这次 CVPR 2017 共有 21 篇文章被接收。这些论文覆盖的方向也很广,从技术到应用到理论都有。其中,讨论最多的是数据相关的内容,包括推出带有边界框的 YouTube 视频数据集,以及通过半监督和无监督的方法利用没有人工标记的数据。


应用方面,图说生成、视频摘要(总结)、人脸识别、野外多人姿态估计都有论文入选。此前新智元曾经报道过的全分辨率图像压缩,也是谷歌在今年 CVPR 的一个重点。


《现代卷积物体识别方法在速度和精度方面的权衡比较》可以算理论研究。



论文列表



使用点击监督学习训练物体识别检测器

Training object class detectors with click supervision

Dim Papadopoulos, Jasper Uijlings, Frank Keller, Vittorio Ferrari


使用对抗生成网络进行像素级的无监督领域适应

Unsupervised Pixel-Level Domain Adaptation With Generative Adversarial Networks

Konstantinos Bousmalis, Nathan Silberman, David Dohan, Dumitru Erhan, Dilip Krishnan


BranchOut:用于在线聚合追踪的卷积神经网络的正则化技术

BranchOut: Regularization for Online Ensemble Tracking With Convolutional Neural Networks 

Bohyung Han, Jack Sim, Hartwig Adam 


通过视觉-语言嵌入提升视频内容总结

Enhancing Video Summarization via Vision-Language Embedding

Bryan A. Plummer, Matthew Brown, Svetlana Lazebnik


通过联想进行学习—训练神经网络的多用途的半监督方法

Learning by Association—A Versatile Semi-Supervised Training Method for Neural Networks 

Philip Haeusser, Alexander Mordvintsev, Daniel Cremers


使用上下文无关的监督学习生成适合上下文的图说

Context-Aware Captions From Context-Agnostic Supervision

Ramakrishna Vedantam, Samy Bengio, Kevin Murphy, Devi Parikh, Gal Chechik


残差网络的空间适应计算时间

Spatially Adaptive Computation Time for Residual Networks

Michael Figurnov, Maxwell D. Collins, Yukun Zhu, Li Zhang, Jonathan Huang, Dmitry Vetrov, Ruslan Salakhutdinov


Xception:使用在宽度上相互独立的卷积进行深度学习

Xception: Deep Learning With Depthwise Separable Convolutions

François Chollet


通过设施定位进行深度指标学习

Deep Metric Learning via Facility Location

Hyun Oh Song, Stefanie Jegelka, Vivek Rathod, Kevin Murphy


现代卷积物体识别方法在速度和精度方面的权衡比较

Speed/Accuracy Trade-Offs for Modern Convolutional Object Detectors

Jonathan Huang, Vivek Rathod, Chen Sun, Menglong Zhu, Anoop Korattikara, Alireza Fathi, Ian Fischer, Zbigniew Wojna, Yang Song, Sergio Guadarrama, Kevin Murphy


使用面部等同特征合成正则化人脸

Synthesizing Normalized Faces From Facial Identity Features

Forrester Cole, David Belanger, Dilip Krishnan, Aaron Sarna, Inbar Mosseri, William T. Freeman


野外多人姿态精确估计

Towards Accurate Multi-Person Pose Estimation in the Wild

George Papandreou, Tyler Zhu, Nori Kanazawa, Alexander Toshev, Jonathan Tompson, Chris Bregler, Kevin Murphy


看!通过多模式对话发现物体

GuessWhat?! Visual Object Discovery Through Multi-Modal Dialogue

Harm de Vries, Florian Strub, Sarath Chandar, Olivier Pietquin, Hugo Larochelle, Aaron Courville


学习辨别和变换协变局部特征检测器

Learning discriminative and transformation covariant local feature detectors

Xu Zhang, Felix X. Yu, Svebor Karaman, Shih-Fu Chang


使用 RNN 进行全分辨率图像压缩

Full Resolution Image Compression With Recurrent Neural Networks

George Toderici, Damien Vincent, Nick Johnston, Sung Jin Hwang, David Minnen, Joel Shor, Michele Covell


通过最小限度的监督,从大规模噪音数据集中学习

Learning From Noisy Large-Scale Datasets With Minimal Supervision

Andreas Veit, Neil Alldrin, Gal Chechik, Ivan Krasin, Abhinav Gupta, Serge Belongie


视频宽度和自运动无监督学习

Unsupervised Learning of Depth and Ego-Motion From Video

Tinghui Zhou, Matthew Brown, Noah Snavely, David G. Lowe 


视觉导航的认知映射和规划

Cognitive Mapping and Planning for Visual Navigation

Saurabh Gupta, James Davidson, Sergey Levine, Rahul Sukthankar, Jitendra Malik


快速傅里叶色彩常数

Fast Fourier Color Constancy

Jonathan T. Barron, Yun-Ta Tsai


论可见水印的有效性

On the Effectiveness of Visible Watermarks

Tali Dekel, Michael Rubinstein, Ce Liu, William T. Freeman


YouTube边界框:用于视频物体检测的大规模高精度人为注释数据集YouTube-BoundingBoxes: A Large High-Precision Human-Annotated Data Set for Object Detection in Video

Esteban Real, Jonathon Shlens, Stefano Mazzocchi, Xin Pan, Vincent Vanhoucke



部分论文介绍



使用点击监督学习训练物体识别检测器



摘要


训练物体类别检测器(object class detector)通常需要大量属于同一类别的图像,而且这些图像中的物体要有边界框注释。但是,手动绘制边界框非常耗时。在本文中,我们通过提出中心点击注释(center-click annotation),大大减少了注释时间:先构建一个紧密包围物体实例的虚构边界框,再让注释器点击这个边界框的中心。然后,将这些点击合并到现有的用于弱监督物体定位的多实例学习技术(Multiple Instance Learning)中,从而在所有训练图像上共同定位对象边界框。


我们在 PASCAL VOC 2007 和 MS COCO 上进行了大量实验,并表明:(1)新方案提供了一个高质量的检测器,性能不仅远优于弱监控技术产生的检测器,还进行了额外的注释工作;(2)这些检测器绘制的边界框与人工绘制的边界框十分接近;(3)新方案将总的注释时间缩短了 9 倍到 18 倍。



使用生成对抗网络进行无监督像素级的领域适应


摘要


使用带有精心注释的图像数据集来训练现代机器学习算法,对于许多任务来说都是非常昂贵的。一个很有吸引力的替代方案是渲染合成数据,其中 ground-truth 注释会自动生成。不幸的是,纯粹在渲染图像上进行训练的模型通常不能推广到真实图像。为了解决这个缺点,此前有研究引入无监管的领域自适应算法,尝试在两个域之间映射表示,或者学习提取不变的特征。在这项工作中,我们提出了一种新的方法,以无监督的方式学习实现从一个域到另一个域在像素空间上的转换。我们基于生成对抗网络(GAN)的模型能够适应源域映像,就像从目标域中绘制的一样。我们的方法不仅产生了合理的样本,而且在一些无监督的域适应场景中也远远胜过最先进的技术。最后,我们展示了适应过程生成了在训练过程中没有见过的物体类别。


通过视觉-语言嵌入提升视频内容总结




摘要


本文解决视频摘要的问题,也就是将原始视频转换为较短的形式,同时保持原始故事不变。我们表明,以自由形式语言监督的视觉表示非常适用于这种应用。我们对两个不同的数据集——UT Egocentric 和 TV Episodes 进行评估,并且表明,与标准视觉特征相比,我们的新目标改进了总结性能。实验还表明,视觉语言嵌入不需要对领域特定数据进行训练,可以从标准静态图像视觉语言数据集中学习并转移到视频。我们的模型的另一个好处是,能够在测试时间引导使用自由格式文本输入的摘要,从而允许用户定制。



通过联想进行学习—训练神经网络的多用途半监督方法


摘要


在许多现实世界场景中,用于特定机器学习任务的标记数据获取成本很高。半监督训练方法利用大量可用的未标记数据和较少量的标记样本相结合的数据。我们提出了一个新的框架,用于深度神经网络的半监督训练,这种方法受人类学习的启发。将已标记的样本嵌入到未标记的样本中生成“联想”。作者设计了优化函数,鼓励正确的联想(从一个物体类别开始,在训练周期结束后终于同一个物体类别),惩罚那些错误的关联(在训练结束后,被归于不同类别的数据)。该实现易于使用,可以添加到任何现有的端到端训练设置中。我们展示了通过联想在多个数据集上学习的功能,并表明可以通过使用附加的未标记数据来极大地提高分类任务的性能。特别是对于几乎没有标记数据的情况,我们的训练计划胜过SVHN 的现有最佳技术水平。

高盛预测比特币将很快再次触及3000美元

央行今日公开市场净投放2200亿元 创五周以来新高

美元持续下挫金价企稳 投机者六周来首度净增持黄金

最新持仓数据显示,投机者和对冲基金六周来首次净增持黄金多头合约,金价企稳反弹之际,聪明钱押注美联储可能暂缓加息步伐。

美国商品期货交易委员会(CFTC)上周五公布数据显示,在截至上周二(7月18日)一周内,对冲基金和投机者持有的黄金多头合约增加5,297份,空头合约增加了3,577份,令黄金净多头合约增加了约2,000份,达到29,000份水平。


这是自6月6日当周来,投机者首次净增持黄金多头合约。在CFTC数据报告期内,金价上涨3%,站上了1240美元关口。截止周一亚洲早盘,现货黄金维持在1255美元上方,创下自6月3日以来最高,突破了50日均线。

不过从多空力量对比来看,投机者对黄金后续走势分歧依然严重。空头仓位占比为43.66% ,为2016年1月以来最高。


从趋势看,目前29,000份合约净多仓水平,远低于3月份时的高位,处于历史平均水平下方。


白银方面,投机者增持了白银净空仓。COMEX白银投机净空头头寸增加1053份,至净空6455份,为近两年以来最高的净空水平。之前一周白银净头寸转为净空,为2015年8月以来首次转为净看跌立场。


美联储7月会议前美元仓位转为净空

北京时间本周四凌晨,美联储FOMC利率决议公布,耶伦随后将举行记者会。美联储利率决议将决定金价反弹后下一步走势。

市场对7月加息预期极低(债券市场显示仅为3.1%)。投资者关注的是美联储对通胀、海外环境和缩表计划的措辞上是否出现变化。

此外,FOMC决议公布之前一周,美元投机性持仓转为净空,这是过去一年来美国持仓首次变为净空。

在欧元持续反弹压力下,上周美元指数跌破了94.0关口,创下了13周最低。美元持续走低助推了金价这一轮反弹。

瑞穗的外汇策略师Sireen Harajli认为:

“美国经济复苏面对很多不确定性,主要是由于经济数据表现普遍较弱,新政府政策举措的不确定性增高,这都是美元表现消极的原因。”

融创继续大涨近8% 孙宏斌昨日微博“不用过度担心 我们知进退”

“泡沫”越来越小?创业板指估值即将首次低于纳指

创业板估值进一步探底。

新浪援引媒体数据称,创业板指基于已公布业绩的市盈率目前为36.2倍,略高于纳斯达克综指的34.3倍,二者之差缩窄至2010年启动创业板指以来的最低水平。

信息技术行业占比较高的创业板指,构成与美国纳斯达克指数类似,因此二者的市盈率也常常被市场拿来比较。

上周一创业板大跌5.11%后,四连阳上涨超2%,但今日再度下挫。创业板今日低开低走,现跌0.35%,早间跌幅一度至0.91%。

今年以来,创业板累跌约14.57%,同期纳指上涨17.66%。


创业板估值不断探底

整体净利润增速下滑,再加上并购并表减少,招商证券指出,2018年创业板业绩将会回落至个位数。

而全国金融工作会议还强调了直接融资的重要性,如果IPO相对有所加速,创业板存量股票的估值还将会被市场向下调整。


相比2015年5月133倍的市盈率,创业板的估值目前的确出现了显著回落,而且接近了底部。

同时,从个股市盈率来看,截至7月23日,超过200只创业板个股动态市盈率仍在200倍以上。再加上下半年并购重组监管、金融去杠杆的力度有望延续,创业板后市的走势仍然不容乐观。

年初以来,创业板指累跌15%,成为全球表现最差的市场。


创业板,是去是留?

华尔街见闻此前曾提到,警惕创业板的“戴维斯双杀”,即每股净利润大幅崩盘带来市盈率下调,二者给股价带来双重打击,导致下跌进一步扩大。(详见:《理解创业板崩盘的简单逻辑:戴维斯双杀》)

而创业板的估值的确是在不断向下调整。不过,部分个股依旧有机会。

相对于沪深两市其他板块乃至全球股指,创业板估值依然高企。中投证券指出,在创业板普遍 PE(TTM)估值偏高的局面下,成长速度足够快的估值业绩匹配的“真成长”个股依旧能获得资金的青睐

国开证券则认为,在创业板估值回归过程中,必然也有一些优质公司受到指数下跌因素影响导致股价低于其长期投资价值,对投资者来说就是沙里淘金的过程。

一些具备持续性业绩增长的品种,在(2017预期)PE跌到30倍以下,PEG低于0.5的情况下,值得密切关注。

人工智能再造金融业,23岁的同花顺准备做什么新生意?

《国务院关于印发新一代人工智能发展规划的通知》发布后,在智能金融布局多年的同花顺再次成为资本市场关注的焦点。

招商证券在之前发布的研报将同花顺称为“卓著成长的典范”,他们预计同花顺会在今明两年创造15亿和18.75亿元的利润。类似的研报也对同花顺的超预期因素予以肯定,券商们开始期待同花顺能通过人工智能摆脱与自身绑定的金融市场周期。


借助国内股票市场的繁荣,同花顺在过去两年的业绩实现了惊人增长。在这之前,同花顺推出了i问财和iFinD两款镶嵌人工智能技术的产品,和泰达宏利发行了一支大数据基金。

不过提早布局并不意味着高枕无忧,亦敌亦友的券商也对新蓝海虎视眈眈,一些大型券商已经开始对同花顺超过3500万的月活跃用户有所行动。在券商之外,蚂蚁金服、京东金融这样的科技公司和传统的金融机构也在加紧规划,这些环伺群狼绝非老对手大智慧和东方财富能比拟。


技术能力强,运营不尽人意?

“同花顺的定位还是平台,平台的作用就是为用户提供更好的服务。不存在侧重点或者哪个更重要,股票行情交易是同花顺最基础的业务,但是基金代销、人工智能也是新的增长点,当然也重要。”同花顺内部一位不愿具名的相关业务负责人告诉全天候科技。作为行业中技术研发投入比较大的公司,同花顺选择了与东方财富不一样的发展策略,在不断扩大数据业务规模和流量变现的过程中,第三方金融服务机构的思路也逐渐清晰。

不吝成本的研发投入是同花顺业内看好的重要原因,其研发投入和研发人员占比一度达到44.86%和42.20%。在这个过程中,同花顺也开始从流量型平台向技术性平台转型——他们在2015年年报中提出,公司计划以云计算、金融大数据为支撑,构建金融财经知识图谱,采用语义分析、自然语言理解、语音识别等技术,着力开发人工智能产品,改善人机交互的模式,以最快的速度响应投资者的提问,帮助其进行投资决策。


2013年,同花顺推出了面向个人投资者的投顾产品i问财,这款产品以财经类垂直领域搜索作为入口,包含智能选股、投资策略和策略回测等功能。与从门户到搜索引擎的信息获取方式的进化不同,自然语言语义的识别在其中扮演着重要角色,它用来把非结构化的数据(研报、公告、新闻等)整理和分析后,结构化地展示给用户。

“同花顺的产品还是业界领先的,尤其是技术和数据储备是绝对领先,券商行业的AI一定是以海量数据为基础的,包括舆论、用户行为这些数据,这方面同花顺是第一梯队。”青石(新西兰)证券公司机构业务负责人杨亿成告诉全天候科技。

i问财一直被作为同花顺人工智能规划的核心,但在过去几年时间里,i问财的运营效果却不尽人意,其官方微博在去年年初便停止更新,量化策略的数量也相当有限,低于行业大部分量化策略平台。除了网站引流,同花顺并没有给i问财做太多广告。


他们的另一款产品iFind也遇到了增长瓶颈,它的对标产品Wind在机构客户市场中的份额超过90%。在相当长的时间里,iFind和东方财富Choice都在通过低价策略与万得进行竞争,但效果并不明显。上述负责人表态称同花顺会在iFind中添加更多基于人工智能的服务,最终与万得形成差异化竞争。“比如产业链上的细节数据就是iFind的一个特色,我在上面检索汽车,相关零部件厂商是什么情况都能展现出来,这背后也是人工智能技术。”

“同花顺股价的上涨更多和政策、概念有关系,并不能作为其资产确实有如市场所表现的价值的证据,研报也不能盲目相信。”杨亿成说。也有业内人士称,A股市场和人工智能挂钩的公司并不多,言AI必称同花顺也很正常。这股热潮更多体现在一级市场——前不久,人工智能公司商汤科技的4.1亿美元B轮融资创造了新的纪录。


新用户比新产品更重要

同花顺并不期待人工智能新业务能在短时间内为公司带来利润,行情交易服务依然是他们主要的利润来源,不过股市的低迷确实影响了他们的收入。在半年度业绩预告中,同花顺提到,投资者对金融资讯信息服务的需求有所下降导致净利润会比上年同期下降0——30%。

同一时间,同花顺与券商长久以来的合作关系开始出现了不确定的预期。六月底,方正证券正式终止了与同花顺在开户和交易上的合作,这一举措被理解为不甘沦为通道的大型券商对第三方平台发起的反击。

“去同花顺是早晚的事情。但这个过程需要技术投入,技术在自己手里,才能掌握客户数据和具备场景延展性。还要看各家引流的能力,这些都不具备的话,就只能跟同花顺合作,做一个底层的交易通道。”资深金融从业者费乐此前接受全天候科技采访时表示。在新业务立足未稳的情况下,同花顺显然不希望看到券商陆续撤离,继而导致用户分流。

“券商对同花顺肯定是又爱又恨的,但这里面不会有分流的情况。”上述负责人说。他认为并不存在用户在券商的App和同花顺之间二选一的问题,“用户可以换一家券商开户,或者在同花顺上看行情和咨询,在券商App上交易。在用户体验上同花顺做的还是比券商要好的。”


他认为市场总量依然在增长,他表示同花顺的新增用户依然可观。但对业界期待的“摆脱周期对业绩的影响”,这名负责人不置可否。

“AI代替人工变成金融业的重要生产力是毋庸置疑的,但想要用AI科技去摆脱由货币、信贷政策和利率主导的经济周期不太现实。” 杨亿成说。在2011年至2013年这段行情较低迷的时间里,同花顺、东方财富、大智慧的净利润下滑均超过60%。而在2015年的牛市中,同花顺的增值电信业务实现了300%的增长,广告业务也成倍增长。

同花顺的布局也意在在股市低迷的情况下依然粘住用户,一些数据显示,在市场降温、证券财经网站访问量下降的时候,i问财的访问量依旧在上升,人们对智能投顾类产品的关注有增无减。

股民们的热情对同花顺来说也许是个好消息,2011年初到到2016年末,持股10万元以上各层次的账户比例均上升超过一倍,在这期间,还出现了持股一亿元以上的超级大户。在机构客户方面,证券从业人员的数量也在增长,2016年,中国上市证券公司员工数达到了18万,这为iFind改变市场份额提供了机遇,一些观点认为,类似的因素在一定程度上抵消市场周期对同花顺业绩的影响。

目前,基金代销、券商导流、广告投放和贵金属交易依然是同花顺最重要的利润来源,但这一切都依托于平台上的巨额流量。在同花顺内部看来,他们也认为比起开拓新市场,拉新和留存对同花顺更加重要,但他并不愿意透露具体的战略规划。


比起AI炒股,大数据基金是更好的方向

无论是i问财,还是其他人工智能产品,同花顺目前的思路还停留在结构化能力和便利投资行为的水平。同花顺之前发布了面向高端市场的投资机器人产品“金融大师”,用人工智能来预测大盘涨跌并提供操作建议。不过在行业内,尽管大家看好人工智能的发展,但对AI炒股大多持鄙视态度。

“AI选股在A股可能会获得比较亮眼的回测成绩,但很难长期稳定获利,尤其是中国相对高利率环境,AI收益率惨不忍睹,这可能会导致散户尝鲜之后就放弃了。”杨亿成说,“就算是券商内部,更智能的方向可能也不是交易决策,而是云服务、柜台层级的交易系统这样的产品。从目前的应用来看,除了事件驱动的套利/类套利策略因为有高度的重复性,所以人工参与量很低,股票对冲类还是需要人来管理。”

行业内的共识是,人工智能不会代替人来做决策。市场上已经出现了泡沫的迹象,比如一些公司将代销的基金打包成智能投顾产品,从而变相增加销售渠道。

“未来一段时间里,人工智能能做的还是信息的处理,代替人的重复劳动,比如公告的数据提取。现在要让AI代替人是一种不合理的假设。”金融科技资深从业者、文因互联的创始人鲍捷告诉全天候科技,“一些公司还是严重低估了人工智能的研发投入,不是一次两次的投入就可以出成果。”


同花顺与泰达宏利基金在2016年2月发行的大数据基金被认为是一个可以在未来大规模复制的创新业务,这支基金通过分析同花顺提供的超过2亿股民的多种投资行为大数据,以量化投资方式挑选个股。截至2016年12月31日,产品净值达1.173,成立以来累计收益率17.3%,领先沪深300指数11.2个百分点。在天风证券的报告中,他们称“从价格走势上来看,泰达宏利同顺大数据跑赢市场,获得客观的超额正收益。伴随着“量化”时代的到来,量化基金持续跑赢主动管理型基金,同花顺的大数据服务有望迅速铺开。”

除了原有的竞争对手东方财富和大智慧,科技公司、小型创业公司与传统的金融公司也在分食蛋糕。不过同花顺本身似乎并不认为同花顺的竞争对手会是券商或者蚂蚁金服这样的公司,“最怕的是非常小的公司突然冒出来,在某个业务上很有优势。”上述负责人说。


监管也许是最后一个问题,在中国,金融科技公司面对的监管难题往往要大过技术问题。针对市场上智能投顾已涉及的资管问题,监管部门已开始行动。

该负责人对此的表态是同花顺作为平台,不会涉及资产配置业务,不会有监管的风险。

“中国的监管思路更倾向于行为监管和金融消费者保护,对创新的态度也不算苛刻。智能投顾到后面应该会增加资管类的准入要求,但是现在产品形态变化还非常快,没有哪款产品能成为公认的、未来的方向。” 杨亿成说。