• 项目
首页>>文章列表 >>金融科技
文章列表

如何有效利用学术图谱?怎么建立相对公正的学术评价体系?

由中国计算机学会(CCF)主办,福州市人民政府、福州大学承办,福建师范大学、福建工程学院协办的 2017 中国计算机大会(CNCC 2017)于 10.26—10.28 日在福州·海峡国际会展中心举办。

此次会议规模空前,会议主办方邀请了包括丘成桐、沈向洋、李飞飞、丛京生在内的学界、业界知名人物,这次大会除了14场非常值得关注的特邀报告,还有2场大会主题论坛、40余场学术论坛、30余场特色活动以及3个颁奖大会,同期还将有80余家企业举办科技成果展。AI科技评论作为独家战略合作媒体对大会内容进行了全程覆盖和报道。

如何建立相对公正合理的学术评价体系,这是在人工智能研究飞速发展的今天被国际学术界高度关注的话题。在 CNCC 2017《大数据驱动下的学术评价》技术论坛上,邀请到CCF 术语工委会主任周明,上海交通大学教授王新兵,中国工程院院士高文,北京大学教授金芝,微软研究院研究员王冠三共聚于此,探讨如何构建大规模异构学术图谱,有效利用图谱为广大学者服务,为学术评价和社会发展服务。此次论坛由清华大学副教授唐杰、微软亚洲研究院李锐博士主持,在panel讨论环节,还邀请到南京大学教授周志华、中科院计算所研究员陈熙霖。

从左至右依次为清华大学副教授唐杰、北京大学教授金芝、南京大学教授周志华、微软研究院研究员王冠三、中科院计算所研究员陈熙霖、上海交通大学教授王新兵、微软亚洲研究院李锐博士

作为第一位嘉宾,周明在论坛中介绍了CCF术语工作委员会,并详述了术语工作委员会中的分工。为了更好的进行术语工作,他们构建了三级火箭,第一级是专家火箭,这一级火箭主要涵盖的是之前一些专家的研究工作。下一级是网络火箭,其中包括新词挖掘,词义挖掘,合并、择优等,第三级是众包火箭,这一级会鼓励网友贡献新词条并审核编纂词条内容,为术语工作委员会做出贡献。

为什么会构造这样的三级火箭?他表示,专家火箭可能存在词条老旧的问题,这时候网络火箭就出现了,可以增加新的词条,例如AlphaGo等,但是又出现了新的问题,比如分类体系不一致,要进行很多调整,另外在增加新词条的时候,必须要通过人工甄别断定分类,还有如何将网络上的简繁体文本对应起来。总体来说,网上找的资源良莠不齐,格式多样,无法用自动化手段去做,必须靠众包去做。

专家火箭和网络火箭目前进展顺利,众包火箭现在发展也不错。他们在做这件事的时候会有激励机制,为大家设计了不同的头衔以表彰其对计算机术语工作做出的贡献。大家可以基于他们的术语工作,做搜索、问答等各种各样的研究。

接下来,王新兵教授介绍了他们在学术地图上的一些研究。他表示,目前的数据量很大,要从数据中挖掘出某位老师或者学生的研究水平,需要进行多方面的考虑。他也提到如何将论文之间的关系联系起来,有什么好的做法,为实现这些目标有哪些核心的考虑。

在论坛中,他为大家详解了他们做的一些图。他们现在做的分析有挖掘论文之间的相关性,挖掘出某个领域比较重要的研究人员,以及谁在那个领域成长比较快,影响力比较大,挖掘某些研究的地理核心区域。在进行核心区域的研究中,也能看到中国在过去二十年间取得的发展。他还举例分析了几个重要会议(SIGMOD和SIGIR、CVPR和ICCV、AES和OOPSLA)之间的交叉和联系。

他们的愿景是希望能通过数据分析来帮助大家,例如根据文章之间的关联性,进行文章推荐,或者进行关联的作者推荐。

随之而来的是高文院士的精彩演讲,他谈到最近讨论比较多的双一流建设,这个排名请了许多知名的专家来评价、讨论、制定规则,然后让机器去计算,但网上有很多对这个排名的调侃和不满。他表示,通过专家制定规则,然后再用提交的数据进行排序的方法,里面有些值得改进的地方。“用大数据做学术评价,很多时候能不能得奖和你的数据的公开程度直接相关,如果在网上几乎查不到你的信息,很大可能得不到高分。”

此外,他也发表了对利用论文数量做学术评价的看法。“学术评价一定要有科学性在里面,纯粹的数论文一定不行,但是论文数有一定的参考性。如果没有其他可参考的,那么数量可能是主要参考的点。”

“以前评价学者的水平靠人的判断,现在数据正在慢慢发挥作用,亚洲学者也多起来了。”他说道,“从社会进步、学科发展、个人发展来说,我们应该逐步关注、整理和维护数据,另外也应该乐于分享数据。此外,不能为了追求数据而数据,要科学地使用、判断数据。”

而现场观众也进行了踊跃的提问,比如什么时候机器可以制定规则,自然基金委在基础研发投入方面的做法,如何看待最近《美国新闻和全球报道》排出的全球高校排名。

下一位演讲嘉宾是金芝教授。本次论坛的主题为大数据驱动下的学术评价,她对学术评价做了介绍,目前存在定性和定量两种评价方法,比较科学的方法是将定量与定性有机的结合起来,给出全面的评价。另外,在做评价时需要考虑多维性,要尊重不同的价值体系。论坛的另一个关键点是大数据,她介绍了亿级学术图谱Open Academic Graph,她表示,构建学术大数据的目的有三,一是集成丰富的学术知识数据,二是数据共享,三是服务共享。这些都非常有价值的,对于学术研究有很大的贡献。

在论坛中,她从窄义和广义上阐述了知识图谱的概念。而知件是计算机可操作性的知识模块,分为源数据层、策略层、表现层。关于知件她们也做了一些研究,在知件的基础上,如何进行模型驱动的知识抽取、知识的编排和演算,以及进行综合报告的深层化 ,这些都非常有意义。

在演讲的最后她提到,“我们希望在开放性学术知识图谱和可定制学术评价上,构建一个开放的学术评价社群。”

之后,王冠三先为大家描述了他认为的AI是什么,然后为大家描述了知识图谱的概念、包含哪些东西。他表示,他们之前在研究中让机器来读所有的论文,看机器是否能自己教会自己读取出需要抽取出来的信息等。

在对学者的排序过程中,对影响力的评估很重要。他们通过用不同的方法来进行排序,然后通过对结果来进行分析,来判断排序方法。目前有很多进行高校排名的方法,也出现了很多不同的名单,但并不是所有的方法都公平。他表示,他们用的是迭代算法来进行计算。在对学科进行评比的过程中,有些学校并不是每个小学科都能涵盖,这时候就需要选择有效的评比方法。另外,目前学术界每个月都会涌现出大量的论文,这时候就需要借助于机器。

最后,他也介绍到Open Academic Graph数据的使用方式,以及一些与它相关的技术手段,例如如何构建关系,将图画出来。

作为最后一位演讲的嘉宾,唐杰副教授先是总结了大家前面的演讲,然后介绍了开放学术组织(Open Academic Society),从理论研究、技术推广、国内国际合作等多个方面介绍了AMiner的总体情况,目前他们已经与多个机构合作成立了研究中心,包括与中国工程院合作成立了知识智能联合实验室,与微软合作成立数据研究院科技大数据研究中心等。

此外,他也提到了Open Academic Graph开放数据,他初步介绍了这个数据集的一些基本情况,除了论文数据,他们还发布了学者的相关信息、学者之间的关联信息、profile信息等。基于这些数据,他们还组织了一些数据挖掘比赛。

他表示,现在可以结合大数据、知识分析等,做出很多的学术地图画像,他为大家展示了他们做的人才迁徙图,可以看到国际上顶尖人才的迁徙路径。此外,基于那些学术大数据,他们还做了机构排名,也发布了CS领域最有影响力的学者排名。“大家要是有兴趣可以在这个数据上做非常多的工作,我们这个数据集完全开放。”

在最后panel讨论环节的嘉宾有金芝、周志华、王冠三、陈熙霖、王新兵,大家针对数据VS知识、大数据VS小数据、简单评价方法VS复杂评价方法等进行了精彩的讨论。

大摩:上调腾讯目标价至420港元 看好手游和广告两大引擎

摩根士丹利在最新报告中,维持对腾讯“增持”评级,并上调目标价从370港元至420港元,调升幅度为13.5%。截至发稿,腾讯股价报367.4港元。

今年以来,腾讯股价屡创新高,累计上涨93%,市值逼近3.5万亿港元。

大摩表示,腾讯当前市盈率约为34倍(相对于2018非GAAP每股收益预测值),其最新目标价中隐含的腾讯的市盈率为39倍,在历史波动范围内。

强劲的游戏收入和稳健的广告收入是大摩看多腾讯的主要理由。


 《王者荣耀》持续火爆 游戏收入有望再创新高

大摩预计,腾讯三季度游戏收入有望同比增长40%,其中手游收入预计将同比激增72%至170亿元人民币,创纪录新高。

腾讯旗下现象级游戏《王者荣耀》吸金能力不减,据移动应用数据分析公司Sensor Tower,王者荣耀通过iOS渠道收入在第三季度同比增加30%,较去年同期24%的增速进一步加快。

此外,《魂斗罗》、《穿越火线》等老款游戏也继续保持显著的增速,而一批新上线的游戏也表现不斐。

第三季度,在iOS系统上收入排名前20的游戏中,腾讯旗下游戏占据了8个,而在第二季度,这一数字还仅为5,这也意味着网易和腾讯在游戏业务上的差距进一步加大了。

今年底明年初,腾讯还有一批新的游戏计划上线,其中《王者荣耀》北美版《Arena of Valor》预计将于明年登陆,因此大摩对腾讯游戏业务前景表示乐观,预计2016年至2018年,腾讯手游收入复合年增长率约为48%。


广告业务贡献率预计上升至17%

大摩预计腾讯三季度广告收入同比增长50%至112亿元。

腾讯持续在高质量内容方面的投入有效促进了流量。今年第三季度,腾讯视频平均MAU(月度活跃用户)达到4.5亿人次, 腾讯新闻MAU达到2.1亿人次,平均日活时间同比增长6%。

大摩认为,随着微信功能继续扩展,未来朋友圈有潜力成为广告收入增长引擎之一。

在2014年时,广告收入在腾讯总收入中占比仅为11%。大摩预计,今年全年,广告业务的贡献率将上升至17%,并且预计该业务在2016年至2018年间将保持48%的惊人增速。

腾讯将于11月15日公布新一季财报。华尔街见闻此前提及,杰富瑞集团分析师Karen Chan预测,手游和数字内容的强劲增长将带动腾讯的整体营收,季度营收将同比增长54.6%至624亿元,非GAAP净利润将同比增长40.3%。

360借壳尘埃落定 多只概念股开盘涨停后跳水

华尔街见闻11月3日——周五,A股低开。沪指开盘报3377.74点,跌0.16%。深成指开盘报11287.55点,跌0.04%。创业板开盘报1843.80点,跌0.20%。

雅克科技、中信国安、天业股份、电广传媒等多只和360借壳上市相关个股开盘即涨停。消息面上,周四午夜,360借壳方案出炉,504亿元资产置入江南嘉捷。

但开盘后不久,中信国安等个股出现跳水,打开涨停板。

本周四晚,江南嘉捷电梯股份有限公司(股票代码601313、简称江南嘉捷)在上交所公告显示,通过重大资产出售、置换及增发股份,奇虎360公司CEO周鸿祎及其实际控制的两家天津公司将合计持有江南嘉捷63.7%的股权。

江南嘉捷公布的收购报告书摘要称,经各方协商,此次交易标的股权资产作价约504.2亿元,将向360全体股东非公开发行新股63.67亿股,支付拟置入和置换资产的差额合计约502.3亿元。

江南嘉捷公布的重组预案显示,该司拟将所有资产注入嘉捷机电,将嘉捷机电9.71%的股权转让给360全体股东,与其所持360股权的等值部分置换,这一拟置换资产作价1.82亿元。

待完成交易后,周鸿祎本人将持有江南嘉捷12.14%的股权,周鸿祎为实际控制人的天津奇信志成将持股占比48.74%,另一家周鸿祎实际控制的公司天津众信将持有2.82%。

江南嘉捷本周四晚还公告称,公司股票暂不复牌,在取得上交所审核意见、公司回复并及时履行相关信息披露义务后,再申请复牌。今年10月该司曾公告,自10月12日起继续停牌,预计停牌时间不超过两个月。

收评:沪指尾盘反弹跌0.36%周跌1.32% 两市周线均收阴

新浪财经11月3日——11月3日消息,沪深两市今日再度集体低开,延续整理态势,沪指跌破30日均线及5月以来的上升趋势线,创业板指数一度翻红,但随即转跌。午后三大股指进一步走弱,直到尾盘金融股护盘沪指才出现明显回抽。沪指本周下跌1.32%,吞噬了上周全部涨幅;创业板指数本周跌逾3%为三大股指表现最差。盘面上,芯片概念较为强势,360概念股则高开低走。截至收盘,沪指报3371.74,跌0.34%,深成指报11215.19,跌0.68%,创指报1832.97,跌0.79%。

    从盘面上看,芯片替代、石油开采、半导体居板块涨幅榜前列,钢铁、煤炭、租售同权居板块跌幅榜前列。


    热点板块:

    360借壳江南嘉捷回归A股的消息引爆相关概念股,但整体呈现高开低走的走势。天业股份、雅克科技涨停,电广传媒、中信国安开盘一字板涨停但随后打开,中南文化、浙江永强、爱尔眼科、北京君正等小幅上涨,三七互娱午后转跌。

    消息面:

    1、据生意社大宗榜数据显示,本月华东丙烯价格下调。月初华东丙烯出厂价格在8386元/吨左右,月末华东丙烯出厂价格在7773元/吨左右,本月下跌了7.31%。前期停车的东方华龙、万华、海伟等丙烯装置将陆续重启,丙烯供应量将增加。需求方面,整体下游需求量难有实质性改善。预计11月份国内丙烯市场或弱势运行为主。

    2、临近年底,金融机构开始提前筹谋跨年资金,中长期利率曲线又现倒挂。11月3日,上海银行间同业拆放利率(Shibor)3个月和6个月利率倒挂,分别报4.4217%和4.4165%,倒挂0.52个基点。与此同时,3个月以上期限之间的资金利差也都开始收窄,中长端利率曲线走势趋平。

    3、国新办新闻发布会介绍《深化“互联网+先进制造业”发展工业互联网的指导意见》,工业和信息化部信息通信管理局局长韩夏表示,后期将从四个方面推进工业互联网网络基础设施,其中包括推进工业领域全面部署IPv6。

    4、泰康人寿回应内幕交易。今日泰康人寿发公告表示,“江南嘉捷"是泰康二级市场投资备选库内股票,一直以来,泰康按照正常的研究分析和投资决策,依法合规进行交易,不存在所谓“突击入股”的情形。

    5、中国五矿集团公司与曹妃甸港集团股份有限公司、河钢集团、首钢集团、中国远洋海运集团在京举行签约仪式,五方决定以增资扩股的方式,在曹妃甸港共同建设涵盖保税、仓储、配矿、保值、融资、现货、期货交割库等功能的新型绿色环保、智能高效、功能齐全的亿吨级中国五矿曹妃甸国际矿石交易中心。

【TensorFlow开源2年官方回顾】下一个重要方向是分布式模型服务

新智元11月3日——自从2016年2月 TensorFlow Serving 开源以来,我们做了一些重大改进。现在,让我们再回到这个项目开始的地方,回顾我们的进展过程,并分享我们下一步的方向。


在 TensorFlow Serving 启动之前,谷歌公司内的 TensorFlow 用户也必须从头开始创建自己的服务系统。虽然一开始服务看起来很容易,但一次性服务解决方案很快就会变得更复杂。机器学习(ML)服务系统需要支持模型版本控制(对于具有回滚选项的模型更新)和多个模型(通过A/B测试进行试验),同时确保并发模型在硬件加速器(GPU和TPU)上实现高吞吐量和低延迟。因此,我们开始创建一个独立、通用的 TensorFlow Serving 软件栈。


我们从一开始据决定将其开源,开发工作是从2015年9月开始。几个月后,我们创建了最初的端到端工作系统,并在2016年2月释出第一个开源版本。


在过去一年半的时间里,在我们的用户和公司内外的合作伙伴的帮助下,TensorFlow Serving 得以提供先进的性能、最佳的实践和标准:


  • 开箱即用的优化服务和可定制性:我们现在提供一个预构建的规范服务二进制文件,针对带 AVX 的现代CPU进行了优化,因此开发人员不需要从我们的库中自己组装二进制文件,除非他们有特殊需求。同时,我们添加了一个基于注册表的框架,允许我们的库被用于定制(甚至是非TensorFlow)的服务场景。


  • 多模型服务:从一个模型扩展到多个并行服务的模型,会出现一些性能上的阻碍。我们通过(1)在隔离的线程池中加载多个模型,以避免在其他模型中出现延迟峰值;(2)在服务器启动时,并行加速所有模型的初始加载;(3)多模型批交错以复用硬件加速器(GPU/TPU)。


  • 标准化模型格式:我们将 SavedModel 添加到 TensorFlow 1.0,为社区提供了一种单一标准的模型格式,可以跨训练和服务工作。


  • 易于使用的推理API:我们为常见的推理任务(分类、回归)发布了易于使用的API,这些API适用于广泛的应用程序。为了支持更高级的用例,我们支持一个较低级的基于 tensor 的API(预测)和一个允许多任务建模的新的多重推理API。


我们的所有工作都通过与以下各方的密切合作实现的:(a)谷歌的 ML SRE 团队确保了我们团队的强壮并满足内部SLA; (b)谷歌其他机器学习基础架构团队,包括广告服务和TFX; (c)Google Play等应用程序的团队;(d)我们在加州大学伯克利分校RISE实验室的合作伙伴,他们研究与Clipper服务系统互补的问题; (e)我们的开源用户群和贡献者。


TensorFlow Serving 目前正在为1100多个我们自己的项目,包括谷歌云的ML预测,每秒处理数千万次的推理任务。核心服务代码可以通过开源版本获得:https://github.com/tensorflow/serving/releases


展望未来,我们的工作还远未完成,我们正在探索一些创新的途径。今天,我们很高兴在两个实验领域分享早期进展:


  • Granular batching:我们在专用硬件(GPU和TPU)上实现高吞吐量的关键技术是“批处理”(batching):联合处理多个样本以实现高效。我们正在开发技术和最佳实践来改进批处理:(a)使批处理能够仅针对计算的GPU / TPU部分,以获得最高效率; (b)允许在递归神经网络进行batching,用于处理序列数据,例如文本和事件序列。我们正在尝试使用Batch/Unbatch对任意子图进行batching。


  • 分布式模型服务:我们将模型分片(model sharding)技术作为处理模型的一种方法,这些模型由于太大而无法适应一个服务器节点,或者不能以节省内存的方式共享子模型。我们最近在生产中推出了一个1TB+的模型,并取得了良好的效果,希望很快开源。

破5万元 比特币疯涨的背后 国内交易平台赴海外

财经网11月3日——

微信图片_20171103001233

在芝加哥商业交易所宣布拟上线比特币期货后,比特币价格迎来一波暴涨行情。11月2日,国际已有多家比特币交易平台人民币报价突破5万元/个,美元价格也突破7000美元大关。在比特币价格疯涨的同时,国内比特币交易平台基于海外交易平台,面向全球法币推出点对点的场外交易服务,投资者蠢蠢欲动。

未标题-3拷贝

比特币价格疯涨

国内交易平台赴海外

比特币价格暴涨再度吸引市场眼球。截至11月2日19时,据金色财经行情显示,国际上已有多家比特币交易平台人民币报价突破5万元/个。美元方面,据bitfinex、CoinDesk等平台价格指数显示,比特币价格已经突破7000美元大关,日内最大涨幅超过10%。在分析人士看来,比特币价格的疯涨与芝加哥商业交易所计划上线比特币期货有较大关系。

此前,有消息称,世界最大期货交易所芝加哥商业交易所计划在今年四季度推出比特币期货。消息传出后,比特币价格升至6330美元/个,创下历史最高纪录。11月2日上午9时,据CoinDesk比特币价格指数显示,比特币价格突破6800美元大关,攀升至6832美元/个。当日晚间更突破7000美元。

国内方面,10月31日,国内比特币交易平台已完成清退,但完成清退并不代表网站就此关闭。此前,比特币交易平台火币网、OKCoin(币行)公告显示,两家均已采取措施,一方面保存原域名,提供区块链技术服务,另一方面,也出海寻找新的出路。

其中,币行发布公告称,币行将逐步转型为区块链技术应用和开发公司,服务广大中国客户,促进区块链技术在中国的发展,同时启用新域名。另外,币行通过投资、合作等方式拿到了世界多国数字资产交易的牌照,将进军海外市场。同时,火币网创始人李林也表示,火币在全球范围内已开展火币全球专业站、火币韩国、火币全球美元站、火币钱包、火币中国等业务。据介绍,火币中国将全面转型成为区块链垂直领域的专业综合资讯及研究服务平台,为中国内地用户提供区块链技术研发和应用类资讯信息,集行业咨询、研究和教育培训等服务于一体。总部位于中国北京,将继续由火币中国业务团队负责运营。


海外推出点对点

投资者只能场外交易

对于国内投资者而言,由于国内交易平台被关,只能转向场外交易,而火币网、币行等将基于海外交易平台、面向全球法币,推出点对点的场外交易服务。11月2日,OKEx发布公告称上线C2C服务,也就是场外交易服务。

而场外交易往往没有国界限制,相关平台可以面向全球提供服务。据近日国家互金专委会发布的《比特币场外交易监测报告》显示,目前国内用户常用的比特币场外交易平台4家均在海外,分别是LocalBitcoins、Paxful、CoinCola以及BitcoinWorld。

据OKEx公告显示,用户可以随时按OKEx指数价格上浮或下浮一定比例来买入或卖出比特币,交易对手为商家,配单成功以后给商家转账本地法币即可完成交易,投资区采用法币进法币出、数字资产进数字资产出的运营策略,即无论用户或商家,充进N个比特币,只能提走N个比特币,多余的部分只能卖出为法币。另外,开放交易区定位于购买比特币有提现需求的用户。用户可以自己决定买入或卖出价格,用户和商家之前自由选择成交。

苏宁金融研究院互联网金融中心主任薛洪言认为,从业务模式上看,C2C点对点服务与此前的交易所交易模式明显不同,之前是投资者把钱充至交易所在银行开立的对公账户,然后在平台内部进行虚拟货币的买卖;而C2C模式下,平台上集聚了大量的买方和卖方,双方自主确定价格、自主成交,资金直接由买方转账至卖方账户,平台不接触资金,可视做点对点场外撮合交易模式。

在资深数字货币研究员肖磊看来,“如果只是面对海外市场的话,做一个交易所就可以了,没有必要做C2C服务。因此平台这样的做法更多的还是面向国内投资者,并能规避监管”。


场外交易风险犹存

未来比特币何去何从

对于C2C交易平台的出现,薛洪言认为,该模式能够降低投资者撮合成交成本,便利虚拟货币买卖行为,也可视做禁令后的一种转型和模式探索。

肖磊也指出,平台如果做到公开透明,做好备案的话,是可以屏蔽掉一些非常低级的风险,欺诈会少一些,也有利于把地下交易阳光化一些。OKEx的公告中也表明,如果有诈骗行为,则会被封停账户。

不过,在分析人士看来,C2C平台仅是场外交易的其中一种模式,在比特币场外交易时,仍存在较大风险。国家互金专委会表示,随着比特币的深入发展,场外交易活跃度日益提升。场外交易对手双方匿名性强,交易支付渠道众多,且可能存在欺诈交易隐患。国家互联网金融风险分析技术平台将持续监测。

根据国家互金专委会的报告,从BTC-CNY(比特币对人民币)场外交易使用的人民币支付手段来看,2017年以来,通过Paxful完成的BTC-CNY场外交易中,96.3%的交易订单通过支付宝完成人民币转账,2.7%的订单通过微信支付完成人民币转账,Itunes礼品卡占比0.56%。

对于比特币未来的发展,肖磊表示,芝加哥商品交易所上线比特币的意义很大,因为期货是全球都非常主流的交易品种,加入期货市场的话,也就是被主流金融市场接纳,会有更多的金融机构或者比较大的对冲资金进入比特币市场,加快比特币的流动。长期来看,推出比特币期货有利于平抑比特币的价格波动。

趣店收跌近7% 传中国考虑关闭存在违法行为现金贷