• 项目
首页>>文章列表 >>文化教育
文章列表

【AI TOP 10】AI预测人类寿命,准确率近70%

 最后一名真能逆袭第一!浙大学者Science发表长文解破其中秘密


7月13日,在浙江大学求是高等研究院和医学院神经科学研究中心的胡海岚研究组,一只小老鼠豆豆,在众人的见证下实现了从最后一名逆袭成第一名。


2017年7月14日,胡海岚研究组在《科学》杂志上发表文章,证实了“胜利者效应”背后的神经学机制,表明它真的让大脑发生了长久持续的改变,而并不光光是自我安慰而已。


和人类一样,老鼠和其他动物的世界里,都有稳定的等级制度存在。这种等级呈线性——一鼠压着一鼠;同时保持稳定。而前额叶皮层神经细胞被激活,是排位垫底的小老鼠改变排行榜格局的关键。

论文作者全部是女科学家 右起:周亭亭博士、导师胡海岚教授、朱鸿博士和范郑晓博士

 

阿里云人工智能ET打破记录,夺肺结节诊断世界冠军

7月14日消息,国际权威肺结节检测大赛LUNA16的世界纪录被打破。


阿里云ET凭借89.7%的平均召回率夺得世界冠军。此项技术突破由阿里巴巴iDST视觉计算团队完成,并已集成到阿里云ET医疗大脑中。


大赛要求选手对888份肺部CT样本进行分析,寻找其中的肺结节。样本共包含1186个肺结节,75%以上为小于10mm的小结节。最终,ET在7个不同误报率下发现的肺结节平均召回率达到89.7%,超出第二名0.2%。



 机器学习“算出”晶体性质,利用6万数据进行预测


一般情况下,对新材料的预测和实验是很耗时的,科学家不得不以“试错”的方式制备材料。

北卡罗来纳大学(UNC)药学院的Olexandr Isayev博士和Alexander Tropsha博士利用国家标准技术局(NIST)无机晶体结构数据库中将近6万种特殊材料的数据,开发了机器学习算法工具PLMF,能在理论层面上预测包括金属、陶瓷和其他晶体在内的新材料性质,并为现有材料找到新的用途。

利用机器学习分析和模拟已有晶体结构,PLMF方法能够预测科学家提出的新材料的性能,甚至还能够填充NIST数据库中缺少的、且从未被测试出来的材料数据。




 可穿戴“肢体”,让你多长出一根手指


随着事情越来越多,大家有木有觉得经常分身乏术呢?伦敦皇家艺术学院的研究生就通过3D打印技术,制作了一种可穿戴拇指。它可以让正常人也能拥有第六指!


这根手指拥有三个可弯曲指节,可以灵活移动,看起来和人指的功能差不多。可以玩iPad、打牌、捡东西等等。可穿戴肢体不是第一次被发明,日本曾发明穿戴机械手。



 合成电视假新闻的技术已经具备,根据语音生成对应视频新闻


华盛顿大学的研究者构建了一个工具,根据音频剪辑生成逼真的视频,让嘴巴的运动和音频同步。


研究人员以美国前总统奥巴马创建了一个示例视频,显示出与他实际提供信息的方式相似的嘴巴运动。一条“假新闻”就这样被造出来了。




 细思恐极,AI可以预测人类寿命了,准确性接近70%

近日,一些澳大利亚科学家发明了一种有望改变整个医学界的方法,那就是使用人工智能分析医学影像,并以此预测每个人的健康状况和寿命。这项研究发表在了《自然》杂志子刊《Scientific Reports》上。


在这次发表的研究中,来自澳大利亚阿德莱德大学的科研人员使用机器学习算法分析了资料库中48名60岁以上成人的胸部CT扫描图像。通过分析图像数据,算法预测了这些志愿者在5年内死亡的几率。通过与实际情况比对,这个算法预测的准确率达到了70%,这一数字与人类专家的预测成功率一样准确。


科研人员承认,目前的研究中样本数量还太少,并且只分析了胸部CT图像,更多患者更多部位的数据将能够继续改进这个算法,最终帮助医生尽早诊断和干预疾病。




 2017上半年美国AI领域投资达36亿美元,超2016年全年


为了深入了解整体第二季度的风投表现,需世界各地的数据,但本文只针对美国的数据进行分析。据公司数据显示,截止目前,风险投资、企业和种子投资者今年已经向人工智能和机器学习公司投入了36亿美元。这一数字远远超过了他们在2016年的全部投入,创下了同期内有史以来最高的记录。


2017上半年至少发生了40次并购,其中包括人工智能和机器学习公司。相比之下,2016年全年收购了56家。


钱去哪儿了?


到2017年为止,近40%的资金流向了两家公司。今年2月,总部位于匹斯堡的Argo AI人工智能技术公司从福特公司获得了10亿美元的投资。就在本周,位于中国的商汤科技(SenseTime)筹集了4.1亿美元,用于开发基于人工智能深度学习技术的应用,用于面部识别和图像处理等。


 最暖心饭卡数据分析:中科大用算法隐性资助4万贫困生


算法都冷冰冰吗?


“我从未申请过补助,为什么会收到贫困生资助?” 2005年来,中科大正默默用食堂一卡通数据分析,不断优化后台数据算法,十余年来4万人次获助,金额累计600万,被称为最暖心的数据分析。


学校会监测每个学生的一卡通在食堂的消费情况,“如果每个月的消费低于200元,就会自动给你打生活补助。”但是条件好的同学妄图减少在食堂的消费而骗取补助,也是骗不到的。




 帝国理工AI泰斗Nick Jennings 加入ContactEngine董事会

客户沟通技术领导者ContactEngine已经宣布,现任帝国学院研究副院长兼人工智能教授Nick Jennings已加入并领导其新成立的咨询委员会。


这项最新任命增加了他过去的荣誉列表,包括从2010年至2015年在政府担任国家安全首席科学顾问。


Jennings教授是研究和部署系统的专家,其谷歌学术H-index高达111。他将人工智能和人类智能结合在一起,在公共部门和私营企业有一系列成果。在ContactEngine,Jennings教授将与高级管理团队密切合作,通过AI和机器学习进一步优化数字客户之旅。



 李彦宏:百度去年一年申请的AI专利,比日本全国一年的专利还多


李彦宏透露,“百度去年一年申请的AI相关的专利,比日本整个国家一年的专利数目还要多。”如今,全球人工智能企业主要集中分布在美国、中国、英国等少数国家,华人在人工智能的研发上有着突出表现,李彦宏在演讲中指出,“现在全球AI相关的论文作者,华人占43%,专利申请增长速度非常快”。


作为率先开始人工智能研发的企业,李彦宏在AI技术专利方面早有布局。目前,百度在人工智能领域公开的中国专利申请超过2000项,国外专利申请数百项。



 大数据告诉你今年有多热


7月12日,北京在持续的高温黄色预警中强势入伏。热!热!热!大家普遍反映今年北京天气太热,热得早、热得猛。


今年5月19日就进入高温季了,而且5月里接连出现了3个高温日,近十年里勇折桂冠,在近37年里排位也仅次于1999年(4个);今年6月里的高温日数有8个,近10年第一,近37年第二(和1999年并列),2000年11天排位第一。


今年夏季虽尚未过半,总的高温日数已有15天,冲到了历年来的中上水平,在近10年里与2009、2010年并列第一。所以总的来看,今年的高温不但来得早、来势凶猛,而且还有相当大的后劲儿,在近十年里应该会独占鳌头。

2017年6月SUV紧凑型销量排行榜TOP42

谷歌云机器学习创业大赛前三名出炉

今年 3 月,紧随收购数据科学平台 Kaggle 后,谷歌在首届谷歌云大会 Google Cloud Next 上宣布推出谷歌云机器学习初创公司竞赛,将采取创新机器学习方法的初创公司放上投资表单。


第一届谷歌云机器学习初创公司竞赛与 7 家风险投资公司合作进行,包括红杉资本,KPCB,GV,Data Collective,突创资本(Emergence Capital),Andreessen Horowitz 和格雷洛克风投(Greylock)。




竞赛一共有 3 个奖项,分别由 Data Collective、突创资本和谷歌冠名。Data Collective 和突创资本会各为获胜的创业公司提供 50 万美元的资金。


谷歌推出的是“Build with Google”奖,专门面向使用谷歌云和 TensorFlow 的公司。Build with Google 奖项的冠军得主将获得 100 万美元的谷歌云(GCP)积分,亚军 50 万美元 GCP 积分。此外,冠亚军都将得到与谷歌云工程师交流的机会和一定的 G-Suite 使用权。


根据谷歌公布的评审规则,参赛的初创公司最被看重的将是其底层(underlying)机器学习方案的独特性(uniqueness)。其他标准,比如拓展的能力,产品的市场适应性,团队的技能和准备工作(preparedness)等传统的风投标准也在考评之中。


谷歌表示,所有垂直行业的初创公司都欢迎参与竞赛,包括医疗保健、能源和零售。不过,能够申请的初创公司融资必须不到 500 万美元,并且在美国注册成立。


今天,谷歌云机器学习初创公司竞赛公布结果,共有 10 家初创公司从 350 多名申请中脱颖而出。


在这 10 家公司中,最终获胜的是 3 家,分别被 Data Collective、突创资本和谷歌所选中。谷歌向所有决赛入围者都提供了 20 万美元的 GCP 积分。比赛之前,DCVC 和突创资本都为其选择的公司提供种子资本,从一开始就进行了稀释申请人的活动。


TechCrunch 评论称,该竞赛从很多层面上看,都是 GCP 积极与机器智能初创公司合作的战略体现。仍然落后于亚马逊 AWS 和微软 Azure 的谷歌云,正在努力将自己塑造为初创公司“友好”的云服务供应商。


参与比赛的创始人指出,Kubernetes 和 TensorFlow 都是 GCP 的卖点,而且赢得免费的谷歌云积分肯定不是什么坏事。


下面,就来看看这些受顶级资本青睐的机器学习初创公司——


DCVC - BrainSpec:云端机器学习,简化脑数据分析



  • 投资额:50 万美元


BrainSpec 正在构建平台,帮助医生使用标准的 MRI 设备测量大脑代谢物。大脑代谢物是细胞过程的化学结果,常常是理解脑损伤,比如阿尔茨海默病和其他脑疾病的关键。


传统上,医生可以使用一种叫磁共振光谱的复杂过程进行组织分析,检测神经疾病的关键指标。BrainSpec 通过 Web 界面和基于云的统计分析简化这一技术。此外,该公司的特点在于,一般的大脑分析的是图像,而他们分析的是化学结果数据。


DCVC 合伙人 Matt Ocko 表示,他投资 BrainSpec 的原因是看中了 BrainSpec 解决方案的庞大市场规模。BrainSpec 在产品中融入了强大的领域专业知识,并且具有明确的产品化和监管审批途径。


根据 BrainSpec 公司 LinkedIn 页面,这家公司成立于 2015 年,目前员工数量不到 10 人。


突创资本 - LiftIgniter:机器学习自动推荐系统



  • 投资额:50 万美元


LiftIgniter 的目标是帮助企业将他们提供给用户的内容个性化。像亚马逊和 Spotify 这样的大企业有自己的推荐系统,很多其他企业也有个性推荐的需求,只是苦于没有这样的技术。


LiftIgniter 团队拥有构建 YouTube 机器学习推荐系统的经验,正在围绕其服务制作 API。该公司表示,从未在 A/B 测试中失败过,并且有 180 万的 ARR(客均年度经常性收入)和 22% 的月增长。


LiftIgniter 团队也是“Build with Google”奖亚军,获得了 50 万美元 GCP 积分和其他奖励。根据 LinkedIn 页面,目前团队员工数量不到 10 人。


谷歌 - PicnicHealth:机器学习个人医疗数据标记



  • 奖励:100 万美元 GCP 积分


PicnicHealth 在中央数字医疗记录系统之上应用机器学习技术,为制药公司和研究小组生成结果数据。


PicnicHealth 使用自动提取方法,结合人类护士团队,共同注释匿名的医疗记录。制药公司特别愿意为数据花钱,而且是花大钱,因为 PicnicHealth 的毛利润高达 5000 美元。


患者使用消费者平台保留对数据的控制权,也可以选择更换医院和医生。Picnic 在这层操作后,自动收集记录,并进行分析和发布。

机器人走路未必笨拙,DeepMind新方法训练的人工智能就走得很飘逸

无论是在树木间乱窜的猴子,还是躲避对手和进击目标的足球运动员,他们灵活敏捷的速度,都让人十分惊叹。掌握这种复杂的电机控制是物理智能研究的方向,是 AI 研究的重要组成部分。

真正的智能电机需要在一系列复杂的环境中,学习如何调节控制身体使其更加灵活来完成任务。目前,很多领域开始研究如何控制模拟人,包括计算机动画和生物力学领域。智能电机的另一种发展趋势是,使用手工制作的目标或运动捕捉的数据来产生特定的行为。 然而,这可能需要相当多技术工作的努力,也可能会导致智能电机面对新任务时,难以重新调整行为。

而 DeepMind 已经找到了 AI 学习灵活行为的方式,这种方式不仅能够重复使用,还能解决任务。

一、丰富的环境中表现的运动行为

如果玩 Atari 或 Go 时,目标很容易描述,就是赢。但是你如何描述一个后空翻表演的过程?或者仅仅只是单纯描述一下“跳”这个动作?当 DeepMind 把运动技能教授给人工系统时,常常会遇到这个问题,就是很难准确描述一个复杂的行为。 DeepMind 目前的工作就是研究如何在简单高水平的目标下,使身体能够从头开始与环境相互作用来完成复杂的行为,例如向前移动而不会下降。更具体地说,他们训练了各种模拟人,让他们在不同的地形上进行跳跃,转弯或者蹲伏。结果显示,模拟人完成这些复杂的技能前,并没有收到具体的指示。 DeepMind 需要找到一种方法,可以训练系统中明显不同的模拟人。



二、通过对抗模仿学习人体行为

上述的模拟人解决突发行为的能力非常强大,但是由于这些动作必须从头开始,所以模拟人的动作看起来和人类行为不太一样。在 DeepMind 的第 2 篇论文中,阐述了如何通过运动捕捉数据来构建一个模仿人类行为的政策网络,需要预先学习一些技能,例如步行、起步、跑步和转弯等等。目前,模拟人已经产生了类似人类的行为,可以通过重新调整这些行为来完成其他任务,比如爬楼梯,通过导航绕过围墙等等。



三、模拟人模仿人类各种行为

DeepMind提出了构建一种最先进的生成模型的神经网络结构,它能够学习不同行为之间的关系,并模仿它所显示的具体动作。经过训练之后, DeepMind 的系统可以编码观察到的动作,还可以创建新的小动作。尽管模拟人并没有看到动作之间的过渡,依旧可以在不同类型的动作之间切换,例如在行走风格之间的转换。

实现模拟人行动灵活且适应控制是 AI 研究的关键要素。 DeepMind 的工作旨在开发一套系统,能够通过学习和调整技能来解决电机控制任务,同时减少手动工程。 DeepMind 未来的研究工作主要是扩展这些方法,以便在更复杂的情况下完成更多的任务。

五大数据可视化平台,让你的数据分析更高大上

数据分析在业务管理是重中之重,能将业务以数据的形式可视化地展现,为决策提供依据。

面对海量繁琐的数据,该如何进行处理才能更直观更有效地利用呢?这里推荐几款可视化分析工具,有图表插件、有报表工具也有BI工具。

也许,你见过的数据分析大咖的报表,是这样的:

拒绝平庸|五大数据可视化平台,让你的数据分析更高大上

或者是这样的

拒绝平庸|五大数据可视化平台,让你的数据分析更高大上

而你的Excel图表可能是这样的

拒绝平庸|五大数据可视化平台,让你的数据分析更高大上


不过,用上这几个高大上的数据可视化平台,让你的数据分析不仅有高逼格而且有高效率!

Echarts

首推Echarts。这个平台来自BAT巨头之一百度,是十足的良心国货。它不仅有在线工具,也有免费的下载软件,方便可行,可视化的效果高端又酷炫。

拒绝平庸|五大数据可视化平台,让你的数据分析更高大上

拒绝平庸|五大数据可视化平台,让你的数据分析更高大上

Highcharts

Highcharts操作十分简单便捷,不需要像Flash和Java那样需要插件才可以运行,而且运行速度快。另外HighCharts还有很强的兼容性,能够完美支持当前大多数浏览器,包括iOS和IE等等。而且它免费用于非商业,图表类型也非常丰富。

拒绝平庸|五大数据可视化平台,让你的数据分析更高大上

帆软报表(FineReport)

FineReport不同于以上,是报表工具,用于复杂数据复杂报表的开发展示。制作报表时不需要复杂的代码,它类似于Excel编辑器,简单设置就可以查看数据展示。实用性强,图表的可视化和交互效果也非常棒。除去可视化,FineReport在应用中还有填报功能,可对数据库进行增删改,区别于传统意义上只能做数据展示的报表。

FineBI

FineBI同样是帆软一个数据分析BI工具,核心在于数据的自助分析和交互体验,以及与各类数据库、数据仓库,大数据平台等对接,大数据处理性能优异,用户可以自行拖拽维度分析。

拒绝平庸|五大数据可视化平台,让你的数据分析更高大上

Power BI

Power BI是微软发布的一款可视化BI工具,类似Excel升级版的大表哥。一改以往excel需要数据透视表,写大量函数的复杂特点,这款工具拖拖拽拽操作起来十分简单。

拒绝平庸|五大数据可视化平台,让你的数据分析更高大上

未来十年,这些行业收入会快速增长

在中国,哪些行业收入最高?

曾经是电力、煤气及水的生产和供应业,后来是金融业,2016年信息传输、软件和信息技术服务业独占鳌头。

这些变化,说明了什么?

整个中国经济的重心发生了变化。改革开放以来,一开始制造业和公用事业表现强劲,随后金融行业异军突起,而科技相关的行业则一直表现抢眼。


同时,21世纪经济研究院查询统计年鉴(2003年起按城镇非私营单位平均工资数据统计)发现,制造业与收入最高行业的差距在持续扩大。

1978年,最高收入的电力、煤气及水的生产和供应业,年平均收入为850元,与制造业收入差距约40%;到了2015年,最高收入的金融业年平均收入为114777元,和制造业平均收入55324元收入相比,高出一倍以上。

而随着中国进入工业社会后期,精神需求会进一步加大,文化、科教、娱乐等行业可能出现收入快速增长。

金融、IT业“后来居上”

21世纪经济研究院查询了多年统计年限,发现中国最高收入的行业出现过一次“渐变”。

1978年,中国收入最高的前5个行业分别是电力、煤气及水的生产和供应业,建筑业,地质勘查业水利管理业,交通运输仓储和邮电通讯业以及采掘业。在随后的十余年中,这些行业也多数表现抢眼。

比如,1985年到1988年,地质勘查业水利管理业连续在收入榜单上排名第一;1989年到1991年,采掘业平均收入最高。具体来说,1978年到1980年,地质勘查业水利管理业年平均收入分别为1406元、1604元、1768元、2025元。1989年到1991年,采掘业年平均收入分别为2378元、2718元、2942元。


不过,从1993年开始,房地产、金融、信息传输、软件和信息技术服务(IT业)、科学研究和综合技术服务业开始逐渐出现在平均收入最高前三位。比如,1993年、1994年,收入最高的行业分别是房地产业、金融保险业。1997年到1999年,金融保险业收入在行业中最高。2000年到2001年,最高收入行业是科学研究和综合技术服务业。2002年,金融保险业收入再次变为最高。

到了2003年之后,国家统计局将行业统计变得更为细化,21世纪经济研究院统计城镇非私营单位平均工资后发现,行业最高收入前三名榜单上,一直被三个行业占据:信息传输、软件和信息技术服务业,金融业,科学研究和技术服务业占据了所有平均收入排行榜前三名的位置。

综合来看,电力、金融、房地产业、IT、采掘业,都曾成为收入最高的行业。这些行业一度成为时代的“宠儿”,有背后的深刻原因。

比如在上世纪70、80年代,中国加速工业化的背景下,电力、采掘、地质勘查等行业收入快速增长。即使在上个世纪90年代,电力、煤炭、石油也比较紧张,这些行业的高收入在延续。

当时制造业的收入也不低。比如1978年制造业收入是每年597元,电力、煤气及水的生产和供应业,采掘业,金融保险业收入,分别为850元、676元、610元,行业差距最大约有40%左右。到了1990年,制造业收入是2073元,电力、煤气及水的生产和供应业,采掘业,金融保险业收入,分别为2656元、2718元、2097元,行业之间差距最大约有30%左右。


到了1995年,制造业收入是5168元,电力、煤气及水的生产和供应业,采掘业,金融保险业收入,分别为7843元、5757元、7376元,行业差距最大的为50%左右。

但是时间推进到1996年,中国部分商品开始出现过剩,制造业收入出现上升“门槛”。

与之相反的是,金融业借助房地产信贷以及国家基础设施投资信贷需求,实现了快速发展。IT行业则借助上世纪末本世纪初互联网行业的兴起,不断发展壮大,其收入水平快速上升。

科教文体行业收入看涨

目前,中国逐步进入工业社会后期,物资短缺的温饱时代已经过去。而随着人口老龄化程度加深,基础设施大规模建设时期也步入末期,房地产的需求长期看很难再快速增加。这一局面出现后,对信贷资金的渴求会逐步消退。

换句话说,金融业、房地产业的“黄金时代”可能已经步入尾声。21世纪经济研究院认为,未来中国短缺的是文化、娱乐、保健等方面的需求。


21世纪经济研究院判断,未来十多年,科学研究和技术服务业,教育业,卫生和社会工作业、文化、体育和娱乐业,公共管理、社会保障和社会组织业等行业,目前短板特征明显,人才相对不足。因此,这些行业收入还会快速增长。

从2016年城镇非私营单位的平均收入来看,教育,卫生和社会工作、文化、体育和娱乐,公共管理、社会保障和社会组织等行业的平均收入,已经超过了采矿业(过去的采掘业)。而在上世纪80、90年代,这些行业的平均收入普遍偏低。

值得一提的是科学研究和技术服务业。该行业作为经济发展的动力,在1978年改革开放以来都呈现较快的收入增长。未来,考虑到国家的创新驱动战略,该行业的收入仍将位居收入的前列。

对于IT行业而言,目前全球共享经济快速发展,中国也在大力实施“互联网+”的产业触网行动。21世纪经济研究院判断,未来无论是IT的硬件、软件,抑或是大数据行业,仍会快速发展,其行业收入将水涨船高。


目前,行业收入偏低的行业为农林牧渔业。2016年该行业的平均收入只有33612元,为金融业的1/4左右,制造业的1/2左右。而在1978年,农林牧渔业的平均收入为470元,与金融业和制造业平均收入只相差20%左右。

不过,农林牧渔业并非没有发展前景,只是目前劳动生产率等待进一步提升,行业需要产业升级。未来,如果农村土地大规模实现流转,进一步加大科技在该行业的运用,同时大力发展绿色产业,发展新型农业经营主体,这一行业实现收入快速上升并不是没有可能的。

而对于长期占据收入“龙头”榜的电力、煤气及水的生产和供应业,未来收入增长空间有限。过去,这些行业收入普遍较高,是因为背后有垄断和短缺的因素。但是现在,这些因素已逐渐弱化。

以电力为例,未来在新科技成果的运用下,很多用电企业和单位,可以实现分布式发电站的自发自用能源供给。加上输配电分开,未来该行业难以有大的收入提升空间。

另一个目前看不到收入大幅增长前景的行业是采矿业。由于钢铁煤炭产能过剩,以及页岩油、可燃冰、新能源汽车的运用,未来煤炭和石油行业难以有大的利润增长,收入上升的空间应该不大。

「谷歌大脑实习一周年」50 篇论文看机器学习、计算机视觉和自然语言趋势

2015 年 10 月,谷歌大脑宣布推出“谷歌大脑实习计划”(Google Brain Residency Program),为期一年,为关注机器学习和深度学习的人开始职业生涯做准备。实习生能够利用谷歌得天独厚的基础设施,与领域里最顶尖的研究人员一起工作。

2016 年 6 月,第一届谷歌大脑实习计划正式开始。从计算机科学到物理、数学、生物和神经科学,成员背景不一。有的人博士刚毕业,也有人已经有多年的工作经验。他们研究的课题也从自然语言理解,机器人,到神经科学再到遗传学,覆盖广泛。

据悉,迄今为止,第一批谷歌大脑实习生已在 ICLR(15),ICML(11),CVPR(3),EMNLP(2),RSS,GECCO,ISMIR,ISMB 和 Cosyne 等领先的机器学习会议及刊物发表了 30 多篇论文(括号里的数字表明在相关会议发表的论文数量)。另外,还有 18 篇论文在 NIPS,ICCV,BMVC 和《自然-方法》审核中。

谷歌大脑实习计划一周年成果摘选

那么,下面我们就来看看这些成果(排名不分先后)。

先来看两篇发表在“交互式期刊” Distill的工作:

1. “看见”神经网络如何生成手写字符

用交互式的方法探索了神经网络如何生成手写字符。相关论文:《用神经网络生成手写字符的 4 个实验》(Four Experiments in Handwriting with a Neural Network)。作者:Carter, et al., "Experiments in Handwriting with a Neural Network", Distill, 2016. 


2. 探索机器人如何从观察中学习模仿人类运动的系统

论文《时间对比网络:多观察观察中的自监督学习》(Time-Contrastive Networks: Self-Supervised Learning from Multi-View Observation)。作者:Pierre Sermanet, Corey Lynch, Jasmine Hsu, Sergey Levine,CVPR Workshop (2017)


3. 用强化学习训练大规模分布式深度学习系统

「谷歌大脑实习一周年」50 篇论文看机器学习、计算机视觉和自然语言趋势

通过优化计算到硬件设备分配,这个模型能够使用强化学习对大规模分布式深度学习网络进行训练。论文:《通过强化学习进行设备布局优化》(Device Placement Optimization with Reinforcement Learning)。作者:Azalia Mirhoseini, Hieu Pham, Quoc Le, Mohammad Norouzi, Samy Bengio, Benoit Steiner, Yuefeng Zhou, Naveen Kumar, Rasmus Larsen, Jeff Dean,ICML (2017)


4. 自动发现优化方法

「谷歌大脑实习一周年」50 篇论文看机器学习、计算机视觉和自然语言趋势

提出了一种将方法优化方法自动化的方法,尤其是自动优化深度学习框架。论文:《用强化学习搜索神经网络优化器》(Neural Optimizer Search with Reinforcement Learning)。作者:Irwan Bello, Barret Zoph, Vijay Vasudevan, Quoc Le,ICML (2017)


5. 使用神经网络生成全新 RNN 架构,在许多任务上超越 LSTM 架构

「谷歌大脑实习一周年」50 篇论文看机器学习、计算机视觉和自然语言趋势

设计神经网络十分繁琐困难。利用这种新技术,能够自动生成性能卓越的 RNN 架构。上图左边是一个 LSTM 架构,右边是使用神经网络生成的新型 RNN 架构。后者在各种不同任务上优于广泛使用的 LSTM。论文:《用强化学习搜索神经网络架构》(Neural Architecture Search with Reinforcement Learning)。作者:Barret Zoph, Quoc V. Le,ICLR (2017)


6. 理论计算能否取代大规模的超参数搜索?

「谷歌大脑实习一周年」50 篇论文看机器学习、计算机视觉和自然语言趋势

颜色表示了神经网络的训练准确性,从黑(随机)到红(高精度)以此升高。白色虚线表示可训练和不可训练网络之间的理论边界。在上面的 4 幅图中,(a)表示没有 dropout 的网络,余下 3 个依次表示 dropout 率为 0.01, 0.02, 0.06 的网络。论文:《深度信息传播》(Deep Information Propagation)。作者:Samuel S. Schoenholz, Justin Gilmer, Surya Ganguli, Jascha Sohl-Dickstein,ICLR (2017)


7. 提升 GAN 合成图像的训练效果

「谷歌大脑实习一周年」50 篇论文看机器学习、计算机视觉和自然语言趋势

上图展示了作者提出的 AC-GAN 与其他几种常用 GAN 的对比,从左到右依次是条件 GAN、半监督 GAN、InfoGAN。论文:《用带有辅助分类器的 GAN 做条件图像合成》(Conditional Image Synthesis With Auxiliary Classifier GANs)。作者:Augustus Odena, Christopher Olah & Jonathon Shlens,ICML(2017)


8. 使用神经网络为其他网络生成超参数

「谷歌大脑实习一周年」50 篇论文看机器学习、计算机视觉和自然语言趋势

HyperNetwork 是生成另一个网络权重的网络。作者使用 HyperNetwork 生成 RNN 的权重,发现能为 LSTM 生成非共享权重,并在字符级语言建模、手写字符生成和神经机器翻译等序列建模任务上实现最先进的结果。上图显示了 HyperLSTM 模型生成的文本。四色方块是每个生成字符下方的变化范围,代表主 RNN 的 4 个权重矩阵(分别用红、绿、蓝、黄表示)。密度越高,代表主 RNN 权重变化越大。论文:《超网络》(HyperNetworks)。作者:David Ha, Andrew Dai, Quoc V. Le,ICLR (2017)

9. 用神经网络生成不同乐器的声音

「谷歌大脑实习一周年」50 篇论文看机器学习、计算机视觉和自然语言趋势

提出了一种类似 WaveNet 的自编码器模型,让这个模型学习了一系列嵌入,通过插入元素,让生成在声音听上去像是由不同的乐器发出的。上图展示了这种模型的结构,能从原始音频波形中学习时间码,对自回归解码器进行调节。作者还介绍了一个高质量的大规模音符数据集 NSynth。论文:《WaveNet 自编码器合成音乐》(Neural Audio Synthesis of Musical Notes with WaveNet Autoencoders)。作者:Jesse Engel, Cinjon Resnick, Adam Roberts, Sander Dieleman, Douglas Eck, Karen Simonyan, Mohammad Norouzi,ICML (2017)


10. 有效利用噪音标签,提升分类精度

「谷歌大脑实习一周年」50 篇论文看机器学习、计算机视觉和自然语言趋势

研究提出了一项利用噪音标签的方法。噪音标签就是那些有很多专家对一幅图像给出了不同标记的标签。作者使用一个神经网络对每个专家的标签都给出一组输出,然后学习平均权重来组合其预测。通过这种方法,知道哪位专家说了什么,对数据有了更好的标记,从而提高分类精度。上图是实验中对糖尿病视网膜病变严重程度的标记。论文:《谁说了什么:为单个标记者建模提升分类质量》(Who Said What: Modeling Individual Labelers Improves Classification)。作者:Melody Y. Guan, Varun Gulshan, Andrew M. Dai, Geoffrey Hinton,CVPR Workshop (2017)


谷歌大脑实习计划:毕业生去向及新一届招生

据悉,本届谷歌大脑实习计划的毕业生,有很多都留在谷歌大脑全职工作。其他人则进入斯坦福、伯克利、康奈尔、多伦多和 CMU 等顶级机器学习博士项目深造。

现在,第二届实习计划即将开始。同时,第三届招生计划 9 月开放。