您现在的位置：首页>>文章列表 >>文化教育

全部

文章列表

汽车万向传动装置解析

今天我们继续来讲底盘传动系里的第三部分——万向传动装置，本文主要是介绍万向传动装置的四个内容：安装位置、作用、结构、故障（万向传动装置部分）。

安装位置

安装于变速器与驱动桥之间

作用

万向传动装置是传递动力的装置，其作用是连接不在同一直线上的变速器输出轴和主减速器输入轴，并保证在两轴之间的夹角和距离经常变化的情况下，仍能可靠地传递动力。

结构

万向传动装置一般由万向节、传动轴与中间支承组成。

万向节

万向节主要由万向节叉、十字轴与轴承套等组成，有的还会带有黄油嘴。

有的车其轴承并不是由轴承盖锁住的，而是由卡环锁住。

前置前驱发动机半轴上同样带有万向节（下图红色框选部分）

大致分为球笼式与三轴式两种，结构形式如下

传动轴

这里需要注意传动轴在安装时必须使两端的万向节叉处于同一平面。那是因为普通十字轴式万向节的工作特性虽能适应主从动两轴夹角的变化，但这种万向节具有不等速特性，即主动轴匀速转动时，从动轴的转速则是时快时慢周期性变化的。这种不等速性会使从动桥齿轮产生冲击。冲击不仅会发出噪音，还会加速从动桥齿轮的损坏。

中间支承

中间支承由橡胶弹性元件、轴承等组成。由于蜂窝形橡胶垫有弹性，可满足补偿安装误差和行驶中发动机窜动和车架变形引起的位移作用。

故障（万向传动装置部分）

万向传动装置的常见故障是异响和游动角度增大引起抖动。

后驱车：

1、万向节和伸缩节响

现象：在汽车起步或车速突然改变时，传动装置发出“哐”的一声;当汽车缓车时，传动装置发出“呱啦、呱啦”的响声。

原因：

A、万向节轴承因磨损或冲击造成松旷;

B、传动轴伸缩节花键因磨损或冲击造成松旷;

C、万向节凸缘盘连接螺栓松动。

2、传动轴响

现象：在万向节与伸缩节技术状况良好的情况下，传动轴于汽车行驶中发出周期性响声;车速越快时响声越大，严重时车身发生抖振，甚至握转向盘的手有麻痹感。

原因：

A、传动轴弯曲或轴管凹陷;

B、传动轴管与万向节叉焊接时未找正或传动轴未进行动平衡;

C、传动轴上的平衡片失落;

D、伸缩节未按标记安装，使传动轴失去平衡，并有可能造成传动轴两端的叉不在同一平面上;

E、中间支承吊架的固定螺栓或万向节凸缘盘连接螺栓松动，使传动轴位置偏斜;

F、橡胶夹紧式中间支承紧固方法不妥，造成中间传动轴前端偏离原轴线。

3、中间支承响

现象：汽车行驶中产生一种连续的“鸣、鸣”的响声，车速越快响声越大。

原因：

A、滚动轴承脱层、麻点、磨损过甚或缺油;

B、中间支承安装方法不当，造成滚动轴承承受附加载荷;

C、橡胶圆环损坏;

D、车架变形。

前驱车：

1、行驶过程中抖动

现象：汽车行驶过程中伴有车身抖动

原因：半轴变形

2、打方向时异响

现象：打方向时“咯噔”“咯噔”响，尤其是打大方向行走时。

原因：一般是半轴球笼磨损缺油所致。

3、行驶过程中异响

现象：行驶过程中半轴处发出异响。

原因：多发于内球笼套，为球笼套内干油所致。

上周北京新房成交排行榜

2017年7月3日—7月9日，北京市商品房成交377套，环比下降79%；成交面积5.35万㎡，环比下降69%；成交均价47084元/㎡，环比上涨46%；成交金额25.17亿元，环比下降55%。

一、住宅(普宅+别墅)市场成交

第一名：金隅金玉府

住宅成交319套，成交面积4.51万㎡，成交均价50944元/㎡，成交金额22.96亿元，成交排名前30项目如下：

二、别墅市场成交

第一名：兴创荣墅

别墅市场成交43套，成交面积0.91万㎡，成交均价33854元/㎡，成交金额3.08亿元，成交排名明细如下：

三、高端住宅成交

第一名：金隅金玉府

单价在70000元/㎡以上高端住宅本周成交95套，成交面积1.3万㎡，成交均价77923元/㎡，成交金额10.09亿元，成交排名明细如下：

四、普通住宅成交

第一名：金隅金玉府

普宅成交276套，成交面积3.6万㎡，成交均价55270元/㎡，成交金额19.88亿元，普宅成交排名前30名项目如下：

五、写字楼成交

第一名：高顺云港新能科技园

写字楼及商办成交21套，成交面积0.52万㎡，成交均价21565元/㎡，成交金额1.12亿元，成交排名明细如下：

六、商业市场成交

第一名：北京恒大城

商业市场成交26套，成交面积0.23万㎡，成交均价39435元/㎡，成交金额0.9亿元，成交排名明细如下：

七、二手房市场成交

北京市二手住宅本周成交1669套，环比下降16%；成交面积16.88万㎡，环比下降11%。

附：本周新增商品房供应表

什么是自动编码器

自动编码器(AutoEncoder)最开始作为一种数据的压缩方法，其特点有:

跟数据相关程度很高，这意味着自动编码器只能压缩与训练数据相似的数据，这个其实比较显然，因为使用神经网络提取的特征一般是高度相关于原始的训练集，使用人脸训练出来的自动编码器在压缩自然界动物的图片是表现就会比较差，因为它只学习到了人脸的特征，而没有能够学习到自然界图片的特征；
压缩后数据是有损的，这是因为在降维的过程中不可避免的要丢失掉信息；

到了2012年，人们发现在卷积网络中使用自动编码器做逐层预训练可以训练更加深层的网络，但是很快人们发现良好的初始化策略要比费劲的逐层预训练有效地多，2014年出现的Batch Normalization技术也是的更深的网络能够被被有效训练，到了15年底，通过残差(ResNet)我们基本可以训练任意深度的神经网络。

所以现在自动编码器主要应用有两个方面，第一是数据去噪，第二是进行可视化降维。然而自动编码器还有着一个功能就是生成数据。

我们之前讲过GAN，它与GAN相比有着一些好处，同时也有着一些缺点。我们先来讲讲其跟GAN相比有着哪些优点。

第一点，我们使用GAN来生成图片有个很不好的缺点就是我们生成图片使用的随机高斯噪声，这意味着我们并不能生成任意我们指定类型的图片，也就是说我们没办法决定使用哪种随机噪声能够产生我们想要的图片，除非我们能够把初始分布全部试一遍。但是使用自动编码器我们就能够通过输出图片的编码过程得到这种类型图片的编码之后的分布，相当于我们是知道每种图片对应的噪声分布，我们就能够通过选择特定的噪声来生成我们想要生成的图片。

第二点，这既是生成网络的优点同时又有着一定的局限性，这就是生成网络通过对抗过程来区分“真”的图片和“假”的图片，然而这样得到的图片只是尽可能像真的，但是这并不能保证图片的内容是我们想要的，换句话说，有可能生成网络尽可能的去生成一些背景图案使得其尽可能真，但是里面没有实际的物体。

自动编码器的结构

首先我们给出自动编码器的一般结构

从上面的图中，我们能够看到两个部分，第一个部分是编码器(Encoder)，第二个部分是解码器(Decoder)，编码器和解码器都可以是任意的模型，通常我们使用神经网络模型作为编码器和解码器。输入的数据经过神经网络降维到一个编码(code)，接着又通过另外一个神经网络去解码得到一个与输入原数据一模一样的生成数据，然后通过去比较这两个数据，最小化他们之间的差异来训练这个网络中编码器和解码器的参数。当这个过程训练完之后，我们可以拿出这个解码器，随机传入一个编码(code)，希望通过解码器能够生成一个和原数据差不多的数据，上面这种图这个例子就是希望能够生成一张差不多的图片。

这件事情能不能实现呢？其实是可以的，下面我们会用PyTorch来简单的实现一个自动编码器。

首先我们构建一个简单的多层感知器来实现一下。

class autoencoder(nn.Module):

def __init__(self):

super(autoencoder, self).__init__()

self.encoder = nn.Sequential(

nn.Linear(28*28, 128),

nn.ReLU(True),

nn.Linear(128, 64),

nn.ReLU(True),

nn.Linear(64, 12),

nn.ReLU(True),

nn.Linear(12, 3)

)

self.decoder = nn.Sequential(

nn.Linear(3, 12),

nn.ReLU(True),

nn.Linear(12, 64),

nn.ReLU(True),

nn.Linear(64, 128),

nn.ReLU(True),

nn.Linear(128, 28*28),

nn.Tanh()

)

def forward(self, x):

x = self.encoder(x)

x = self.decoder(x)

return x

这里我们定义了一个简单的４层网络作为编码器，中间使用ReLU激活函数，最后输出的维度是３维的，定义的解码器，输入三维的编码，输出一个28x28的图像数据，特别要注意最后使用的激活函数是Tanh，这个激活函数能够将最后的输出转换到-1 ～1之间，这是因为我们输入的图片已经变换到了-１～1之间了，这里的输出必须和其对应。

训练过程也比较简单，我们使用最小均方误差来作为损失函数，比较生成的图片与原始图片的每个像素点的差异。

同时我们也可以将多层感知器换成卷积神经网络，这样对图片的特征提取有着更好的效果。

class autoencoder(nn.Module):

def __init__(self):

super(autoencoder, self).__init__()

self.encoder = nn.Sequential(

nn.Conv2d(1, 16, 3, stride=3, padding=1), # b, 16, 10, 10

nn.ReLU(True),

nn.MaxPool2d(2, stride=2), # b, 16, 5, 5

nn.Conv2d(16, 8, 3, stride=2, padding=1), # b, 8, 3, 3

nn.ReLU(True),

nn.MaxPool2d(2, stride=1) # b, 8, 2, 2

)

self.decoder = nn.Sequential(

nn.ConvTranspose2d(8, 16, 3, stride=2), # b, 16, 5, 5

nn.ReLU(True),

nn.ConvTranspose2d(16, 8, 5, stride=3, padding=1), # b, 8, 15, 15

nn.ReLU(True),

nn.ConvTranspose2d(8, 1, 2, stride=2, padding=1), # b, 1, 28, 28

nn.Tanh()

)

def forward(self, x):

x = self.encoder(x)

x = self.decoder(x)

return x

这里使用了 nn.ConvTranspose2d()，这可以看作是卷积的反操作，可以在某种意义上看作是反卷积。

我们使用卷积网络得到的最后生成的图片效果会更好，具体的图片效果我就不再这里放了，可以在我们的github上看到图片的展示。github 地址：

http://t.cn/RK5gxpM

变分自动编码器(Variational Auto Encoder)

变分编码器是自动编码器的升级版本，其结构跟自动编码器是类似的，也由编码器和解码器构成。

回忆一下我们在自动编码器中所做的事，我们需要输入一张图片，然后将一张图片编码之后得到一个隐含向量，这比我们随机取一个随机噪声更好，因为这包含着原图片的信息，然后我们隐含向量解码得到与原图片对应的照片。

但是这样我们其实并不能任意生成图片，因为我们没有办法自己去构造隐藏向量，我们需要通过一张图片输入编码我们才知道得到的隐含向量是什么，这时我们就可以通过变分自动编码器来解决这个问题。

其实原理特别简单，只需要在编码过程给它增加一些限制，迫使其生成的隐含向量能够粗略的遵循一个标准正态分布，这就是其与一般的自动编码器最大的不同。

这样我们生成一张新图片就很简单了，我们只需要给它一个标准正态分布的随机隐含向量，这样通过解码器就能够生成我们想要的图片，而不需要给它一张原始图片先编码。

在实际情况中，我们需要在模型的准确率上与隐含向量服从标准正态分布之间做一个权衡，所谓模型的准确率就是指解码器生成的图片与原图片的相似程度。我们可以让网络自己来做这个决定，非常简单，我们只需要将这两者都做一个loss，然后在将他们求和作为总的loss，这样网络就能够自己选择如何才能够使得这个总的loss下降。另外我们要衡量两种分布的相似程度，如何看过之前一片GAN的数学推导，你就知道会有一个东西叫KL divergence来衡量两种分布的相似程度，这里我们就是用KL divergence来表示隐含向量与标准正态分布之间差异的loss，另外一个loss仍然使用生成图片与原图片的均方误差来表示。

我们可以给出KL divergence 的公式

这里变分编码器使用了一个技巧“重新参数化”来解决 KL divergence 的计算问题。

这时不再是每次产生一个隐含向量，而是生成两个向量，一个表示均值，一个表示标准差，然后通过这两个统计量来合成隐含向量，这也非常简单，用一个标准正态分布先乘上标准差再加上均值就行了，这里我们默认编码之后的隐含向量是服从一个正态分布的。这个时候我们是想让均值尽可能接近0，标准差尽可能接近1。而论文里面有详细的推导如何得到这个loss的计算公式，有兴趣的同学可以去看看具体推到过程：

https://arxiv.org/pdf/1606.05908.pdf

下面是PyTorch的实现：

reconstruction_function = nn.BCELoss(size_average=False) # mse loss

def loss_function(recon_x, x, mu, logvar):

"""

recon_x: generating images

x: origin images

mu: latent mean

logvar: latent log variance

"""

BCE = reconstruction_function(recon_x, x)

# loss = 0.5 * sum(1 + log(sigma^2) - mu^2 - sigma^2)

KLD_element = mu.pow(2).add_(logvar.exp()).mul_(-1).add_(1).add_(logvar)

KLD = torch.sum(KLD_element).mul_(-0.5)

# KL divergence

return BCE + KLD

另外变分编码器除了可以让我们随机生成隐含变量，还能够提高网络的泛化能力。

最后是VAE的代码实现：

class VAE(nn.Module):

def __init__(self):

super(VAE, self).__init__()

self.fc1 = nn.Linear(784, 400)

self.fc21 = nn.Linear(400, 20)

self.fc22 = nn.Linear(400, 20)

self.fc3 = nn.Linear(20, 400)

self.fc4 = nn.Linear(400, 784)

def encode(self, x):

h1 = F.relu(self.fc1(x))

return self.fc21(h1), self.fc22(h1)

def reparametrize(self, mu, logvar):

std = logvar.mul(0.5).exp_()

if torch.cuda.is_available():

eps = torch.cuda.FloatTensor(std.size()).normal_()

else:

eps = torch.FloatTensor(std.size()).normal_()

eps = Variable(eps)

return eps.mul(std).add_(mu)

def decode(self, z):

h3 = F.relu(self.fc3(z))

return F.sigmoid(self.fc4(h3))

def forward(self, x):

mu, logvar = self.encode(x)

z = self.reparametrize(mu, logvar)

return self.decode(z), mu, logvar

VAE的结果比普通的自动编码器要好很多，下面是结果：

VAE的缺点也很明显，他是直接计算生成图片和原始图片的均方误差而不是像GAN那样去对抗来学习，这就使得生成的图片会有点模糊。

AI、视觉、机器人TOP20 榜单

谷歌学术指标提供了一个简便的方法，让学者们可以迅速地看到学术出版物上最新文章的影响力。

近日，谷歌发布了2017最新版本的谷歌学术指标（ 2017 version of Scholar Metrics），本次发布覆盖了从2012到2016年发布的所有文章，并包括截至2017年6月在谷歌学术搜索中索引的所有文章引用情况。

谷歌学术指标收录的文章包括：遵守谷歌学术收录准则的网站、计算机和电子工程领域特定的会议论文、以及来自arXiv和NBER的预印本。 2012-2016，出版低于100篇文章的出版物，或者这段时间内没有被引用的出版物没有被收录在内。

在谷歌的官方网站上，你可以用特定的类型关键词进行搜索，比如 Ceramic Engineering、 High Energy & Nuclear Physics 或者 Film ；或者更宽泛的领域，比如 Engineering & Computer Science 或者 Humanities, Literature & Arts 。

在网站上，你可以看到根据5年高引用（h-index）和 h-median 指标排名的前20出版物。你也能看到不同语种排名前100的出版物，比如中文、西班牙语和葡萄牙语。每一个出版物，你可以点击 h5-index 查看改出版物被引用最多的论文。

学者指标包括除了每个类别和每个语言页面上列出的大量出版物。您可以在搜索框中的标题中输入单词，例如[allergy]，[cardiología]，[biomarkers]，找到这些内容。

Nature 排在总榜单第一名

谷歌学术把英文类出版物分为以下几大类：

商业、经济和管理
化学和材料科学
工程和计算机科学
健康和医学科学
人文、文学和艺术
生命科学和地球科学
物理和数学
社会科学

英文类出版物，网站列出了TOP100的名单，其中 Nature 排名第一，H5指数366，H5中位数563。

工程与计算机科学

在工程和计算机科学类目下，排名第一的是Advanced Materials（先进材料）。《先进材料》（英语：Advanced Materials）是一本涵盖材料科学的学术周刊。期刊发表的文章经过同行评审，论文类型包括通讯、综述和特稿，内容涉及物理学、化学、生物学、纳米科学和技术、冶金学、陶瓷和生物材料。

排在第2位的是 Nano Letters（纳米通讯）。Nano Letters 是国际纳米科学技术领域的权威学术期刊，由美国化学学会出版，其目的是快速公布一项研究的关键部分，因此倾向于发表短小、通讯样式的文章。

排名第3的是 Energy & Environmental Science（能源与环境科学）。这是一份2008年起由英国英国皇家化学院发行的学术期刊，内容涵盖生物化学、生物物理以及化学工程。

我们比较熟悉的 CVPR 排在第6位，CVPR全称IEEE Conference on Computer Vision and Pattern Recognition, CVPR（IEEE计算机视觉与模式识别会议），是由IEEE举办的计算机视觉领域的顶级会议，近年来每年有约1500名参加者，收录的论文数量在300篇左右。

排名第5，第7，第8的分别是Nature的三种子刊，Nature Materials（自然-材料科学），Nature Nanotechnology（自然-纳米技术）和 Nature Photonics（自然-光子学）。

工程和计算机科学类目下分为56个子领域，其中包括人工智能、计算机语言学、计算机视觉与模式识别、人机交互、Robotics。下文将对这些领域进行详细介绍。

人工智能类 TOP 20

arXiv上计算机科学类以Learning为关键词的文章被排在了这个列表的第一名，H5指数107。顶会NIPS排在了第二名，Expert Systems with Applications 排在第三。

来看看这一领域arXiv 被引最多的论文前三名：

第一名是阿姆斯特丹大学、Open AI 研究员 Diederik P. Kingma 和多伦多大学的Jimmy Lei Ba2014年合作的论文：《 Adam：A Method for Stochastic Optimization》，引用次数多达 2752 次。

第二名是蒙特利尔大学的Yoshua Bengio， Aaron Courville和 Pascal Vincent 联合完成的《Representation Learning: A Review and New Perspectives》。

第三名是谷歌的 Sergey Ioffe 和 Christian Szegedy的《Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift》。

计算机视觉与模式识别类 TOP 20

在计算机视觉与模式识别领域，IEEE的CVPR领先arXiv排在第一名，ICCV排在第六。

视觉领域的文章被引用得最多的是Christian Szegedy, Wei Liu, 贾扬清, Pierre Sermanet, Scott Reed, Dragomir Anguelov, Dumitru Erhan, Vincent Vanhoucke, Andrew Rabinovich等人共同完成的《Going Deeper With Convolutions》。

该领域被引最多的文章中，还有一篇也非常值得关注。微软亚洲研究院研究员孙剑、何恺明以及西安交通大学和中国科学技术大学的实习生张祥雨和任少卿共同合作的研究《Deep Residual Learning for Image Recognition》。这篇文章排在了第三名，被引2451次。

CVPR该领域被引文章列表详情：https://scholar.google.com/citations?hl=en&vq=eng_computervisionpatternrecognition&view_op=list_hcore&venue=l60tToE7K3UJ.2017

计算机语言学TOP20

在自然（Google scholar中的分类是Computational Linguistics）领域，排名第一的是 arXiv 的“计算机与语言”板块（cs.CL）。

arXiv之后，第2~5位均是会议。排名第2的是ACL，全名Meeting of the Association for Computational Linguistics（国际计算语言学年会），是计算机语言学和自然语言处理领域最高级别的国际学术年会。ACL年会已有55年历史，每年发表的论文都反映了NLP领域的最新研究进展和学术动向。

第3~5位分别是EMNLP，HLT-NAACL和LREC三个学术会议。

排名第一的是 arXiv 的“计算机与语言”板块（cs.CL）被引用最多的三篇文章，排在第一的是由Tomas Mikolov，Ilya Sutskever，Kai Chen，Greg S. Corrado和Jeff Dean等人共同完成的《Distributed Representations of Words and Phrases and their Compositionality》。

人机交互类 TOP 20

机器人类TOP 20

机器学习类 TOP 15

在谷歌学术的网站上，可以使用自定义关键词进行搜索，新智元以“Machine Learning”为关键词进行搜索，获得的结果如下：

以 Machine Learning 为关键词进行搜索，可以看到谷歌学术的排名第一的是 International Conference on Machine Learning (ICML) 。ICML如今已发展为由国际机器学习学会（IMLS）主办的年度机器学习国际顶级会议。

第二名是arXiv上的 ML 类别。第三名：The Journal of Machine Learning Research 。

排名第一的ICML大会被引用最多三篇的论文：

排名第一的ICML大会被引用最多的论文：Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift。作者是谷歌的 Sergey Ioffe, Christian Szegedy。

被引用第二多的论文，DeCAF: A Deep Convolutional Activation Feature for Generic Visual Recognition。作者包括：Jeff Donahue, 贾扬清 , Oriol Vinyals, Judy Hoffman, Ning Zhang, Eric Tzeng, Trevor Darrel。

2012年，吴恩达与Jeff Dean，Quoc V. Le ， Marc’Aurelio Ranzato ，Rajat Monga ，Matthieu Devin，Kai Chen ，Greg S. Corrado 等人合作的论文 Building High-level Features Using Large Scale Unsupervised Learning排在了第三名，被引用了1258次。

全球十佳智能手机

近日，外国的媒体杂志《Stuff》评选出了全球能购买到的十佳智能手机，三星S8拿下榜首，国产智能机一加5排名第二，也着实为国产智能机争了一口气。位居第三的则是iPhone 7 Plus,看来这个位居圣坛的iPhone地位是真的有所下降呀。

发布了2月之久还很难抢到的小米6，却没有进入十佳榜单。同样是骁龙835的处理器，为什么三星S8和一加5能取得这么好的成绩，而小米6却好像不太受到欢迎呢？

众所周知，小米6的货存一直是一个难题，小米6在国内的需求量还没解决，更别谈远销全球了，这大概也是小米6没有受到国际友人关注的原因。一加5相对于小米，除了货存问题完胜小米外，还有一个就是一加5支持全球主流地区的4G+,这也就成了受外国朋友欢迎的一大原因了。据网上报道，一加5售卖的当天，在外国也排起了长队购买，场面很壮观。

紧随iPhone 7 Plus的是HTC U11，看来今年搭载骁龙835处理器的手机的确是很吃香。就目前的手机市场上来看，835处理器在安卓手机中优势还是明显的，不仅性能强，功耗很降低了不少。值得一提的是，HTC U11这款手机，有一个创新的Edge Sense（边框触控）功能，打开APP、快速回复信息，仅仅一个动作就能实现了。

除了国产智能手机一加5外，华为跟荣耀也在十佳名单中。华为P10 Plus超越iPhone 7排名第六，荣耀8 Pro（国内的荣耀V9）排名第7。这样看来，华为在最近几年在手机方面的成就还是值得肯定的。

此外，LG G6和谷歌Pixel分别位列第五和第九名。第十名是Wileyfox Swift 2X，是英国厂商制造的一款智能手机，据说该机以性价比高为卖点，不知道各位有没有使用过的呢？反正我是没听过。

原来美国是这样一个国家你知道吗？

城市君和小伙伴们一样，每天都关注着美国的政策、感受着美国的生活，我们以为对美国已经非常了解，而今天看到一组图片才发现如今的美国是这个样子！

Business Insider的17张图从人口、经济、文化等方面为我们全方位的揭示美国。

美国大部分人都住在人口密集的城市

颜色越深的地方，人口越集中。

加州旧金山湾区、洛杉矶、东部纽约、五大湖地区、佛罗里达州这些地方都是旺地。

美国各州最大的出口贸易伙伴

加拿大是美国的最大的出口国，其次就是中国。

中国是俄勒冈州、华盛顿州、阿拉斯加、南卡州和路易斯安纳州的最大出口国。

大豆、私人飞机、电子，器材、全新或二手汽车、半导体零件、铜这些是美国出口给中国最多的商品。

美国各州最大的进口贸易伙伴

中国、中国、中国！！！

电脑配件、家用产品、服装、纺织品、电信设备、家具、鞋类等这些是美国从中国进口最多的商品。

女生最受欢迎名字

美国新生儿连取名字都会有地域性特征，2016年出生的女孩中，Ava这个名字在东南部州尤其受欢迎。

加州最受欢迎的女生名是Mia

纽约州最受欢迎的是Olivia

明尼苏达州偏爱Evelyn、佛罗里达州爱Isabella

如果你想给娃取个非大众的名字，可以参考地图，完美的避开这些满大街都是的名字~

男生最受欢迎的名字

至于男孩的名字，东南部几乎亲一色的选择了William

加州、德州最受欢迎的女生名是Noah

纽约州最受欢迎的是Liam

美国中部堪萨斯州独树一帜的偏爱Benjamin、蒙他拿州好多James

你有躺枪吗？

各州最受欢迎的工作

有些工作在一些州，就会格外的受欢迎。

你以为加州铁定会是程序员，其实是农业工作者

你以为纽约会是金融行业从业者，其实是时尚设计师

还有一些更出乎你意料

新墨西哥州是物理学家

明尼苏达州是装订书工人

佛罗里达州是特教教师

财富1000强最大的公司总部在这些州

原来Nike总部在俄勒冈

Costco总部在西雅图

Fexdex在田纳西州

Walmart沃尔玛在阿肯色州（Arkansas）

Verizon在纽约州

CVS在康涅狄格州（Connecticut）

.....涨姿势啦！

各州收入悬殊

每个州各人收入都会有差距是肯定的，但是有些州的贫富差距就大到过分啦~！

比如悬殊最大的纽约州，1%富人的收入是99%其他人的平均收入的45倍。怀俄明州是40.6倍、加州是28.9倍。

内达华州、德州、佛罗里达州的贫富差距也很大。图上颜色越深的州，贫富差距越大。

美国高中毕业率

教育不平等依然存在，南部市县的高中毕业率，远比北方的市县低！

就加州而言，北加的平均毕业率要高于南加。

德州中西部地区毕业率明显低于全国平均水平。

2015-2016美国每个县人口的数量变化情况

美国人爱折腾，是个人口流动大国，据说美国人一生要搬十几次家。

图示中标红色的县中离开的人比搬入的人多，标蓝色的县搬入的人比离开的人多。颜色越深表示增长/减少速度越快。

俄勒冈州、华盛顿州、佛罗里达州、以及科罗拉多州南部地区，吸引了大量新移民。

内华达州、阿拉斯加、美国中部大片地区、东部纽约州以及加州南部的人口逐渐在流逝。

2015、2016年每个县的出生率和死亡率变化

蓝色色块表示出生率大于死亡率，红色色块表示负增长。能明显感觉到美国东部“老年化“的趋势，而西部更富有生命力。

美国各县国际移民人口情况

颜色越深，国际移民数越高。

北加、纽约州、新墨西哥州南部、华盛顿州、德州、佛罗里达州、伊利诺伊州国际化明显，这些地区也同样是华人移民偏爱之地。

美国各州人口增长速度最快的城市

上面每个州里的蓝点标出的是各个州人口增速最快的城市。

加州人口剧增的城市是南加的尔湾Irvine

纽约州不出意外的就是纽约啦

意料之外的是

德州人口扩张最快的是康罗Conroe

华盛顿州增速最快的竟然不是西雅图，而是雷德蒙德Redmond，微软公司和任天堂美国公司都位于该市。

千禧一代（1984-2000出生）的“啃老族”情况

纽约、新泽西、康涅狄格这些州现年18-34岁人大多都和父母住在一起，比例高达40%

加州这种现象也很普遍，难道真是因为房租太贵，住家里比较实在？

但是新墨西哥州、密西西比州、阿拉巴马州的比率也很高，可能是另有隐情。

上图颜色越深这种现象越常见，颜色越浅越少见。

美国各州价值最大的进口物

加州、俄勒冈州、佐治亚州、密歇根州主要以进口车为主。

中部大部分州，如：德州、伊利诺伊州，主要进口原油。

内达华州、爱荷华州、新墨西哥州多进口与电脑部件相关产品。

美国各州最大的出口物

美国西部沿海加州、华盛顿州、亚利桑那州，东部沿海的佐治亚州等地出口价值最大的是飞机。

南部的德州、路易斯安纳州、密西西比州、阿拉巴马州多出口燃油

内布拉斯加州（Nebraska）是牛肉

缅因州（Maine）是龙虾

意外的是

内达华州和犹他州竟然主要出口金子

纽约州出口的是钻石！

现在，你心中的美国版图，是否更加清晰了呢？

浅谈人工智能入门必读物《机器学习》中的神经网络算法

1. 章节主要内容

机器学习中的神经网络算法，其中多隐含层的神经网络算法就是目前最热的深度学习算法。本章将从神经网络最小单元神经元开始，慢慢深入介绍，一步步的将神经网络算法娓娓道来。我们对其中的具体的算法逻辑和思考策略进行总结和概括，使大家能更快更轻松的理解神经网络算法是什么！

1）神经网络的的基础单元：神经元（neuron）

神经元是神经网络中的最基本的成分，其是仿造生物学中神经细胞之间传递信号的方式而设计的。在生物神经网络中，神经细胞都是相互相连的，当一个神经元接收到其它神经元发送的化学物质时，其会判断神经元的电位是否超过阈值。如果超过了，该神经元将会被激活，并向其它神经元发送化学物质。

与此类似，机器学习中的神经元接收来自 n 个其它神经元传递过来的输入信号，这些输入数据通过加权计算之后，神经元将会判断其是否超过神经元阈值。如果超过阈值，神经元将被激活，并通过“激活函数”（activation function）产生神经元的输出。

回顾我们在本书第三章线性模型中学到的内容，其实每一个神经元就如同一个广义线性模型一般，激活函数就是广义线性模型中的联系函数。下图是书中一个具体的神经元示例图，以帮助大伙理解：

2）神经元的初步组合：感知机和多层网络

将许多个神经元按一定的层次结构连接起来，就得到了神经网络，而不同的组合形式将生成不同的神经网络。

［1］感知机（perceptron）是早期的神经网络组合形式，由输入层和输出层两层神经元组成。因为感知机只拥有一层功能神经元（functional neuron）－输出层，其学习能力有限，在处理线性可分问题（如逻辑与、非、或运算）上效果很好，但在非线性可分问题（逻辑异或）上无法求得合适解。

［2］多层网络

要解决非线性可分问题，需要考虑使用多层功能神经元，即在输入输出层之外再加入中间层，这个中间层也叫隐含层。隐含层可以是一到多层，当隐含层很多时，这时的神经网络就是深度神经网络。

更一般的，每层神经元与下一层神经元全互连，神经元之间不存在同层连接，也不存在跨层连接，这样的神经网络结构通常称为“多层前馈神经网络”（multi-layer feedforward neural networks）

神经网络的学习过程就是根据训练数据对网络中神经元之间的权重以及每个功能神经元的阈值进行调整的过程；换言之，神经网络“学”到的东西，蕴涵在权重和阈值中。

3）多层网络的学习算法：误差逆传播算法（error BackPropagation，简称BP算法）

多层网络学习算法的目标是通过调整网络中的权重和阈值使得神经网络模型的泛化误差最小（其实每一种机器学习算法的中心思想都是一致的，这在我们第二章的学习中已经了解到了，设定一个模型/算法，用训练数据进行训练，然后用测试数据进行测试，以找到泛化性能最高的模型结构和参数）。

BP算法也是一样的，其目标是要最小化训练集 D 上的累计误差。对每个训练样例，BP算法执行一下操作：先将输入示例提供给输入层神经元，然后逐层将信号前传，直到产生输出层的结果；然后计算输出层的误差，再将误差逆向传播至隐层神经元；最后根据隐层神经元的误差来对连接权和阈值进行调整。该循环重复进行直到达到停止条件（比如训练误差小于一定的值）

如何设置隐含层神经元的个数仍是个未决问题，实际应用中通常靠“试错法”（trial-by-error）调整。

由于神经网络具有强大的表示能力，BP神经网络容易遭遇过拟合。目前有两种策略常用来缓解神经网络过拟合现象：

［1］早停（early stopping）：将数据分成训练集和验证集的策略，训练集用来计算梯度、更新权值和阈值，验证集用来估计误差，若训练集误差降低但验证集误差升高，则停止训练。

［2］正则化（regularization）：其基本思想是在误差目标函数中增加一个用于描述网络复杂度的部分。

4）学习的参数是否是最优解

神经网络的学习算法是根据误差的导数来对参数进行调优的过程。在数学上，导数值代表的是一个函数的斜率，是一种倾向性，所以以目标的负梯度方向对参数进行调整会使得误差变小。

当梯度为零时，此时的误差达到了一个极值，即其误差函数值小于邻点的误差函数值。但是这个极值只可能是一个局部极小值，而并不是全局极小值。我们可以根据下图来理解一下局部极小和全局极小之间的关系：

实际上，我们所要计算的是全局最小值，在现实任务中，人们常采用以下策略来试图“跳出”局部极小，从而进一步接近全局最小：

［1］以多组不同参数初始化多个神经网络，取其中误差最小的解。类似于从不同出发点开始搜索最小值，得到的多个局部最小中最小的那个更可能是全局最小

［2］“模拟退火”（simulated annealing）技术：每一步以一定概率接受次优解。每次以一定概率接受次优解有助于“跳出”局部极小，不过接受次优解的概率要随着时间的推移而逐渐降低，从而保证算法稳定

［3］随机梯度下降。每次一个训练样本算完后就直接调整参数，而不要积累一定误差再调整，这样的好处在于在计算梯度时加入了随机因素，于是即便陷入局部极小点，它计算的梯度仍可能不为零，这样就有机会跳出局部极小继续搜索了

需注意的是，上述用于跳出局部极小的技术大多是启发式，理论上尚缺乏保障。

5）神经网络的各种常用算法

将许多个神经元按一定的层次结构连接起来，就得到了神经网络，而不同的神经元结构、不同的激活函数选择、不同的误差指标选择、不同的学习策略都会导致形成不同的神经网络

［1］RBF网络

RBF（Radial Basis Function，径向基函数）网络是一种单隐层前馈神经网络。

它的特点是：单隐层前馈神经网络结构；使用径向基函数作为隐层的激活函数，而输出层则是对隐层神经元输出的线性组合。

具体训练过程：第一步，确定神经元中心，常用的包括随机采样、聚类等；第二步，利用BP算法来确定参数。

［2］ART网络

ART（Adaptive Resonance Theory，自适应协振理论）网络是一种竞争型（competitive learning）学习网络。竞争型学习是神经网络中一种常用的无监督学习策略，在使用该策略时，网络的输出神经元相互竞争，每一时刻只有一个竞争获胜的神经元被激活。

它的特点是：两层的神经网络结构，分别是比较层（输入）和识别层（输出）；无监督的学习方式；竞争型的神经网络，即同时只有一个识别层结点被激活；识别层的神经元数量可以动态增加。

一个简单的ART网络是这样训练的：对输入的数据向量，找到与每个识别层神经元所对应的模式类代表向量的距离最小的神经元。如果这个距离小于阈值，则将这个数据归入该神经元所属的类中，并重新计算这个神经元的代表向量，否则重置模块并在识别层上增设一个新的神经元，其代表向量就设为当前输入向量。

［3］SOM网络

SOM（Self-Organizing Map，自组织映射）网络也是一种竞争学习型的无监督神经网络。

它的特点是：两层的神经网络结构，分别是输入层和输出层（输出层以矩阵方式排列在二维空间中）；无监督的学习方式；竞争型的神经网络，即同时只有一个识别层结点被激活；

训练过程如下：对每个训练样本，找到距离训练样本最近的输出神经元，我们称为最佳匹配单元；调整最佳匹配单元及其附近神经元的权向量，使得权向量与当前输入样本的距离缩小；不断迭代直到收敛。

［4］级联相关网络

级联相关网络是一种结构自适应网络，其不像一般的神经网络，它还将网络结构也当作学习的目标之一。

训练过程如下：刚开始训练时，只有输入和输出层，处于最小拓扑结构；随着训练的进行，逐渐加入新的隐层神经元；其是通过最大化新神经元的输出与网络误差之间的相关性（correlation）来训练相关参数。

和前馈神经网络相比，级联相关网络无需设置网络层数、隐层神经元数目，所以训练速度较快，但在数据较小时容易陷入过拟合。

［5］Elman网络

递归神经网络（recurrent neural networks）允许网络中出现环形结构，从而可让一些神经元的输出反馈回来作为输入信号。这样的结构使得网络状态不仅与自身状态相关，还跟前一刻的状态相关，从而能处理与时间有关的动态变化。

Elman网络是最常用的一个递归神经网络，其使用隐层神经元的输出与下一刻的神经元输入一起作为下一刻的输入。它使用Sigmoid激活函数，并使用BP算法进行训练

［6］Boltzmann机

Boltzmann机是一种“基于能量的模型”，其为网络状态定义一个“能量”，当能量最小化时网络达到理想状态。

它的特点是：两层结构，显层与隐层，显层即代表输入也代表输出，隐层则被理解为数据的内部表达；神经元是布尔型

训练过程（对比散度 Contrastive Divergence 算法）如下：通过输入层算出隐层分布，再通过隐层分布重新算出输入层的新分布；并利用新分布与旧分布之间的差别调整连接权重

6）深度学习

理论上来说，参数越多的模型复杂度越高，这意味着它能完成更复杂的学习任务。但同样的，复杂模型的缺点是训练慢，且易陷入过拟合。

但随着大数据、云计算时代的到来，计算能力大幅提高可缓解训练低效性，训练数据的大幅增加则可降低过拟合风险，所以以“深度学习”为代表的复杂模型开始受到人们的关注。

深度学习无法使用BP算法进行训练，因为误差在多隐层内传播时，往往会“发散”而不能收敛到稳定状态。

深度学习采用无监督逐层训练（unsupervised layer-wise training）来训练模型，其基本思想是每次用无监督方法训练一层隐结点，并用本层结点的输出作为下一层隐结点的输入，这称为“预训练”（pre-training）；在预训练全部完成后，再对整个网络进行“微调”（fine-tuning）训练。

比如，在深度信念网络（Deep Belif networks，简称DBN）中，每层都是一个受限Boltzmann机，所以训练过程是对每一层的Boltzmann机进行训练，等各层预训练完成后，再利用BP算法等对整个网络进行训练。

这种“预训练＋微调”的训练策略很值得我们学习，其等于将大量参数分组，先对每组进行无监督学习找到局部较优解，然后再基于这些局部较优解进行全局寻优。既保证了自由度，还有效的节省了训练开销

我们可以从另一个角度来理解深度学习，其多隐层堆叠，可看作是在对输入信号进行逐层加工，从而把初始的、与输出目标之间联系不太密切的输入表示，转换成与输出目标联系更密切的表示。换言之，通过多层处理，逐渐将初始“低层”的特征转换为“高层”特征表示，使得用简单模型就能完成复杂的分类等学习任务。

由此，我们可以将深度学习理解为进行“特征学习”的过程

2. 基础知识

1）激活函数

用来产生神经元输出的函数，一般是在区间［0，1］（有例外），用来判断神经元是否被激活。常用的激活函数有阶越函数、Sigmoid函数和ReLu函数。

2）多层前馈神经网络

每层神经元与下一层神经元全互连，神经元之间不存在同层连接，也不存在跨层连接，这样的神经网络结构通常称为多层前馈神经网络

3）误差逆传播算法

对每个训练样例，BP算法执行一下操作：先将输入示例提供给输入层神经元，然后逐层将信号前传，直到产生输出层的结果；然后计算输出层的误差，再将误差逆向传播至隐层神经元；最后根据隐层神经元的误差来对连接权和阈值进行调整。该循环重复进行直到达到停止条件（比如训练误差小于一定的值）

4）结构自适应网络

其不像一般的神经网络，它还将网络结构也当作学习的目标之一。

5）递归神经网络（recurrent neural networks）

允许网络中出现环形结构，从而可让一些神经元的输出反馈回来作为输入信号。这样的结构使得网络状态不仅与自身状态相关，还跟前一刻的状态相关，从而能处理与时间有关的动态变化。

3. 总结

1）神经元是神经网络中的基础元件，其接收来自 n 个其它神经元传递过来的输入信号，这些输入数据通过加权计算之后，神经元将会判断其是否超过神经元阈值。如果超过阈值，神经元将被激活，并通过“激活函数”（activation function）产生神经元的输出。

2）神经网络的学习过程就是根据训练数据对网络中神经元之间的权重以及每个功能神经元的阈值进行调整的过程、

3）BP算法是多层神经网络进行学习主流算法

4）神经网络训练过程中要加入适当的“意外”，以避免陷入局部最优

5）将许多个神经元按一定的层次结构连接起来，就得到了神经网络，而不同的神经元结构、不同的激活函数选择、不同的误差指标选择、不同的学习策略都会导致形成不同的神经网络

6）我们可以将深度学习理解为进行“特征学习”的过程

上一页 71 72 73 74 75 76 77 78 79 80 下一页

汽车万向传动装置解析

安装位置

作用

结构

故障（万向传动装置部分）

上周北京新房成交排行榜

深度学习自动编码器还能用于数据生成？这篇文章告诉你答案

什么是自动编码器

自动编码器的结构

变分自动编码器(Variational Auto Encoder)

AI、视觉、机器人TOP20 榜单

排名第一的ICML大会被引用最多的论文：Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift。作者是谷歌的 Sergey Ioffe, Christian Szegedy。

全球十佳智能手机

原来美国是这样一个国家 你知道吗？

浅谈人工智能入门必读物《机器学习》中的神经网络算法

原来美国是这样一个国家你知道吗？