PCA & Autoencoders通俗解析

  1. 云栖社区>
  2. 翻译小组>
  3. 博客>
  4. 正文

PCA & Autoencoders通俗解析

【方向】 2018-09-30 14:07:27 浏览1888
展开阅读全文

1
来源:FK Films

自动编码器(Autoencoder)通过将数据映射到低维空间,提取数据的显著特征。该过程会对数据进行压缩编码,即“encoder”, “auto” 则体现在其能决定如何重组数据。其中编码特征被称为潜在变量。

为什么这样做:

  1. 降低数据维度从而缩短训练时间
  2. 挖掘潜在特征从而提高模型性能

潜在变量本质上是一些数据的隐式特征,它无法通过直接观察或测量得到。幸福就好比一个潜在变量,我们必须使用类似问卷调查的方式才有可能对一个人的幸福程度做出衡量。

与自动编码器一样,主成分分析(PCA,Principal Component Analysis)也是常用于降低数据维度。

举个简单的例子,你要送朋友一辆乐高跑车作为生日礼物。但是你用来装礼物的盒子不够大,无法装下全部零件。这时你就需要根据零件对汽车的重要性来判断是否扔掉它。像车把手和雨刷

网友评论

登录后评论
0/500
评论
【方向】
+ 关注
所属云栖号: 翻译小组