中国人工智能学会通讯——迎接深度学习的“大”挑战(下) 1.1 深度学习的训练方法和技巧

简介:

image

摘要:本部分主要介绍了深度学习的训练方法和技巧、深度学习的挑战和应对方法等问题。 最后结合眼下 AI 的研究进展,对深度学习领域深刻的“吐槽”了一番,妙趣横生且发人深省。

1.1 深度学习的训练方法和技巧

image

前面提到的 BN 方法还不能解决所有的 问题。 因为即便做了白化,激活函数的导 数的最大值也只有 0.25,如果层数成百上 千,0.25 不断连乘以后,将很快衰减为 0。 所以后来又涌现出一些更加直接、更加有 效的方法。其基本思路是在各层之间建立 更畅通的渠道,让信息流绕过非线性的激 活函数。这类工作包含 Highway Network、 LSTM、ResNet 等。

image

Highway Network 和 LSTM 一脉相承, 除了原来的非线性通路以外,增加了一个 由门电路控制的线性通路。两个通路同时 存在,而这两个通路到底谁开启或者多大 程度开启,由另外一个小的神经网络进行 控制。

image

相比之下,ResNet 的做法更加直接, 它不用门电路控制,而是直接增加总是开 通的线性通路。虽然这些方法的操作方式 不同,但是它们的基本出发点是一样的, 就是在一定程度上跳过非线性单元,以线 性的方式把残差传递下去,对神经网络模 型的参数进行有效的学习。

image

在前面提到的各项技术的帮助下,深层 神经网络的训练效果有了很大的提升。这 张图展示了网络不断加深、效果不断变好 的历史演变过程。2012 年 ImageNet 比赛中 脱颖而出的 AlexNet 只有 8 层,后来变成 19 层、22 层, 到 2015 年,ResNet 以 152 层的复杂姿态出场,赢得了 ImageNet 比赛 的冠军。

image

从这张图上可以看出,随着层数的不断 变深,图像的识别错误率不断下降,由此 看来,网络变深还是很有价值的。

到此为止,我们把深度学习及其训练方 法和技巧给大家做了一个非常简短的介绍。

相关文章
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
大数据分析的技术和方法:从深度学习到机器学习
大数据时代的到来,让数据分析成为了企业和组织中不可或缺的一环。如何高效地处理庞大的数据集并且从中发现潜在的价值是每个数据分析师都需要掌握的技能。本文将介绍大数据分析的技术和方法,包括深度学习、机器学习、数据挖掘等方面的应用,以及如何通过这些技术和方法来解决实际问题。
47 2
|
1月前
|
机器学习/深度学习 数据采集 PyTorch
使用PyTorch解决多分类问题:构建、训练和评估深度学习模型
使用PyTorch解决多分类问题:构建、训练和评估深度学习模型
使用PyTorch解决多分类问题:构建、训练和评估深度学习模型
|
1天前
|
机器学习/深度学习 运维 监控
TensorFlow分布式训练:加速深度学习模型训练
【4月更文挑战第17天】TensorFlow分布式训练加速深度学习模型训练,通过数据并行和模型并行利用多机器资源,减少训练时间。优化策略包括配置计算资源、优化数据划分和减少通信开销。实际应用需关注调试监控、系统稳定性和容错性,以应对分布式训练挑战。
|
3天前
|
机器学习/深度学习 算法 PyTorch
fast.ai 深度学习笔记(三)(3)
fast.ai 深度学习笔记(三)(3)
|
3天前
|
机器学习/深度学习 PyTorch 算法框架/工具
fast.ai 深度学习笔记(三)(1)
fast.ai 深度学习笔记(三)(1)
|
3天前
|
机器学习/深度学习 固态存储 Python
|
3天前
|
机器学习/深度学习 算法框架/工具 PyTorch
|
机器学习/深度学习 自然语言处理 Web App开发
|
3天前
|
机器学习/深度学习 API 调度
|
机器学习/深度学习 计算机视觉 存储

热门文章

最新文章