深度学习12大常见问题解答(附答案)

简介: 本文列举了常见的12个深度学习的问题。


阿尔法狗让深度学习登上了数据科学世界的巅峰。深度学习成为了当今最热门的话题之一,但对于大多数人来说,这是一个陌生而又神秘的学科。很多人认为,深度学习就是包括了大量的数学和统计知识。

本文列举了常见的12个深度学习的问题。

26d8de40b7c7389b11091a0ea7463e08c4e3f71f

1.什么是深度学习?为什么它会如此受欢迎?

深度学习作为机器学习的典范,近年来已经显示出广阔的前景。这是因为深度学习与人类大脑的功能很相似。人脑是迄今为止最通用、最有效的自我学习模型。让我们从下面的例子中更好的理解深度学习模型的特点:

024c4bfd8a649cee5b700e8983ec97d2cf45ac5d 

你在上图中看到了什么?很明显,一辆车尽管图中也有沙子绿叶云彩,但大脑将这张图标记为一辆汽车。这是因为我们的大脑已经学会识别图像中的主要对象。

深度学习的特殊之处就在于从大量无关数据中获取有用信息。随着现在生成数据量的增加,我们希望模型能够更好地处理更多数据深度学习模型变得更好。

尽管深度学习已经出现多年,但重大突破仅仅在近几年实现。这其中有两个主要原因,首先是数据量的增加,如下图所示;其次是模型所需的硬件资源的增长,作为运行深度学习模型的GPU处理速度更快允许我们在更少的时间内构建更大更深的深度学习模型。

d416b22209a03a3ed4d89beae54e34ee810bec39 

2.深度学习只是一种炒作,还是有真实的应用程序?

现在,深度学习已经在很多实际中得到应用:Netflix著名的电影推荐系统到Google无人驾驶,从创造艺术文学写作到创造现实生活中的钱,都在使用深度学习模型。因此,如果说它只是一个炒作,这是错误的。

目前,深度学习的一些主要应用

1Google一次将文本翻译成数百种语言通过一些应用于自然语言处理任务的深度学习模型实现

2SiriAlexaCortana智能会话代理通过LSTMRNN简化语音识别技术语音命令打开了一个全新的领域

3计算机视觉领域的应用,例如OCR(光学字符识别)和实时语言翻译

4SnapchatInstagram等多媒体共享应用程序进行面部特征检测

5医疗领域的应用用来定位恶性细胞和其他异物检测疾病。

然而,由于训练深度学习模型所需的标记数据并不容易获得,因此一些人认为深度学习是一种炒作。即使数据可用,训练这些模型所需的计算设备也不便宜。因此人们无法体验到深度学习的力量,并将其视为炒作。

3.深度学习与机器学习有什么区别?

1数据依赖性

二者之间最主要的区别与数据的规模有关。当数据很小时,深度学习表现一般,而传统的机器学习表现较好;随着数据量的增加,深度学习的性能则远远高于机器学习如下图所示

626ef8fd5f242f4858e3441576650efe74724b7f 

2)特征工程

特征工程是一个将原始图像放入特征提取器的创建过程,降低数据复杂性使数据更适合于学习算法。一过程比较耗时、花费较大。

机器学习中,大部分应用特征需要由专家识别,根据域和数据类型进行手动编码深度学习的独特之处在于从数据中学习高级特征,也是传统机器学习领域的一大步。因此,深度学习减少了为每个问题开发新特征提取器的任务。

3)可解释性

解释性作为机器学习和深度学习的比较因素。

假设使用深度学习给散文自动评分,并接近人类的表现但没有揭示为什么它给出了这个分数。像决策树这样的机器学习算法可以解释其背后的推理。因此,决策树和线性逻辑回归等算法主要用于解释性行业。

4.深度学习的先决条件是什么?

在进行深度学习前,你需要了解以下知识:数学:概率、导数、线性代数。统计:统计的基础知识是进行任何机器学习问题所必需的。工具:具有一定程度的编码技巧。机器学习:机器学习是深度学习的基础。在学习深度学习前,一定要理解机器学习的概念。更多详细信息请看:Python入门深度学习的完整指南

4.在深度学习领域是否需要获得博士学位?

博士学位不是必须品,任何工作重点通常是展示你的能力,而不是学位本身。但是,如果你选择在特定领域(如NLP语言学)进行博士深造,肯定会是个加分项

5.选择哪些工具/语言构建深度学习模型?

Python具有强大的机器学习生态系统,该系统由开发人员和编码人员组成,他们为python用户提供开源库和技术支持。这使开发人员为各种算法编写复杂代码的任务变得更加容易,并且更易于实施和实验。

另外Python是一种可用于开发和实现通用编程语言。这极大地简化了从开发到实现的过渡。也就是说,一个可以预测机票价格的深度学习模型不仅可以用python开发,还可以用同样的形式附在网站上。

除此之外,我建议初学者使用像Keras这样的高级库对算法中隐藏的不必要信息进行抽象并允许访问可以调整的参数,使实验简化且提高模型性能。

RJuliaC ++Java等深度学习领域,除了Python之外,还有其他的语言你也可以关注TensorFlowPytorchCaffe2DL4J的发展,将他们作为库的替代品。

如果不熟悉编程,还有一些基于GUI的软件,不需要编码,就可以构建深度学习模型,如LobeGoogleAutoML等。

6.为什么构建深度学习模型需要使用GPU

深度学习模型有两个主要的操作前向传递和后向传递。

前向传递将输入数据通过神经网络后生成输出;后向传递根据前向传递得到的误差来更新神经网络的权重。

8cf76a7771cefca40e763237d5bd2f537767a567 

本质上都是矩阵乘法简单的矩阵乘法如下图所示。

56e510adfce9777dced0e604f076afd2591bed9d 

在这里,我们可以看到第一个数组的行与第二个数组的列元素分别相乘。因此,在神经网络中,我们可以将第一个矩阵视为神经网络的输入,第二个矩阵可以视为网络的权重。

这似乎是一个简单的任务。VGG16(在深度学习应用中经常使用16个隐藏层的卷积神经网络)大约具有1.4亿个参数又称权重和偏见。想想你需要做的矩阵乘法,如果我们传统的方法,训练这种系统需要几年的时间。

神经网络的计算密集部分由多个矩阵乘法组成。那么如何才能更快?

我们可以简单地通过同时执行所有操作而不是一个接一个地执行。这就是为什么我们使用GPU(图形处理单元)而不是CPU(中央处理单元)来训练神经网络的原因。

7.何时(何处)应用神经网络?

首先,深度学习模型需要清晰且丰富的数据来训练。将深度学习想象为一个孩子首先观察其父母如何走路。然后试图独立行走,并且每走一步,孩子都会学习如何执行特定的任务。经过几次不成功的尝试后,它会学习如何走路。

其次,对于图像处理等复杂问题使用深度学习需要很谨慎。深度学习算法属于表示学习算法。这些算法将复杂问题分解为更简单的形式以便理解(或可表示)。对于传统的算法来说这将更困难。

硬件要求对于运行深度神经网络模型至关重要。神经网络很久以前就被发现了,但近年来得以成功实现硬件资源更加强大也是其主要原因。

8.是否需要大量数据来训练深度学习模型?

我们确实需要大量的数据来训练深度学习模型,但也可以通过迁移学习来克服数据量不大这一障碍

训练深度学习模型所需的一些数据如下所示

034b66d970572dd73631401fa20ac83120d8bd67 

即使数据量不大,针对特定任务进行训练的深度学习模型也可以重用于同一个域中的不同问题这种技术被称为迁移学习

9.哪里可以找到一些基本的深度学习项目用来练习?

我强烈建议初学者使用MNIST数据该数据集包含手写数字及其实际标签,即数字从09

对于中级用户来说,这个 Age Detection竞赛是一个不错的项目该数据集由印度电影演员的面部图像组成任务是根据面部属性预测年龄。为了简单起见,这个问题已被转换为类,如青年、中年和老年等多个类问题

10.深度学习的一些免费学习资源有哪些

1图像处理学习资源

卷积神经网络-吴恩达

解密卷积神经网络(CNN架构

理解卷积神经网络入门指南

机器学习很有趣! 3部分:深度学习和卷积神经网络

深度卷积神经网络的ImageNet分类

R-CNN

越来越深入的卷积

2序列预测/时间序列学习资源

序列模型-吴恩达

深度学习要点:长期短时记忆

递归神经网络的不合理有效性

了解LSTM网络

循环神经网络和LSTM

3自然语言处理

自然语言处理的深度学习模型

词语和短语的分布式表征及其组合性

用神经网络进行序列学习

深度语音识别:扩大端对端语音识别

11.深度学习的相关面试问题有哪些

1深度学习模型如何学习?

2深度学习模型有哪些局限性?

3前馈神经网络和递归神经网络之间有什么区别?

4什么是激活特征函数

5什么是CNN,它有什么用途?

6什么是池化 简述其工作原理。

7什么是dropout层,为什么要用dropout

8什么是消失梯度问题,如何克服

9什么是优化函数说出几个常见的优化函数。

更多面试问题如下:

30个数据科学家关于深度学习的问题

40个数据科学家关于深度学习的问题

45个有关深度学习基础知识的问题

12.深度学习的未来是什么?

近年来,深度学习已经取得了很大的进步,但仍有很大的潜力。在不久的将来,深度学习将成为每个数据科学实践者所需的技能。事实上,现在有一个岗位是深度学习工程师——负责部署和维护该公司各部门使用的深度学习模型。毋庸置疑,这个职位在未来将会有很大的需求

目前,深度学习的局限之一在于:需要符合人类的要求。它需要大量的数据进行学习,这也引起了很多偏见随着时间的推移,这种偏见将会逐渐被消除。

 数十款阿里云产品限时折扣中,赶紧点击领劵开始云上实践吧!

以上为译文。

本文由北邮@爱可可-爱生活 老师推荐,阿里云云栖社区组织翻译。

文章原标题《12 Frequently Asked Questions on Deep Learning (with their answers)!》,译者:Mags,审校:袁虎。

文章为简译,更为详细的内容,请查看原文

相关文章
|
机器学习/深度学习 自然语言处理 算法
深度学习复习作业题目及面试常见问题
深度学习复习作业题目及面试常见问题
158 0
|
机器学习/深度学习 并行计算 TensorFlow
深度学习框架 TensorFlow 常见问题总结
1. Check failed: s.ok() could not find cudnnCreate in cudnn DSO;    tensorflow/stream_executor/cuda/cuda_dnn.
1708 0
|
4天前
|
机器学习/深度学习 边缘计算 算法
深度学习在图像识别中的应用与挑战
【5月更文挑战第9天】 随着人工智能技术的迅猛发展,深度学习已成为推动计算机视觉领域进步的关键力量。尤其是在图像识别任务中,深度神经网络通过模拟人脑的机制,显著提升了系统的准确率和鲁棒性。然而,尽管取得了显著成就,深度学习在图像识别应用中仍面临数据偏差、模型泛化能力不足以及计算资源密集等挑战。本文将探讨深度学习在图像识别领域的最新进展,分析其面临的主要技术和实践难题,并展望可能的解决方案。
|
21小时前
|
机器学习/深度学习 监控 自动驾驶
深度学习在图像识别中的应用与挑战
【5月更文挑战第12天】 随着计算机视觉和人工智能技术的迅猛发展,深度学习已成为图像识别领域的核心技术。本文将探讨深度学习在图像识别中的应用,包括卷积神经网络(CNN)的基本原理、关键技术及其在不同领域中的应用案例。同时,我们将分析当前面临的主要挑战,如数据集偏差、模型泛化能力和计算资源要求,并提出可能的解决方案。通过综合评述,旨在为读者提供一个关于深度学习在图像识别中应用的全面视角。
|
21小时前
|
机器学习/深度学习 数据采集 监控
基于深度学习的图像识别技术在智能监控系统中的应用
【5月更文挑战第12天】 随着人工智能技术的迅猛发展,深度学习在图像处理领域已经取得了显著的成就。尤其是在图像识别任务中,卷积神经网络(CNN)等先进模型的应用极大提高了识别精度与效率。本文旨在探讨基于深度学习的图像识别技术如何被集成到智能监控系统中,以增强其自动检测和响应异常事件的能力。通过分析现有文献和最新研究成果,文章将详细阐述相关技术原理、系统架构、以及在实际场景中的应用效果,并讨论了面临的主要挑战和未来的发展方向。
|
1天前
|
机器学习/深度学习 边缘计算 人工智能
深度学习在图像识别中的应用与挑战
【5月更文挑战第12天】 随着人工智能的迅速发展,深度学习技术在图像识别领域取得了显著的进步。本文旨在探讨深度学习模型如何有效地解决图像识别任务,并分析当前面临的主要挑战。文中将详细介绍卷积神经网络(CNN)的基础结构及其在图像分类、目标检测和语义分割中的应用。同时,将讨论数据增强、迁移学习、对抗性网络等优化策略。此外,本文也将指出模型泛化能力不足、计算资源消耗大、对小样本学习的挑战等问题,并提供可能的解决方案。
|
1天前
|
机器学习/深度学习 传感器 人工智能
基于深度学习的图像识别技术在自动驾驶系统中的应用
【5月更文挑战第12天】 随着人工智能技术的飞速发展,深度学习已成为推动多个科技领域前进的关键力量。特别是在图像处理和识别方面,深度学习模型已经展现出了超越传统算法的性能。本文将探讨一种基于深度卷积神经网络(CNN)的图像识别技术,并分析其在自动驾驶系统中的应用。我们将重点介绍该技术如何提高自动驾驶汽车对周围环境的感知能力,以及它在未来交通生态中的潜在影响。
|
1天前
|
机器学习/深度学习 监控 算法
深度学习在图像识别中的应用与挑战
【5月更文挑战第12天】 随着人工智能技术的飞速发展,深度学习已成为推动计算机视觉领域进步的核心技术之一。特别是在图像识别任务中,深度神经网络通过学习海量数据中的抽象特征,显著提升了识别的准确性和效率。然而,尽管取得了显著进展,深度学习在图像识别应用中仍面临一系列挑战,包括但不限于数据集偏差、模型泛化能力、计算资源消耗以及对抗性攻击的脆弱性。本文将深入探讨深度学习技术在图像识别领域的应用现状,分析存在的挑战,并对未来发展趋势进行展望。
14 9
|
2天前
|
机器学习/深度学习 存储 边缘计算
深度学习在图像识别中的应用与挑战
【5月更文挑战第11天】 随着计算机视觉技术的飞速发展,深度学习已成为推动图像识别领域进步的核心动力。本文将探讨深度学习在图像识别中的应用,并分析当前面临的主要挑战。通过梳理卷积神经网络(CNN)的发展历程、关键算法及其在不同场景下的应用案例,本文揭示了深度学习技术如何有效提升图像识别的准确性与效率。同时,针对数据偏差、模型泛化能力、计算资源限制等问题,文中提出了相应的解决策略和未来发展方向。