深度学习界冉冉升起的新星——循环神经网络(part1)

简介: 随着深度学习的流行,循环神经网络也随之受到了业内人士的广泛关注。目前该技术已经在自然语言处理(NLP)中取得了巨大的成功,想了解么?快来看看吧。

作者介绍:Hazem,机器学习以及深度学习爱好者

Bloghttps://thebeautyofml.wordpress.com/

当你实践机器学习方法的时候,我确信没有什么是比循环神经网络更让你激动的了。循环神经网络不仅是最强大,最成功的技术,它还是众多神经网络技术中最幸运的。尽管在大多数情况下,人们并不将之视为深度学习技术,今天我们介绍的研究仍然大量采用循环神经网络。循环神经网络的诞生要追溯到20世纪80年代,但是也就是随着深度学习技术的火爆,该技术才真正的蓬勃发展。

引言

在介绍循环神经网络的工作方式之前,我们先要明确几个概念。首先,循环神经网络是图灵完备的,这就意味着它可以模拟图灵机,也可以计算图灵机可以计算的算法。简单来说,循环神经网络有一块单独的内存,它的工作方式和图灵机用来输入输出的磁带一样。

我们想象一个无限长的纸带,我们称之为输入空间。在输入空间中的每一个点都看作是神经网络的输入。现在假设这些点沿着一个轴连接在一起(它们是水平线或垂直线),现在循环网络可以工作可以通过应用仿射变换,然后使用非线性激活函数(作为常规前馈网络)将线上的每个点作为输入,直到线结束为止。注意,这些点是彼此分离的。在每个点,循环网络应用输入的非线性变换计算隐藏激活神经元,因此对于网络来说想要知道当前点和下一个点之间的关系,它需要记住隐藏的激活神经元或循环的输出。如果空间中的输入是词向量,网络将映射当前词和前一个词到新的隐藏空间并组合它们两者。现在你可以看到,循环神经网络在时间轴上移动,循环网络现在可以计算在离散时间步长(例如,特定时间段内的温度度数)产生的输入。当然理论上来说,循环神经网络可以计算时间轴上任意的输入,哪怕在实际生活中也不会发生。我们关心的是时间轴上步长相同的行为,当然如果时间间隔太长我们也不会考虑。

cbf588c1ef90b976c31457688ab5b425fc89eba3

根据Eric Yuan的博客,一个对输入序列进行操作的循环神经网络,阴影显示网络对新输入的敏感性,因为它们覆盖了网络从以前的时间步长存储的旧的隐藏激活神经元。 这个原理类似于一个学生接受新的知识的时候很容易忘记之前的知识。

神奇之处

现在你知道循环神经网络如何工作的了,那么神奇也就发生了。一个循环神经网络能够用一个简单的权重集来处理序列,这就意味着每次推进网络,你用的权重集都是同一个,这是和前馈神经网络最大的不同。你可以把每个输入点视为不同的需要不同的权重集的输入。 这称为参数共享,它是机器学习的一个非常重要的概念。 我们也可以在前馈网络中使用参数共享,但是前馈网络不会保持之前的隐藏激活神经元。

当然,你也可以把循环神经网络看作一个在循环中的前馈神经网络,并且每次它的输入是两个向量。在当前时间步长的输入和先前隐藏的激活神经元使用相同的权重。

工作原理

时间分离的输入或简单的时间序列进行都可以作为循环神经网络的输入。下面的公式描述了这个网络的数学模型:

414b921ef6d63514f64cdddbc1d827cf7015b60a

公式中的 467d2a5d15a135ba321b9d0e24c5ced49670769d非常有趣,当通过反向传播算法学习时,它表示网络的存储器。467d2a5d15a135ba321b9d0e24c5ced49670769d控制着从先前的时间步长隐藏神经元应该传递什么。一个更加成熟的架构(被称为长期短期记忆)将467d2a5d15a135ba321b9d0e24c5ced49670769d分为许多参数,这样就能控制需要记住或者传递到下一个时间步长多少输入或者隐藏激活神经元。

更有趣的是,循环神经网络可以在时间45ef74a25668853cbda39c15fb3f772f7f3e8d59 忘记隐藏激活神经元,当一个新的输入在t时刻被提交给了网络。这是因为467d2a5d15a135ba321b9d0e24c5ced49670769d是固定的,不随时间步长变化。该问题可以通过反向传播中的轻微修改和循环网络神经元结构的修改来解决。

循环神经网络可以学习分类序列,就像神经网络分类输入向量一样。考虑作为单词向量序列的自然语言句子,这些单词向量一个接一个地送到循环网络并产生作为最终输出的情感类别(正的,负的或中性的)。当然,您可以对每个输入向量进行分类,而不是对整个序列进行分类。循环神经网络可以输出序列,如在机器翻译的任务中,对于源语言中的每个词向量,网络可以精准输出目标语言中的单词。你可以看到,循环神经网络是处理自然语言时的选择很自然,因为我们处理的是词序列。

数十款阿里云产品限时折扣中,赶紧点击领劵开始云上实践吧!

以上为译文

本文由北邮@爱可可-爱生活 老师推荐,阿里云云栖社区组织翻译。

文章原标题《Computing Time Part (I): Recurrent Neural Networks》,作者:Hazem,译者:爱小乖,审校:6816816151。

文章为简译,更为详细的内容,请查看原文


相关文章
猫狗宠物识别系统Python+TensorFlow+人工智能+深度学习+卷积网络算法
宠物识别系统使用Python和TensorFlow搭建卷积神经网络,基于37种常见猫狗数据集训练高精度模型,并保存为h5格式。通过Django框架搭建Web平台,用户上传宠物图片即可识别其名称,提供便捷的宠物识别服务。
480 55
基于Python深度学习的眼疾识别系统实现~人工智能+卷积网络算法
眼疾识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了4种常见的眼疾图像数据集(白内障、糖尿病性视网膜病变、青光眼和正常眼睛) 再使用通过搭建的算法模型对数据集进行训练得到一个识别精度较高的模型,然后保存为为本地h5格式文件。最后使用Django框架搭建了一个Web网页平台可视化操作界面,实现用户上传一张眼疾图片识别其名称。
268 5
基于Python深度学习的眼疾识别系统实现~人工智能+卷积网络算法
PyTorch生态系统中的连续深度学习:使用Torchdyn实现连续时间神经网络
神经常微分方程(Neural ODEs)是深度学习领域的创新模型,将神经网络的离散变换扩展为连续时间动力系统。本文基于Torchdyn库介绍Neural ODE的实现与训练方法,涵盖数据集构建、模型构建、基于PyTorch Lightning的训练及实验结果可视化等内容。Torchdyn支持多种数值求解算法和高级特性,适用于生成模型、时间序列分析等领域。
212 77
PyTorch生态系统中的连续深度学习:使用Torchdyn实现连续时间神经网络
基于MobileNet深度学习网络的MQAM调制类型识别matlab仿真
本项目基于Matlab2022a实现MQAM调制类型识别,使用MobileNet深度学习网络。完整程序运行效果无水印,核心代码含详细中文注释和操作视频。MQAM调制在无线通信中至关重要,MobileNet以其轻量化、高效性适合资源受限环境。通过数据预处理、网络训练与优化,确保高识别准确率并降低计算复杂度,为频谱监测、信号解调等提供支持。
基于Python深度学习的【害虫识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能
害虫识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了12种常见的害虫种类数据集【"蚂蚁(ants)", "蜜蜂(bees)", "甲虫(beetle)", "毛虫(catterpillar)", "蚯蚓(earthworms)", "蜚蠊(earwig)", "蚱蜢(grasshopper)", "飞蛾(moth)", "鼻涕虫(slug)", "蜗牛(snail)", "黄蜂(wasp)", "象鼻虫(weevil)"】 再使用通过搭建的算法模型对数据集进行训练得到一个识别精度较高的模型,然后保存为为本地h5格式文件。最后使用Djan
93 1
基于Python深度学习的【害虫识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能
基于MobileNet深度学习网络的活体人脸识别检测算法matlab仿真
本内容主要介绍一种基于MobileNet深度学习网络的活体人脸识别检测技术及MQAM调制类型识别方法。完整程序运行效果无水印,需使用Matlab2022a版本。核心代码包含详细中文注释与操作视频。理论概述中提到,传统人脸识别易受非活体攻击影响,而MobileNet通过轻量化的深度可分离卷积结构,在保证准确性的同时提升检测效率。活体人脸与非活体在纹理和光照上存在显著差异,MobileNet可有效提取人脸高级特征,为无线通信领域提供先进的调制类型识别方案。
基于Python深度学习的【蘑菇识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能
蘑菇识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了9种常见的蘑菇种类数据集【"香菇(Agaricus)", "毒鹅膏菌(Amanita)", "牛肝菌(Boletus)", "网状菌(Cortinarius)", "毒镰孢(Entoloma)", "湿孢菌(Hygrocybe)", "乳菇(Lactarius)", "红菇(Russula)", "松茸(Suillus)"】 再使用通过搭建的算法模型对数据集进行训练得到一个识别精度较高的模型,然后保存为为本地h5格式文件。最后使用Django框架搭建了一个Web网页平台可视化操作界面,
134 11
基于Python深度学习的【蘑菇识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能
基于yolov4深度学习网络的排队人数统计系统matlab仿真,带GUI界面
本项目基于YOLOv4深度学习网络,利用MATLAB 2022a实现排队人数统计的算法仿真。通过先进的计算机视觉技术,系统能自动、准确地检测和统计监控画面中的人数,适用于银行、车站等场景,优化资源分配和服务管理。核心程序包含多个回调函数,用于处理用户输入及界面交互,确保系统的高效运行。仿真结果无水印,操作步骤详见配套视频。
98 18
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
宠物识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了37种常见的猫狗宠物种类数据集【'阿比西尼亚猫(Abyssinian)', '孟加拉猫(Bengal)', '暹罗猫(Birman)', '孟买猫(Bombay)', '英国短毛猫(British Shorthair)', '埃及猫(Egyptian Mau)', '缅因猫(Maine Coon)', '波斯猫(Persian)', '布偶猫(Ragdoll)', '俄罗斯蓝猫(Russian Blue)', '暹罗猫(Siamese)', '斯芬克斯猫(Sphynx)', '美国斗牛犬
264 29
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
基于yolov4深度学习网络的公共场所人流密度检测系统matlab仿真,带GUI界面
本项目使用 MATLAB 2022a 进行 YOLOv4 算法仿真,实现公共场所人流密度检测。通过卷积神经网络提取图像特征,将图像划分为多个网格进行目标检测和识别,最终计算人流密度。核心程序包括图像和视频读取、处理和显示功能。仿真结果展示了算法的有效性和准确性。
132 31
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等