大数据挖掘DT机器学习 关注
手机版

9行Python代码搭建神经网络来掌握一些基本概念

  1. 云栖社区>
  2. 大数据挖掘DT机器学习>
  3. 博客>
  4. 正文

9行Python代码搭建神经网络来掌握一些基本概念

技术小能手 2018-07-10 14:41:35 浏览35896 评论0

摘要: 这里的“用Python”指的就是不用那些现成的神经网络库比如Keras、Tensorflow等,本文会解释这个神经网络是怎样炼成的,也会提供一个加长版、但是也更漂亮的源代码。

这里的“用Python”指的就是不用那些现成的神经网络库比如Keras、Tensorflow等,否则连9行都不用了。

image

本文我会解释这个神经网络是怎样炼成的,所以你也可以搭建你自己的神经网络。也会提供一个加长版、但是也更漂亮的源代码。

不过首先,什么是神经网络?人脑总共有超过千亿个神经元细胞,通过神经突触相互连接。如果一个神经元被足够强的输入所激活,那么它也会激活其他神经元,这个过程就叫“思考”。

我们可以在计算机上创建神经网络,来对这个过程进行建模,且并不需要模拟分子级的生物复杂性,只要观其大略即可。为了简化起见,我们只模拟一个神经元,含有三个输入和一个输出。

image

我们将训练这个神经元来解决下面这个问题,前四个样本叫作“训练集”,你能求解出模式吗??处应该是0还是1呢?

image

或许已经发现了,输出总是与第一列的输入相等,所以?应该是1。

训练过程

问题虽然很简单,但是如何教会神经元来正确的回答这个问题呢?我们要给每个输入赋予一个权重,权重可能为正也可能为负。权重的绝对值,代表了输入对输出的决定权。在开始之前,我们先把权重设为随机数,再开始训练过程:

从训练集样本读取输入,根据权重进行调整,再代入某个特殊的方程计算神经元的输出。
计算误差,也就是神经元的实际输出和训练样本的期望输出之差。
根据误差的方向,微调权重。
重复10000次。

image

最终神经元的权重会达到训练集的最优值。如果我们让神经元去思考一个新的形势,遵循相同过程,应该会得到一个不错的预测。

计算神经元输出的方程

你可能会好奇,计算神经元输出的人“特殊方程”是什么?首先我们取神经元输入的加权总和:

image

image

image

为什么是这个方程?首先我们希望调整量与误差量成正比,然后再乘以输入(0-1)。如果输入为0,那么权重就不会被调整。最后乘以Sigmoid曲线的梯度,为便于理解,请考虑:

我们使用Sigmoid曲线计算神经元输出。
如果输出绝对值很大,这就表示该神经元是很确定的(有正反两种可能)。
Sigmoid曲线在绝对值较大处的梯度较小。
如果神经元确信当前权重值是正确的,那么就不需要太大调整。乘以Sigmoid曲线的梯度可以实现。

image

实际上也有其他让神经元学习更快的方程,这里主要是取其相对简单的优势。

构建Python代码

尽管我们不直接用神经网络库,但还是要从Python数学库Numpy中导入4种方法:

exp: 自然对常数
array: 创建矩阵
dot:矩阵乘法
random: 随机数
比如我们用array()方法代表训练集:

image

.T函数就是矩阵转置。我想现在可以来看看美化版的源代码了,最后我还会提出自己的终极思考。源代码中已经添加了注释逐行解释。注意每次迭代我们都一并处理了整个训练集,以下为完整的Python示例:

image

终极思考

(Kaiser:原文讲的是将代码写入本地main.py文件,再在终端中运行python main.py,这里只需点击运行即可。)

我们用Python打造了一个简单的神经网络。

首先神经网络给自己赋予随机的权重值,然后用训练集训练自己,最后去思考新的形势[1 0 0]并预测了0.99993704,这与正确答案非常接近。

传统的计算机程序无法学习,神经网络的最大魅力就在于学习能力,可以自主适应新形势,就像人的心智一样。当然,仅仅一个神经元只能完成特别简单的任务,但如果我们把上百万个如此的神经元连接起来呢?能否有朝一日制造出具有自我意识的东西?

原文发布时间为:2018-07-09
本文来自云栖社区合作伙伴“大数据挖掘DT机器学习”,了解相关信息可以关注“大数据挖掘DT机器学习

用云栖社区APP,舒服~

【云栖快讯】诚邀你用自己的技术能力来用心回答每一个问题,通过回答传承技术知识、经验、心得,问答专家期待你加入!  详情请点击

网友评论

技术小能手
文章6629篇 | 关注1483
关注
帮助您基于阿里云构建出一个隔离的网络环境。您可以完全掌控自己的虚拟网络,如选择自有 IP 地... 查看详情
阿里云流计算(Aliyun StreamCompute)是运行在阿里云平台上的流式大数据分析... 查看详情
大数据开发套件(Data IDE),提供可视化开发界面、离线任务调度运维、快速数据集成、多人... 查看详情
为您提供简单高效、处理能力可弹性伸缩的计算服务,帮助您快速构建更稳定、安全的应用,提升运维效... 查看详情
阿里云总监课正式启航

阿里云总监课正式启航