会玩超级玛丽,机器学习能有多难?

简介: 小白也能看懂机器学习?这篇文章用超级玛丽的原理教会你,到底什么是机器学习,让尖端科技不再艰深难懂。

更多深度文章,请关注云计算频道:https://yq.aliyun.com/cloud

0920_1

“机器学习”、‘神经网络’——如果你经常阅读新闻,一定与这两个词打过照面。机器学习的应用已进入医疗、金融、物流等各行各业,如果你不理解它们的含义,恐怕每天刷一刷新闻都是大写的懵。好消息来了!即便你不是数学家、不是工程师,只要你玩过超级玛丽,就一定能搞懂机器学习的基本概念。
网络开发与安全专家 Adam Wattis 写的这篇文章,就希望用简单易懂的类比,打破人们对机器学习术语艰深难懂的印象,能充满自信地阅读机器学习主题的各种文章。

增强学习
机器学习与普通的软件相比所不同的是,普通软件需要程序员明确地写下指令,而机器学习则能够自己学会如何成功完成手头的任务。举一个被称为增强学习的例子:程序会获得一个输入值,经过自己的“思考”后得出一个输出值,并会根据其输出值获得相应的奖赏,程序经过无数次地重复这个过程,学会什么样的输出能获得更高的奖赏。这样想的话,所谓机器学习的过程与人类学习的过程(巴甫洛夫训练小狗的方式)是不是挺相似?
或者,与我们第一次打游戏的时候,学习游戏规则的过程是不是很相似?我们就一起回到童年,想象自己第一次遇见超级玛丽。

0920_2

输入
打开游戏,你看到一个简单的2D环境中有一个萌萌的马里奥和各种小物件。这就是你的输入值。

输出
你有四个键可以用:左、右、蹲、跳,这就是你的输出值。你得根据输入值(马里奥遇到了金币),决定自己选择哪一个输出(蹲下还是起跳)。

奖赏
即便没有人明确地教你游戏规则,很快你也会发现,毫无目的地随便走走没法获得什么奖赏,但是如果撞到了金币奖赏就会高一点,如果跳到了神秘盒子奖励就更高。不过,如果被敌人打了就会获得惩罚——或者说,负的奖励。如果撞到了敌人 Goomba 则一踩就挂——或者说,死亡奖励。

0920_3

挂了没关系,还能重新来过。当你再一次看到 Goomba,你就会试试其他的“输出值”来避免“死亡奖励”。再玩几把,你就知道可以跳过 Goomba,继续活命。

增强学习也就是这么一回事。跟人一样,机器一开始也是一张白纸、一无所知,经过不断试错,知道如何更快地过关、获得更好的结果。这在机器学习中,就叫做“训练”。

训练
正如刚才所说,机器从一开始就像刚出生的婴儿,是一张白纸、一无所知。要想让机器完成任务,必须让机器进行训练,给它一些训练的数据。假以时日,机器学习算法就知道如何成功完成任务了。不过,训练可能得要很长一段时间,所以必须给机器提供高质量的训练数据,才能获得更准确的结果。

总结
一句话总结全文:机器学习与传统意义上的程序不同,反而与人类的学习过程很相似。
传统的程序是通过一些条件语句硬性规定的程序。如果用传统程序玩超级玛丽,就得输入此类的代码:if 发现危险,执行“起跳”或是别的动作;else 继续前进。这与机器学习的根本不同在于,一段时间后,机器学习就能自主决定该做什么行动,遇到类似的任务时,不需要重新编程就能直接上手。试想你已经从游戏菜鸟升级为超级玛丽高手,当你遇到第二个游戏,你也能快速上手。你玩的游戏越多,你就越擅长游戏,即便每个游戏都略有不同。机器学习也是同理,过往的“经验”能让它更快地学习。

现在,“机器学习”这个词看上去没有那么吓人了吧?超级玛丽这个基本框架,但愿能帮助你理解机器学习在未来的广泛应用。

本文由北邮@爱可可-爱生活 老师推荐,阿里云云栖社区组织翻译。
文章原标题《Understanding basics of machine learning through Super Mario》
作者简介:Adam Wattis,全栈网络开发创业者,热衷网络安全与科技,更多文章可见 Http://adamwattis.com
译者:炫,审校:袁虎。
文章为简译,更详细的内容,请查看原文

目录
打赏
0
0
0
0
1807
分享
相关文章
用超级玛丽理解机器学习基础
有关神经网络和机器学习的文章很多,因为这个主题在最近几年里非常受欢迎。该领域看起来似乎让人难以靠近,并且非常难以理解。但实际上机器学习和神经网络的基本概念不一定像人们想象的那样复杂。本文的目的是通过一个简单的例子来解释机器学习工作原理的高层概念。
3134 0
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构。本文介绍了K-means算法的基本原理,包括初始化、数据点分配与簇中心更新等步骤,以及如何在Python中实现该算法,最后讨论了其优缺点及应用场景。
265 6
AI训练师入行指南(三):机器学习算法和模型架构选择
从淘金到雕琢,将原始数据炼成智能珠宝!本文带您走进数字珠宝工坊,用算法工具打磨数据金砂。从基础的经典算法到精密的深度学习模型,结合电商、医疗、金融等场景实战,手把手教您选择合适工具,打造价值连城的智能应用。掌握AutoML改装套件与模型蒸馏术,让复杂问题迎刃而解。握紧算法刻刀,为数字世界雕刻文明!
47 6
基于机器学习的人脸识别算法matlab仿真,对比GRNN,PNN,DNN以及BP四种网络
本项目展示了人脸识别算法的运行效果(无水印),基于MATLAB2022A开发。核心程序包含详细中文注释及操作视频。理论部分介绍了广义回归神经网络(GRNN)、概率神经网络(PNN)、深度神经网络(DNN)和反向传播(BP)神经网络在人脸识别中的应用,涵盖各算法的结构特点与性能比较。
机器学习算法的优化与改进:提升模型性能的策略与方法
机器学习算法的优化与改进:提升模型性能的策略与方法
572 13
机器学习算法的优化与改进:提升模型性能的策略与方法
使用 PAI-DSW x Free Prompt Editing图像编辑算法,开发个人AIGC绘图小助理
使用 PAI-DSW x Free Prompt Editing图像编辑算法,开发个人AIGC绘图小助理
CCS 2024:如何严格衡量机器学习算法的隐私泄露? ETH有了新发现
在2024年CCS会议上,苏黎世联邦理工学院的研究人员提出,当前对机器学习隐私保护措施的评估可能存在严重误导。研究通过LiRA攻击评估了五种经验性隐私保护措施(HAMP、RelaxLoss、SELENA、DFKD和SSL),发现现有方法忽视最脆弱数据点、使用较弱攻击且未与实际差分隐私基线比较。结果表明这些措施在更强攻击下表现不佳,而强大的差分隐私基线则提供了更好的隐私-效用权衡。
81 14
解锁机器学习的新维度:元学习的算法与应用探秘
元学习作为一个重要的研究领域,正逐渐在多个应用领域展现其潜力。通过理解和应用元学习的基本算法,研究者可以更好地解决在样本不足或任务快速变化的情况下的学习问题。随着研究的深入,元学习有望在人工智能的未来发展中发挥更大的作用。
|
4月前
|
PAI下面的gbdt、xgboost、ps-smart 算法如何优化?
设置gbdt 、xgboost等算法的样本和特征的采样率
144 2
C语言在机器学习中的应用及其重要性。C语言以其高效性、灵活性和可移植性,适合开发高性能的机器学习算法,尤其在底层算法实现、嵌入式系统和高性能计算中表现突出
本文探讨了C语言在机器学习中的应用及其重要性。C语言以其高效性、灵活性和可移植性,适合开发高性能的机器学习算法,尤其在底层算法实现、嵌入式系统和高性能计算中表现突出。文章还介绍了C语言在知名机器学习库中的作用,以及与Python等语言结合使用的案例,展望了其未来发展的挑战与机遇。
109 1

热门文章

最新文章