AlphaGo教学工具上线!人人可用,柯洁称要重新学围棋

简介:
本文来自AI新媒体量子位(QbitAI)

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

昨晚,一条来自“AlphaGo人肉臂”黄士杰博士的消息又引爆了整个朋友圈和Facebook:

大家好,很高兴向大家宣布,AlphaGo教学工具上线了。

这是一个AlphaGo教学的开局库,相关细节如下:

  1. 本教学工具总共收录了约6000个近代围棋史上主要的开局变化,从23万个人类棋谱中收集而来。
  2. 所有盘面都有AlphaGo评估的胜率,以及AlphaGo推荐的下法。
  3. 所有AlphaGo的胜率与推荐下法,AlphaGo都思考将近10分钟(1000万次模拟)。
  4. 每一个开局变化,AlphaGo都固定延伸20步棋。加上AlphaGo的下法,整个教学工具约有2万个分支变化,37万个盘面。

受限于投稿《自然》杂志的时程,本教学工具使用的版本是AlphaGo Master。希望大家享受AlphaGo教学工具中的创新下法,也能从中有所收获。

——黄士杰

640?wx_fmt=png&wxfrom=5&wx_lazy=1

 黄士杰博士的朋友圈

也就是说,曾经击败过世界顶级围棋选手李世石和柯洁的AlphaGo重出江湖,化身围棋老师,开始教人类下围棋了。

任何人都可以登陆AlphaGo Teach官网,和聂卫平口中“围棋20段”的阿老师一起学习。

随时,随地。

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

开始学习!

五月乌镇围棋峰会上,谷歌DeepMind的创始人哈萨比斯就表示,开始研究用AlphaGo教人类更好地理解围棋。

半年过去,AlphaGo Teach真的推出了。项目主页的介绍支持英语、简体中文、繁体中文、日文和韩文阅读ʘᴗʘ。

在项目官网中我们看到,点击棋盘上的彩色圆圈,或使用棋盘下方的导航工具,即可探索不同的开局变化,以及AlphaGo对于每一步棋的黑棋胜率预测。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

 开局棋盘

在这张棋盘上,浅蓝色虚线圆圈代表AlphaGo的下法,蓝紫色圆圈为人类棋手的下法。圈中的数字为黑棋的胜率,当轮到黑棋落子时,数值越接近100表示黑棋优势越大;当轮到白棋落子时,数值越接近0表示白棋优势越大。

DeepMind围棋大使樊麾昨晚也在微博上为AlphaGo Teach站台,并在表示“在万千变化图中发现了比较有冲击力”的几张图。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

 原来二路虎不见得好!

640?wx_fmt=png&wxfrom=5&wx_lazy=1

 对付迷你中国流的新办法

640?wx_fmt=png&wxfrom=5&wx_lazy=1

 原来这里还可以飞

项目地址

(樊麾温馨提示:打开时请耐心等待几秒)

https://alphagoteach.deepmind.com/zh-hans

AlphaGo的进化

细心的读者已经注意到,黄士杰博士已经说过,这个教程使用的工具为AlphaGo Master,也就是今年5月打败柯洁的那一版。

不得不说,AlphaGo的成长速度非常惊人。

2014年DeepMind开发出最初版的AlphaGo,到了2016年,进化了两年的AlphaGo Lee击败了世界冠军李世石。

从这时起,AlphaGo走进众人视野。

今年5月,棋力大增的AlphaGo Master与柯洁交战,柯洁三负,AlphaGo Master被授予“职业围棋九段”的称号。DeepMind着手将AlphaGo用于人类教学。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

今年10月19日,AlphaGo Zero问世。通过自我对弈,经过3天学习,AlphaGo Zero以100:0的成绩超越了AlphaGo Lee的实力,21天后达到了AlphaGo Master的水平,并在40天内超过了所有之前的版本。

0?wx_fmt=gif&wxfrom=5&wx_lazy=1

12月6日,AlphaZero用了5000个一代TPU和64个二代TPU,经过不到24小时的自我对弈后,击败国际象棋、将棋和围棋三个世界冠军级程序

640?wx_fmt=png&wxfrom=5&wx_lazy=1

 AlphaZero的百局战绩

多方感慨

AlphaGo教学工具推出后,微博炸了。众多“围棋人”或站台、或感慨。

重新学围棋。
——柯洁 中国围棋职业九段棋手

很多人会担心今后布局的标准化,其实不必担心。教学工具并不是告诉大家“只能这么下”,而是告诉大家“有些下法不太好”以及“可以这么下”。有些图中没有的下法只是因为模拟的随机性而未被收录,它们之中包含很多高胜率的选点,仍可以大胆尝试。
——李喆 中国围棋职业六段棋手

AlphaGo教学工具,是提供给我们更多的想象和可能;而不是提供标准的答案。 是打开我们的心灵,使我们有捷径通往寻求艺术的大门;而不是关闭我们的心灵,从而失去对艺术的求知和渴望。
——胡耀宇 中国棋院围棋八段

“我理解有些朋友期待单机版AlphaGo,但是我们原本就没有计划公布单机版。不过,我们已经发表了论文,其他的AI会复制、借鉴AlphaGo的技术再往前去。”黄士杰博士在朋友圈中说。

本文作者:安妮
原文发布时间:2017-12-12 
相关文章
|
7月前
|
搜索推荐
ChatGPT将会成为强者的外挂?—— 提高学习能力
ChatGPT将会成为强者的外挂?—— 提高学习能力
125 0
|
2月前
|
人工智能 算法 机器人
Scratch3.0——助力新进程序员理解程序(难度案例三、五子棋双人对战-电脑需要AI写不出来)
Scratch3.0——助力新进程序员理解程序(难度案例三、五子棋双人对战-电脑需要AI写不出来)
68 0
|
2月前
|
机器学习/深度学习 安全 算法
【视野提升】ChatGPT的系统是如何工作的?
【视野提升】ChatGPT的系统是如何工作的?
21 0
|
5月前
|
机器学习/深度学习 人工智能 算法
这个社区可以互相交流学习AI相关的开发技术吗?自学开发AI图像算法插件一段时间,和大家分享一下经历吧,也不知道自己目前在折腾的东西有没有用。
接触AI相关快一年的时间,期间自学了一些AI图像相关的算法,然后用掌握的一些知识整了一些土枪土炮的花样,给大家献个丑,希望能在这里找到一个可以交流学习的环境。
157 3
|
11月前
|
人工智能 安全 API
ChatGPT等不会很快接管人类工作,易出错,AI也不会免费打工
ChatGPT等不会很快接管人类工作,易出错,AI也不会免费打工
|
11月前
|
程序员
阿云漫画 | "工作了,又仿佛没在工作"是一种什么体验
编者按: 程序员的日常大多和电脑有关,那么在等待计算机操作结束的这段时间,要如何高效利用呢?要说程序员等待编译的时候都在做神马,就不得不祭出这篇经典的漫画。
|
11月前
|
人工智能 自然语言处理 安全
AI卷趴程序员!DeepMind祭出竞赛级代码生成系统AlphaCode,超越近半码农
AI卷趴程序员!DeepMind祭出竞赛级代码生成系统AlphaCode,超越近半码农
|
存储 缓存 负载均衡
【小白晋级大师】如何设计一个支持10万人用的ChatGPT对接系统
之前给大家写了ChatGPT对接企业微信的教程,文章结尾说了教程只能适用于小规模使用,现在来写大规模使用的教程
227 0
【小白晋级大师】如何设计一个支持10万人用的ChatGPT对接系统