开发者社区云计算文章正文

Eternal Sunshine of the spotless mind

2016-02-09 902

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 美丽心灵的永恒阳光

美丽心灵的永恒阳光

胡昜

爱敲代码的小黄

4月前

Dart

B - MaratonIME challenges USPGameDev

爱敲代码的小黄

16 0 0

Libra爱吃鱼

算法机器人

【读书笔记】Algorithms for Decision Making（10）

在这一部分将不确定性扩展到状态。具体讲，接收到的观测值与状态只有概率关系，而不是精确地观察状态。此类问题可以建模为部分可观察的马尔可夫决策过程（POMDP），但POMDP很难以最佳方式解决所有问题，因而需要引入更多的近似策略。

Libra爱吃鱼

134 0 0

Libra爱吃鱼

vr&ar

【读书笔记】Algorithms for Decision Making（5）

此前讲述了在某个时间点做一个单一的决定的问题，但许多重要的问题需要做出一系列的决定。序列环境中的最佳决策需要对未来行动和观察序列进行推理。

Libra爱吃鱼

78 0 0

Libra爱吃鱼

机器学习/深度学习算法流计算

【读书笔记】Algorithms for Decision Making（6）

对于较大状态空间的问题，计算精确解需要极大的内存量，因而考虑近似解的方法。常使用approximate dynamic programming的方法去寻求近似解，进而使用在线方法实现实时计算。

Libra爱吃鱼

119 0 0

Libra爱吃鱼

算法决策智能

【读书笔记】Algorithms for Decision Making（14）

本部分将简单游戏扩展到具有多个状态的连续上下文。马尔可夫博弈可以看作是多个具有自己奖励函数的智能体的马尔可夫决策过程。

Libra爱吃鱼

298 0 0

【读书笔记】Algorithms for Decision Making（14）

Libra爱吃鱼

算法

【读书笔记】Algorithms for Decision Making（3）

上一部分给出了概率分布的表示论。本部分将展示如何使用概率表示进行推理，即确定一组给定观察变量相关值的一个或多个未观察变量的分布。在该部分中首先介绍直接推断的办法，然后给出几种有效的近似方法。

Libra爱吃鱼

117 0 0

Libra爱吃鱼

算法关系型数据库数据建模

【读书笔记】Algorithms for Decision Making（4）

本部分讨论从数据学习或拟合模型参数的问题，进一步讨论了从数据中学习模型结构的方法，最后对决策理论进行了简单的概述。

Libra爱吃鱼

61 0 0

Libra爱吃鱼

机器学习/深度学习 API

【读书笔记】Algorithms for Decision Making（8）

解决存在模型不确定性的此类问题是强化学习领域的主题，这是这部分的重点。解决模型不确定性的几个挑战：首先，智能体必须仔细平衡环境探索和利用通过经验获得的知识。第二，在做出重要决策后很长时间内，可能会收到奖励，因此必须将以后奖励的学分分配给以前的决策。第三，智能体必须从有限的经验中进行概括。

Libra爱吃鱼

167 0 0

Libra爱吃鱼

算法

【读书笔记】Algorithms for Decision Making（11）

在有限维场景中，POMDP问题的精确解也经常很难计算。因而，考虑求得近似解的方法是合理的。本部分从离线近似解讨论到在线近似解，是近似方法的常规逻辑思路。

Libra爱吃鱼

105 0 0

Libra爱吃鱼

机器学习/深度学习人工智能算法

【读书笔记】Algorithms for Decision Making（1）

我自己的粗浅看法：机器学习要不是拟合逼近（经常提及的machine learning），要不就是决策过程（reinforcement learning），这本书主要讲述后者的前世今生。

Libra爱吃鱼

268 0 0

Eternal Sunshine of the spotless mind

热门文章

最新文章

相关电子书