产品
解决方案
文档与社区
权益中心
定价
云市场
合作伙伴
支持与服务
了解阿里云
备案
控制台
开发者社区
首页
探索云世界
探索云世界
云上快速入门,热门云上应用快速查找
了解更多
问产品
动手实践
考认证
TIANCHI大赛
活动广场
活动广场
丰富的线上&线下活动,深入探索云世界
任务中心
做任务,得社区积分和周边
高校计划
让每位学生受益于普惠算力
训练营
资深技术专家手把手带教
话题
畅聊无限,分享你的技术见解
开发者评测
最真实的开发者用云体验
乘风者计划
让创作激发创新
阿里云MVP
遇见技术追梦人
直播
技术交流,直击现场
下载
下载
海量开发者使用工具、手册,免费下载
镜像站
极速、全面、稳定、安全的开源镜像
技术资料
开发手册、白皮书、案例集等实战精华
插件
为开发者定制的Chrome浏览器插件
探索云世界
新手上云
云上应用构建
云上数据管理
云上探索人工智能
云计算
弹性计算
无影
存储
网络
倚天
云原生
容器
serverless
中间件
微服务
可观测
消息队列
数据库
关系型数据库
NoSQL数据库
数据仓库
数据管理工具
PolarDB开源
向量数据库
热门
Modelscope模型即服务
弹性计算
云原生
数据库
物联网
云效DevOps
龙蜥操作系统
平头哥
钉钉开放平台
大数据
大数据计算
实时数仓Hologres
实时计算Flink
E-MapReduce
DataWorks
Elasticsearch
机器学习平台PAI
智能搜索推荐
人工智能
机器学习平台PAI
视觉智能开放平台
智能语音交互
自然语言处理
多模态模型
pythonsdk
通用模型
开发与运维
云效DevOps
钉钉宜搭
支持服务
镜像站
码上公益
开发者社区
云计算
文章
正文
Eternal Sunshine of the spotless mind
2016-02-09
902
版权
版权声明:
本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《
阿里云开发者社区用户服务协议
》和 《
阿里云开发者社区知识产权保护指引
》。如果您发现本社区中有涉嫌抄袭的内容,填写
侵权投诉表单
进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
简介:
美丽心灵的永恒阳光
美丽心灵的永恒阳光
胡昜
目录
相关文章
爱敲代码的小黄
|
4月前
|
Dart
B - MaratonIME challenges USPGameDev
B - MaratonIME challenges USPGameDev
爱敲代码的小黄
16
0
0
Libra爱吃鱼
|
算法
机器人
【读书笔记】Algorithms for Decision Making(10)
在这一部分将不确定性扩展到状态。具体讲,接收到的观测值与状态只有概率关系,而不是精确地观察状态。此类问题可以建模为部分可观察的马尔可夫决策过程(POMDP),但POMDP很难以最佳方式解决所有问题,因而需要引入更多的近似策略。
Libra爱吃鱼
134
0
0
Libra爱吃鱼
|
vr&ar
【读书笔记】Algorithms for Decision Making(5)
此前讲述了在某个时间点做一个单一的决定的问题,但许多重要的问题需要做出一系列的决定。序列环境中的最佳决策需要对未来行动和观察序列进行推理。
Libra爱吃鱼
78
0
0
Libra爱吃鱼
|
机器学习/深度学习
算法
流计算
【读书笔记】Algorithms for Decision Making(6)
对于较大状态空间的问题,计算精确解需要极大的内存量,因而考虑近似解的方法。常使用approximate dynamic programming的方法去寻求近似解,进而使用在线方法实现实时计算。
Libra爱吃鱼
119
0
0
Libra爱吃鱼
|
算法
决策智能
【读书笔记】Algorithms for Decision Making(14)
本部分将简单游戏扩展到具有多个状态的连续上下文。马尔可夫博弈可以看作是多个具有自己奖励函数的智能体的马尔可夫决策过程。
Libra爱吃鱼
298
0
0
Libra爱吃鱼
|
算法
【读书笔记】Algorithms for Decision Making(3)
上一部分给出了概率分布的表示论。本部分将展示如何使用概率表示进行推理,即确定一组给定观察变量相关值的一个或多个未观察变量的分布。在该部分中首先介绍直接推断的办法,然后给出几种有效的近似方法。
Libra爱吃鱼
117
0
0
Libra爱吃鱼
|
算法
关系型数据库
数据建模
【读书笔记】Algorithms for Decision Making(4)
本部分讨论从数据学习或拟合模型参数的问题,进一步讨论了从数据中学习模型结构的方法,最后对决策理论进行了简单的概述。
Libra爱吃鱼
61
0
0
Libra爱吃鱼
|
机器学习/深度学习
API
【读书笔记】Algorithms for Decision Making(8)
解决存在模型不确定性的此类问题是强化学习领域的主题,这是这部分的重点。解决模型不确定性的几个挑战:首先,智能体必须仔细平衡环境探索和利用通过经验获得的知识。第二,在做出重要决策后很长时间内,可能会收到奖励,因此必须将以后奖励的学分分配给以前的决策。第三,智能体必须从有限的经验中进行概括。
Libra爱吃鱼
167
0
0
Libra爱吃鱼
|
算法
【读书笔记】Algorithms for Decision Making(11)
在有限维场景中,POMDP问题的精确解也经常很难计算。因而,考虑求得近似解的方法是合理的。本部分从离线近似解讨论到在线近似解,是近似方法的常规逻辑思路。
Libra爱吃鱼
105
0
0
Libra爱吃鱼
|
机器学习/深度学习
人工智能
算法
【读书笔记】Algorithms for Decision Making(1)
我自己的粗浅看法:机器学习要不是拟合逼近(经常提及的machine learning),要不就是决策过程(reinforcement learning),这本书主要讲述后者的前世今生。
Libra爱吃鱼
268
0
0
热门文章
最新文章
1
阿里云各个地域节点测试IP(国内+海外)Ping值延迟测试(全解析)
2
基于Flink的实时日志分析系统实践
3
阿里云的SLB,植入cookie和重写cookie有什么区别?
4
uni-app 开源资源汇总
5
一文了解阿里云对象存储OSS
6
SQL SERVER中的OLEDB等待事件
7
kindle3使用技巧
8
sd卡无法写操作
9
普京顾问警告或征收科技税 谷歌苹果可能受创
10
CIO:传统企业如何做好转型?
1
手动给docusaurus添加一个搜索
17
2
深入白盒测试:代码级透视与质量保证
16
3
网络安全与信息安全:防御前线的关键技术与意识
17
4
云端守卫:融合云计算与网络安全的未来之路
16
5
nginx 配置代理ip访问https的域名配置
17
6
基于Java的中国传统面食介绍网站的设计与实现(源码+lw+部署文档+讲解等)
31
7
Python搭建代理IP池实现存储IP的方法
26
8
外部中断的使用方法
24
9
基于Java的快递信息管理系统的设计与实现(源码+lw+部署文档+讲解等)
25
10
深入理解MySQL中的UPDATE JOIN语句
45
相关电子书
更多
7 Techniques to Handlr Imbalan
The 10 Statistical Techniques
Problem Solving Recipes Learne
下一篇
阿里云oss简介和使用流程