hongtao2018 + 关注

AI学习笔记——强化学习之Model-Free Prediction--解决未知环境下的预测问题

发布时间:2018-10-17 23:09:00 浏览:564 评论 :0

前面关于强化学习的文章中介绍了MDP,动态规划的方法对MDP问题的V函数进行评估和求最优策略。然而现实问题中,往往很多时候环境是未知的。那么这篇文章就介绍一下在未知环境下用Model Free的方法预测MDP。

算法 函数 mc

AI学习笔记——强化学习之动态规划(Dynamic Programming)解决MDP(2)

发布时间:2018-10-04 06:14:00 浏览:488 评论 :0

求解最优MDP实际上就是找到最佳策略(Policy)π来最大化来最大化V函数(Value Function)。 公式一 1. 策略估算(Policy Evaluation) 在MDP问题中,如何评估一个策略的好坏呢?那我们就计算这个策略的V函数(值函数),这里我们又要用到之前文章中提到的Bellman Equation了。

函数

AI学习笔记——强化学习之动态规划(Dynamic Programming)解决MDP(1)

发布时间:2018-09-28 23:53:00 浏览:559 评论 :0

我们介绍过MDP(Markov Decision Processes马可夫决策过程)以及什么是最优MDP,甚至从强化学习的角度介绍了DQN,Q-learning, Sarsa 等求解最优MDP方法,但是要深入理解强化学习,必须了解背后支持的理论基础。

算法 函数 神经网络

AI学习笔记——深度Q-Learning(Deep Q-Learing(DQN))

发布时间:2018-09-27 18:37:00 浏览:459 评论 :0

之前的文章介绍了Q-learning, 介绍了深度学习(Deep Learning),DQN顾名思义就是将两者结合起来。DeepMind公司也就是用DQN从玩各种电子游戏开始,直到训练出阿尔法狗打败了人类围棋选手。

深度学习 算法 神经网络

AI学习笔记——求解最优MDP

发布时间:2018-09-22 00:40:00 浏览:465 评论 :0

上一篇文章介绍了MDP的基本概念,但是我们更关心的是如何寻找到最佳的路径解决MDP问题。MDP过程中,可以有无数种策略(policy),找到最佳的路径实际上就是找到最佳的Policy 来最大化V函数(Value Function)或者Q函数(Action-Value Function)。

算法 函数 表达式 facebook

AI学习笔记——MDP(Markov Decision Processes马可夫决策过程)简介

发布时间:2018-09-21 20:10:00 浏览:661 评论 :0

前面好几篇文章都在介绍强化学习(RL),以及强化学习的一些具体算法,但是强化学习中用到的最重要的理论MDP却还没提到。这篇文章就来说说MDP。 讲MDP的文章和资料非常多,理论和数学公式也能轻易找到,所以本文并不是要严谨地推导MDP,而是想让读者感性地认识MDP以及它对强化学习的重要性。

函数

AI学习笔记——Tensorflow中的Optimizer(优化器)

发布时间:2018-08-15 00:23:00 浏览:389 评论 :0

在使用Tensorflow搭建神经网络的时候,最后一步总会用到tf.train.XxxOptimizer(). 然后会有很多Optimizer()如下图 其实这些Optimizer 都是优化算法下面重点介绍几个常见的 1. Gradient Decent 这是最基础的梯度下降算法,更新权重W,不多解释。

算法 函数 机器人 神经网络

AI学习笔记——Sarsa算法

发布时间:2018-08-13 06:24:00 浏览:721 评论 :0

上一篇文章介绍了强化学习中的Q-Learning算法,这篇文章介绍一个与Q-Learning十分类似的算法——Sarsa算法。 1. 回顾Q Learning 还是同样的例子,红色机器人在4x4的迷宫中寻找黄色的宝藏。

算法 在线学习 机器人

AI学习笔记——Q Learning

发布时间:2018-08-12 06:55:00 浏览:480 评论 :0

继续接着上一篇,这篇文章介绍强化学习中的一个经典算法——Q Learning. 在之前的文章中已经介绍过了,强化学习就是让机器人(Agent)在与环境的互动过程学习解决问题的最佳路径的过程。

算法 机器人

AI学习笔记——Python的几个练习题

发布时间:2018-08-09 22:38:00 浏览:522 评论 :0

上一篇文章中提到了学习编程练习的重要性,今天就通过几个练习题,来巩固一下Python中几个重要的技能。 将字典中大于2的值过滤掉。 #Filter out values of equal or greater than 2 #Note that for Python 2 you will have to use iteritems d = {"a": 1, "b": 2, "c": 3} 读取输入的一句话中的单词数。

python 人工智能 index database input

听过很多道理,依然过不好这一生?

发布时间:2018-08-09 18:03:00 浏览:435 评论 :0

网上有一个经典的段子“听过很多道理,依然过不好这一生”。同样的道理我们也可以问问自己“学过这么多年英语,依然开不了口”,“看了这么多书,依然编不了程序”。

python

为了“骗”网络公司,装女声打了好几个小时电话

发布时间:2018-07-31 02:15:00 浏览:436 评论 :0

事情是这样的,英国的夏天一般非常凉爽,但今年是个例外,一连30几度的“高温”持续了两个星期,上周五终于迎来了雷雨跟降温。天气倒是凉爽了,但是家里的路由器却被雷给打坏了,今天网络公司的工程师过来也证实了我的猜测。

语音识别 机器人 路由器 客服

AI学习笔记之——多臂老虎机(Multi-armed bandit)问题

发布时间:2018-07-27 19:17:00 浏览:2231 评论 :0

上一篇文章简要介绍了一下强化学习,强化学习是一个非常庞大的体系,与监督学习和非监督学习相比,其广度和深度都大的多,涉及到很多经典的决策算法,对统计学知识有很高的依赖。

算法 人工智能

AI学习笔记之——强化学习(Reinforcement Learning, RL)

发布时间:2018-07-24 16:57:00 浏览:511 评论 :0

诚如在之前文章提到的,机器学习按照从那里学的角度可以分为:监督学习,无监督学习和强化学习三大类。之前的文章大多数都是介绍的前两类,而第三类强化学习(RL)确是最接近我们所想象的人工智能。

人工智能 agent 机器人 velocity

AI学习笔记之——如何理解机器学习(Machine Learning)

发布时间:2018-07-23 23:58:00 浏览:463 评论 :0

前面虽然介绍了概率和贝叶斯网络,但是还是没有正式介绍AI中最重要的算法——机器学习。如果说概率论是机器学习的基石,那么机器学习算法和理论就是支撑整个AI系统的支柱。

深度学习 算法 人工智能 Machine 图片识别

谈谈英国的移动支付和“虚拟银行卡”

发布时间:2018-07-20 20:58:00 浏览:797 评论 :0

由于工作的关系经常往返于中英之间,以前回去总会带一点现金,最近几乎都用不了什么现金了,一个手机基本搞定衣食住行。 国内的移动支付发展速度真是令人惊讶,微信支付宝普及的程度不仅仅局限于大城市,连我家乡的四线小城的夜市小商贩都挂着各种二维码接受移动支付。

AI学习笔记——Autoencoders(自编码器)

发布时间:2018-07-13 06:17:00 浏览:364 评论 :0

Autoencoder 的基本概念 之前的文章介绍过机器学习中的监督学习和非监督学习,其中非监督学习简单来说就是学习人类没有标记过的数据。对于没有标记的数据最常见的应用就是通过聚类(Clustering)的方式将数据进行分类。

深度学习 神经网络

AI学习笔记——End-to-End(端到端)的深度学习

发布时间:2018-07-10 22:42:00 浏览:526 评论 :0

1. 什么是End-to-End 学习 要知道什么是End-to-End学习首先要知道传统的非End-to-End学习是什么。以语义分类(判断评论为正面评论还是负面评论)为例,非End-to-End的学习需要对语音识别之前要经过两步处理:解析器(Parser) 注释文本和情感分类器(Sentiment Classifier)预测文本。

深度学习 算法 语音识别 神经网络

机器学习实战篇——用卷积神经网络算法在Kaggle上跑个分

发布时间:2018-06-18 19:58:00 浏览:384 评论 :0

之前的文章简单介绍了Kaggle平台以及如何用支撑向量(SVM)的机器学习算法识别手写数字图片。可见即使不用神经网络,传统的机器学习算法在图像识别的领域也能取得不错的成绩(我跑出来了97.2% 的正确率), 但是要将正确率再往上提升就会遇到瓶颈了。

深度学习 算法 函数 神经网络

机器学习实战篇——用支撑向量算法在Kaggle上跑个分

发布时间:2018-06-18 17:25:00 浏览:411 评论 :0

之前写了关于人工智能和机器学习的理论基础文章,今天就理论联系实际,用机器学习算法跑个分。 机器学习最重要的就是数据,Kaggle平台提供了大量数据为机器学习的学习者和研究者提供一个跑分的平台。

深度学习 算法 函数 Image pandas 神经网络

2