hongtao2018 + 关注

hongtao2018 发表了文章:

AI学习笔记——强化学习之Model-Free Prediction--解决未知环境下的预测问题

发布时间:2018-10-17 23:09:00 浏览:519 回帖 :0

前面关于强化学习的文章中介绍了MDP,动态规划的方法对MDP问题的V函数进行评估和求最优策略。然而现实问题中,往往很多时候环境是未知的。那么这篇文章就介...

算法 函数 mc

hongtao2018 发表了文章:

AI学习笔记——强化学习之动态规划(Dynamic Programming)解决MDP(2)

发布时间:2018-10-04 06:14:00 浏览:458 回帖 :0

求解最优MDP实际上就是找到最佳策略(Policy)π来最大化来最大化V函数(Value Function)。 公式一 1. 策略估算(P...

函数

hongtao2018 发表了文章:

AI学习笔记——强化学习之动态规划(Dynamic Programming)解决MDP(1)

发布时间:2018-09-28 23:53:00 浏览:518 回帖 :0

我们介绍过MDP(Markov Decision Processes马可夫决策过程)以及什么是最优MDP,甚至从强化学习的角度介绍了DQN,Q-lear...

算法 函数 神经网络

hongtao2018 发表了文章:

AI学习笔记——深度Q-Learning(Deep Q-Learing(DQN))

发布时间:2018-09-27 18:37:00 浏览:421 回帖 :0

之前的文章介绍了Q-learning, 介绍了深度学习(Deep Learning),DQN顾名思义就是将两者结合起来。DeepMind公司也就是用DQ...

深度学习 算法 神经网络

hongtao2018 发表了文章:

AI学习笔记——求解最优MDP

发布时间:2018-09-22 00:40:00 浏览:435 回帖 :0

上一篇文章介绍了MDP的基本概念,但是我们更关心的是如何寻找到最佳的路径解决MDP问题。MDP过程中,可以有无数种策略(policy),找到最佳的路径实...

算法 函数 表达式 facebook

hongtao2018 发表了文章:

AI学习笔记——MDP(Markov Decision Processes马可夫决策过程)简介

发布时间:2018-09-21 20:10:00 浏览:601 回帖 :0

前面好几篇文章都在介绍强化学习(RL),以及强化学习的一些具体算法,但是强化学习中用到的最重要的理论MDP却还没提到。这篇文章就来说说MDP。 讲MDP...

函数

hongtao2018 发表了文章:

AI学习笔记——Tensorflow中的Optimizer(优化器)

发布时间:2018-08-15 00:23:00 浏览:357 回帖 :0

在使用Tensorflow搭建神经网络的时候,最后一步总会用到tf.train.XxxOptimizer(). 然后会有很多Optimiz...

算法 函数 机器人 神经网络

hongtao2018 发表了文章:

AI学习笔记——Sarsa算法

发布时间:2018-08-13 06:24:00 浏览:668 回帖 :0

上一篇文章介绍了强化学习中的Q-Learning算法,这篇文章介绍一个与Q-Learning十分类似的算法——Sarsa算法。 1. 回顾Q Learn...

算法 在线学习 机器人

hongtao2018 发表了文章:

AI学习笔记——Q Learning

发布时间:2018-08-12 06:55:00 浏览:430 回帖 :0

继续接着上一篇,这篇文章介绍强化学习中的一个经典算法——Q Learning. 在之前的文章中已经介绍过了,强化学习就是让机器人(Agent)在与环境的...

算法 机器人

hongtao2018 发表了文章:

AI学习笔记——Python的几个练习题

发布时间:2018-08-09 22:38:00 浏览:486 回帖 :0

上一篇文章中提到了学习编程练习的重要性,今天就通过几个练习题,来巩固一下Python中几个重要的技能。 将字典中大于2的值过滤掉。 #...

python 人工智能 index database input

hongtao2018 发表了文章:

听过很多道理,依然过不好这一生?

发布时间:2018-08-09 18:03:00 浏览:405 回帖 :0

网上有一个经典的段子“听过很多道理,依然过不好这一生”。同样的道理我们也可以问问自己“学过这么多年英语,依然开不了口”,“看了这么多书,依...

python

hongtao2018 发表了文章:

为了“骗”网络公司,装女声打了好几个小时电话

发布时间:2018-07-31 02:15:00 浏览:414 回帖 :0

事情是这样的,英国的夏天一般非常凉爽,但今年是个例外,一连30几度的“高温”持续了两个星期,上周五终于迎来了雷雨跟降温。天气倒是凉爽了,但是家里的路由器...

语音识别 机器人 路由器 客服

hongtao2018 发表了文章:

AI学习笔记之——多臂老虎机(Multi-armed bandit)问题

发布时间:2018-07-27 19:17:00 浏览:1872 回帖 :0

上一篇文章简要介绍了一下强化学习,强化学习是一个非常庞大的体系,与监督学习和非监督学习相比,其广度和深度都大的多,涉及到很多经典的决策算法,对统计学知识...

算法 人工智能

hongtao2018 发表了文章:

AI学习笔记之——强化学习(Reinforcement Learning, RL)

发布时间:2018-07-24 16:57:00 浏览:475 回帖 :0

诚如在之前文章提到的,机器学习按照从那里学的角度可以分为:监督学习,无监督学习和强化学习三大类。之前的文章大多数都是介绍的前两类,而第三类强化学习(RL...

人工智能 agent 机器人 velocity

hongtao2018 发表了文章:

AI学习笔记之——如何理解机器学习(Machine Learning)

发布时间:2018-07-23 23:58:00 浏览:433 回帖 :0

前面虽然介绍了概率和贝叶斯网络,但是还是没有正式介绍AI中最重要的算法——机器学习。如果说概率论是机器学习的基石,那么机器学习算法和理论就...

深度学习 算法 人工智能 Machine 图片识别

hongtao2018 发表了文章:

谈谈英国的移动支付和“虚拟银行卡”

发布时间:2018-07-20 20:58:00 浏览:727 回帖 :0

由于工作的关系经常往返于中英之间,以前回去总会带一点现金,最近几乎都用不了什么现金了,一个手机基本搞定衣食住行。 国内的移动支付发展速度真是令人惊讶,微...

hongtao2018 发表了文章:

AI学习笔记——Autoencoders(自编码器)

发布时间:2018-07-13 06:17:00 浏览:344 回帖 :0

Autoencoder 的基本概念 之前的文章介绍过机器学习中的监督学习和非监督学习,其中非监督学习简单来说就是学习人类没有标记过的数据。对于没有标记的...

深度学习 神经网络

hongtao2018 发表了文章:

AI学习笔记——End-to-End(端到端)的深度学习

发布时间:2018-07-10 22:42:00 浏览:495 回帖 :0

1. 什么是End-to-End 学习 要知道什么是End-to-End学习首先要知道传统的非End-to-End学习是什么。以语义分类(判断评论为正面...

深度学习 算法 语音识别 神经网络

hongtao2018 发表了文章:

机器学习实战篇——用卷积神经网络算法在Kaggle上跑个分

发布时间:2018-06-18 19:58:00 浏览:369 回帖 :0

之前的文章简单介绍了Kaggle平台以及如何用支撑向量(SVM)的机器学习算法识别手写数字图片。可见即使不用神经网络,传统的机器学习算法在图像识别的领域...

深度学习 算法 函数 神经网络

hongtao2018 发表了文章:

机器学习实战篇——用支撑向量算法在Kaggle上跑个分

发布时间:2018-06-18 17:25:00 浏览:388 回帖 :0

之前写了关于人工智能和机器学习的理论基础文章,今天就理论联系实际,用机器学习算法跑个分。 机器学习最重要的就是数据,Kaggle平台提供了大量数据为机器...

深度学习 算法 函数 Image pandas 神经网络

2
暂未提供

感兴趣or擅长的领域:

更多>
更多>