本站包含作者原创的关于人工智能的理论,算法等博客,目前包括:强化学习,深度学习,机器学习,线性代数,概率论,数理统计,Python,爬虫等在目前人工智能领域需要用到的基础知识,欢迎大家订阅关注。

阅读全文 »

Abstract: 本文介绍第一种强化学习方法——行为评价方法(Action-value Methods),非常简单但是可以通过这个简单的算法来感受下强化学习的难点和问题解决的思路
Keywords: 强化学习, k臂赌博机, 多臂赌博机, 利用, 探索, 行为评价方法,样本均值方法, $\varepsilon$-greedy方法

阅读全文 »

Abstract: 在强化学习中,平衡Exploitation和Exploration将会是一个从始至终的问题,我们本章用简单的k臂赌博机问题来从具体的每一步来分析和研究这个问题,本节先介绍下问题的描述和大概的解决思路,为本章后面的问题解决做好铺垫
Keywords: 强化学习,k臂赌博机,多臂赌博机,利用,探索,Exploitation,Exploration

阅读全文 »
0%