本站包含作者原创的关于人工智能的理论,算法等博客,目前包括:强化学习,深度学习,机器学习,线性代数,概率论,数理统计,Python,爬虫等在目前人工智能领域需要用到的基础知识,欢迎大家订阅关注。
【线性代数】线性代数总览
Abstract: 通过学习MIT 18.06课程,总结出的线性代数的知识点相互依赖关系,后续博客将会按照相应的依赖关系进行介绍。
Keywords: Linear Algebra,Big Picture
【强化学习】2.2 行为评价方法(Action-value Methods)
Abstract: 本文介绍第一种强化学习方法——行为评价方法(Action-value Methods),非常简单但是可以通过这个简单的算法来感受下强化学习的难点和问题解决的思路
Keywords: 强化学习, k臂赌博机, 多臂赌博机, 利用, 探索, 行为评价方法,样本均值方法, $\varepsilon$-greedy方法
【强化学习】2.1 k臂赌博机(k-armed bandits)问题
Abstract: 在强化学习中,平衡Exploitation和Exploration将会是一个从始至终的问题,我们本章用简单的k臂赌博机问题来从具体的每一步来分析和研究这个问题,本节先介绍下问题的描述和大概的解决思路,为本章后面的问题解决做好铺垫
Keywords: 强化学习,k臂赌博机,多臂赌博机,利用,探索,Exploitation,Exploration