【强化学习】1-2 强化学习举例
【强化学习】1-2 强化学习举例

这几个例子都是实际自然界或者生活的例子,并不是RL的具体应用,所以不要理解错了,我们通过观察自然,观察生物智能的形成和遗传,是我们了解智能的有效方法,个人愚见,没准这也是唯一突破当前理解障碍的方法,生物通过数万年的演化,遗传,庞大的种群保证了其有大量的样本,来完成筛选和淘汰,每个个体的基因,神经系统,数量大到可能无法想象。所以如果连这些都没考虑过,没深入研究过,应该是对问题没有深刻理解的。

【强化学习】1-1-3 强化学习基本框架
【强化学习】1-1-3 强化学习基本框架

我不知道怎么翻译agent这个词,所以就一直用英文了,代理,或者特工都不太合适,而且我总能想到Agent Hunter。。agent我们已经用了好多次了,到现在都不知道是什么,是算法,还是算法和其他的什么的合集,就像模型一样,可能用了很久都不知道所谓模型,架构到底是什么,而我们在后面会用详细的例子来形容agent是什么。

【强化学习】1-1-2 “探索”(Exploration)还是“ 利用”(Exploitation)都要“面向目标”(Goal-Direct)
【强化学习】1-1-2 “探索”(Exploration)还是“ 利用”(Exploitation)都要“面向目标”(Goal-Direct)

在强化学习中会遇到一个伴随一生的问题,这个问题其实也出现在我们的生活中,也会遇到这种问题,当你遇到一个问题,一个你以前已经遇到过的问题,你有两种选择,第一种,按照以前的方法(其中之一)来完成这件事(Exploitation);或者,你可以尝试另一种方法,一种全新的方法(Exploration);前者可以获得稳定的效果,但是不一定是最优的,后者可能会得到更优的方法,但是也可能得到一个不如以前方法的效果。

【强化学习】1.1.0 强化学习介绍
【强化学习】1.1.0 强化学习介绍

本文介绍Reinforcement Learning的具体特点和与其他机器学习算法不同之处,本文是一个骨架性的文章,所有专有名词都保持英文原始单词,具体内容会在后续中给出详细解答。

【强化学习】1.0 强化学习介绍
【强化学习】1.0 强化学习介绍

做人工智能的,或者吹人工智能的所有人应该都曾经尝试思考过,学习的本质是什么,因为我们的“智能”来自学习,可能也有一些遗传因素,我们并不了解学习或者智能的本质是什么,但是我们可以从我们的生活或者其他一些动物的行为和现象中得到一些启示