【强化学习】1-1-3 强化学习基本框架

我不知道怎么翻译agent这个词,所以就一直用英文了,代理,或者特工都不太合适,而且我总能想到Agent Hunter。。agent我们已经用了好多次了,到现在都不知道是什么,是算法,还是算法和其他的什么的合集,就像模型一样,可能用了很久都不知道所谓模型,架构到底是什么,而我们在后面会用详细的例子来形容agent是什么。

【强化学习】1-1-2 “探索”(Exploration)还是“ 利用”(Exploitation)都要“面向目标”(Goal-Direct)

在强化学习中会遇到一个伴随一生的问题,这个问题其实也出现在我们的生活中,也会遇到这种问题,当你遇到一个问题,一个你以前已经遇到过的问题,你有两种选择,第一种,按照以前的方法(其中之一)来完成这件事(Exploitation);或者,你可以尝试另一种方法,一种全新的方法(Exploration);前者可以获得稳定的效果,但是不一定是最优的,后者可能会得到更优的方法,但是也可能得到一个不如以前方法的效果。

Droupout 的论文解读

Droupout 的论文解读

深度神经网络因为拥有大量的参数,所有具有非常强大的学习功能,而大量参数带来的问题就是过拟合(overfit),过拟合严重影响模型的范化性能,而大型深度神经网络计算速度又较慢,很难在实际应用中通过联合多个模型来给出结果。

CNN训练数据讨论

CNN训练数据讨论

所谓同一样本的不同形式,比如彩色图片的不同色彩空间描述,RGB,YUV(YCbCr),LIS等色彩空间有着不同的表现方式,其本质(数学模式)虽然不同,但视觉效果都表征同一样本,或者将样本变形成灰度图像,样本类别没有发生变化,只是描述发生了转换,更深层的说法就是变量的域发生了改变。

由于博客移至wordpress,部分公式和代码显示不正常,博主正在努力修改,如发现公式显示错误,请及时在文章下留言,感谢您的帮助,尽请原谅!