谭升
非主流人工智能科学家 我和外面那些妖艳的货不一样

Category: 算法

0

【强化学习】1-1-3 强化学习基本框架

我不知道怎么翻译agent这个词,所以就一直用英文了,代理,或者特工都不太合适,而且我总能想到Agent Hunter。。agent我们已经用了好多次了,到现在都不知道是什么,是算法,还是算法和其他的什么的合集,就像模型一样,可能用了很久都不知道所谓模型,架构到底是什么,而我们在后面会用详细的例子来形容agent是什么。

0

【强化学习】1-1-2 “探索”(Exploration)还是“ 利用”(Exploitation)都要“面向目标”(Goal-Direct)

在强化学习中会遇到一个伴随一生的问题,这个问题其实也出现在我们的生活中,也会遇到这种问题,当你遇到一个问题,一个你以前已经遇到过的问题,你有两种选择,第一种,按照以前的方法(其中之一)来完成这件事(Exploitation);或者,你可以尝试另一种方法,一种全新的方法(Exploration);前者可以获得稳定的效果,但是不一定是最优的,后者可能会得到更优的方法,但是也可能得到一个不如以前方法的效果。

0

【强化学习】1.0 强化学习介绍

做人工智能的,或者吹人工智能的所有人应该都曾经尝试思考过,学习的本质是什么,因为我们的“智能”来自学习,可能也有一些遗传因素,我们并不了解学习或者智能的本质是什么,但是我们可以从我们的生活或者其他一些动物的行为和现象中得到一些启示

FaceNet论文阅读 0

FaceNet论文阅读

从老的wordpress转移过来,之前一年一直在做人脸识别算法研究,现在回头看看too young too simple,但是这些经历也算对自己的有很多帮助,认清自己的水平,知道自己什么方面比较差,这样也算是有所帮助

Visualizing and Understanding CNN 0

Visualizing and Understanding CNN

研究卷积神经网络,把阅读到的一些文献经典的部分翻译一下,写成博客,代码后续给出,不足之处还请大家指出。
大型卷积神经网络在图片分类上很成功,然而我们不知道他为什么能表现的如此不错,或者如何提高。

LeNet论文解读 0

LeNet论文解读

是一种局部的,包含噪声的梯度估计法,这种方法只计算一个或者一组较小数量的训练样本来估算梯度,之后更新所有参数。

样本一般算计选取,或者先把样本随机排队,然后逐个(组)使用。

Droupout 的论文解读 0

Droupout 的论文解读

深度神经网络因为拥有大量的参数,所有具有非常强大的学习功能,而大量参数带来的问题就是过拟合(overfit),过拟合严重影响模型的范化性能,而大型深度神经网络计算速度又较慢,很难在实际应用中通过联合多个模型来给出结果。

CNN训练数据讨论 0

CNN训练数据讨论

所谓同一样本的不同形式,比如彩色图片的不同色彩空间描述,RGB,YUV(YCbCr),LIS等色彩空间有着不同的表现方式,其本质(数学模式)虽然不同,但视觉效果都表征同一样本,或者将样本变形成灰度图像,样本类别没有发生变化,只是描述发生了转换,更深层的说法就是变量的域发生了改变。

由于博客移至wordpress,部分公式和代码显示不正常,博主正在努力修改,如发现公式显示错误,请及时在文章下留言,感谢您的帮助,尽请原谅!