谭升
非主流人工智能科学家 我和外面那些妖艳的货不一样

博客

0

一封来自读者的信

收到一位读者的来信,字里行间都看到了当年的自己,中间有一些问题觉得很多人可能都有,所以在他同意的情况下,我把邮件部分贴出来,希望能帮助更多的人。

0

【Hexo】Hexo下next主题valine强化版本的改造

使用Hexo下Next主题会遇到评论设置上的麻烦,好用的被墙了,剩下的都不太好用。但是Next集成了一个valine评论很有改造空间。
我们这里只提供一个改造思路,具体的执行细节我会给出参考网址。

【强化学习】2.1 k臂赌博机(k-armed bandits)问题 0

【强化学习】2.1 k臂赌博机(k-armed bandits)问题

我们面对的选择包含 $k$ 个选项,或者 $k$ 种可选的行为,每一个选择或者行为都对应了一个奖励信号(rewarding signal,忘记了回到前面看看) 每种选择对应的奖励信号是随机的,但是都来自固定的分布,当然来自不同选择的奖励信号服从的分布都不同,但是不会随时间改变,比如,$k$ 种可选的行为中 $f_1$ 表示第一种行为的奖励信号的随机分布

【强化学习】2.0 多臂赌博机 0

【强化学习】2.0 多臂赌博机

强化学习与其他学习算法最大的不同在于训练信息,我们熟知的监督学习,无论从简单的线性回归,到复杂的深度学习,所有这些监督学习用到的训练信息都是Instructing(指导,讲授)的,也就是说训练信息中包含明确的行为指导,比如对于一张输入图片判断是否有人脸,标记好的训练数据会明确的对结果进行校正——是否有人脸

0

【Julia】整型和浮点型数字

整数或者浮点数在编程中被大量使用,由于大部分程序面对的问题都是处理数字计算相关的问题,所以数字的表示变成了代码中最重要的一部分。不论是加减乘除,还是积分微分,在计算机中,都要使用整型和浮点型来完成,至于整型和浮点型计算过程中需要注意的事项,这是在数值分析,数值计算课程中需要考虑的

0

【强化学习】1.6 本章总结、强化学习历史简述

强化学习就是一种通过计算方式来理解和进行目标导向学习的方法。其直接表现是通过agent和环境的交互进行学习,而不需要对环境做任何限制或者需要复杂的环境模型,从本书作者来看,强化学习是第一个研究agent在和环境交互的时候产生的问题计算化的领域,通过研究和环境的交互,达到长期的目标

0

【Julia】变量

如果Julia不是你的入门编程语言,那么对于编程语言中的变量应该已经习以为常,在C语言中,变量名对应于一个内存地址(需要声明变量类型)而在高级一些的语言中,比如python,变量名更抽象,他对应于一个值,或者可以理解为它存储了这个值,这个值可以是该语言允许的任何类型(不需要声明变量类型)。

0

【Julia】开始使用Julia

在终端启动Julia比较简单,上文我们完成了Julia的安装,并在Mac下完成了命令行下启动的设置,那么我们可直接在命令行提示符后输入julia 完成Julia环境的启动(**交互模式**),如果出现下图,表示启动成功了。

【Julia】Julia环境搭建(Mac,Windows,Linux) 0

【Julia】Julia环境搭建(Mac,Windows,Linux)

上文我们说到Julia是一种适合数据科学的语言,那么今天我们就研究一下怎么安装Julia,以及完成一套IDE的搭建,很多人,尤其是写程序有一段时间,但是时间又不长的同学经常会纠结各种问题,比如为啥大牛都用VIM,是不是要学会VIM才能继续进步

试录了几节线性代数视频课程,欢迎大家支持,
点击试看
点击购买更多内容

由于博客移至wordpress,部分公式和代码显示不正常,博主正在努力修改,如发现公式显示错误,请及时在文章下留言,感谢您的帮助,尽请原谅!