谭升
非主流人工智能科学家 我和外面那些妖艳的货不一样

博客

0

【线性代数视频课程】 试讲 — 第一课 简介

本系列视频课程的目标是将我们本站博客的线性代数部分进行了视频课程的录制,本课为第三次试录,希望大家多多关注,意见和建议请大家留言或者微信反馈,完整系列将在稍后推出
本课讲解人工智能的学习方式与线性代数的关系

0

一封来自读者的信

收到一位读者的来信,字里行间都看到了当年的自己,中间有一些问题觉得很多人可能都有,所以在他同意的情况下,我把邮件部分贴出来,希望能帮助更多的人。

0

【Hexo】Hexo下next主题valine强化版本的改造

使用Hexo下Next主题会遇到评论设置上的麻烦,好用的被墙了,剩下的都不太好用。但是Next集成了一个valine评论很有改造空间。
我们这里只提供一个改造思路,具体的执行细节我会给出参考网址。

【强化学习】2.1 k臂赌博机(k-armed bandits)问题 0

【强化学习】2.1 k臂赌博机(k-armed bandits)问题

我们面对的选择包含 $k$ 个选项,或者 $k$ 种可选的行为,每一个选择或者行为都对应了一个奖励信号(rewarding signal,忘记了回到前面看看) 每种选择对应的奖励信号是随机的,但是都来自固定的分布,当然来自不同选择的奖励信号服从的分布都不同,但是不会随时间改变,比如,$k$ 种可选的行为中 $f_1$ 表示第一种行为的奖励信号的随机分布

【强化学习】2.0 多臂赌博机 0

【强化学习】2.0 多臂赌博机

强化学习与其他学习算法最大的不同在于训练信息,我们熟知的监督学习,无论从简单的线性回归,到复杂的深度学习,所有这些监督学习用到的训练信息都是Instructing(指导,讲授)的,也就是说训练信息中包含明确的行为指导,比如对于一张输入图片判断是否有人脸,标记好的训练数据会明确的对结果进行校正——是否有人脸

0

【Julia】整型和浮点型数字

整数或者浮点数在编程中被大量使用,由于大部分程序面对的问题都是处理数字计算相关的问题,所以数字的表示变成了代码中最重要的一部分。不论是加减乘除,还是积分微分,在计算机中,都要使用整型和浮点型来完成,至于整型和浮点型计算过程中需要注意的事项,这是在数值分析,数值计算课程中需要考虑的

0

【强化学习】1.6 本章总结、强化学习历史简述

强化学习就是一种通过计算方式来理解和进行目标导向学习的方法。其直接表现是通过agent和环境的交互进行学习,而不需要对环境做任何限制或者需要复杂的环境模型,从本书作者来看,强化学习是第一个研究agent在和环境交互的时候产生的问题计算化的领域,通过研究和环境的交互,达到长期的目标

由于博客移至wordpress,部分公式和代码显示不正常,博主正在努力修改,如发现公式显示错误,请及时在文章下留言,感谢您的帮助,尽请原谅!