Garden of Sinners

穿越到异世界的魔物使生活:线性模型

姑且是准备入 PhD 坑了,基础的东西更需要好好复习。本文的内容会覆盖西瓜书第三章的内容。在线性模型的部分, MLPR 里头学的一些东西也会尽量地放进来。上次看到某学弟的深度学习入门文章写得很不错,要么尝试一下转变文风吧(

西瓜书笔记:1-2章(绪论,统计基础)

开始认真刷西瓜书了,作为面试的准备。规划是重点公式+有价值的练习题推一遍或者编程实现,由于同时也要刷 leetcode 与找内推所以更新不定。本文会包括 1-2 章的内容以及习题。

一些碎碎念:之前跟朋友聊的时候说到在瓶颈期要保持产出——不论是知识还是产品,那么现在姑且就把知识整理一下吧,虽然做的有点晚,但是总比不做好。博客改成hexo以后好多以前的文章暂时没空搬过来,可能要留到以后整理了,因为好多图放在七牛但是七牛现在对未备案域名有限制所以全挂了,怎么处理得慢慢来了。

迁移到hexo的时候也有好多坑,可能另外有空说一下,包括但不限于 Mathjax 引入,代码高亮,分享……(想在leancloud注册账号,要人脸认证但是我手机不给认证……)等。而且实际上主题没写完,手机端的样式没仔细调,一些页面的样式没写,等等。但是毕竟是从头写起的一个主题,拖延了好久的想法终于实现80%,感觉还是不错的。

强化学习导论(三)

强化学习导论第三部分,planning, value function approximation, eligibility traces, policy gradient methods

强化学习导论(二)

强化学习第二部分

强化学习导论(一)

强化学习导论的学习内容, 包含上课内容与其他自己找的资料,主要是复习用,基本可以看做是 ppt + sutton 书的一些翻译+笔记