从2019年开始就已经开始在探索基金、股票分析量化平台,但是由于个人能力和时间有限,一直没有做出来,现在炒股炒了两年,虽然交易次数不多,但是也积累了一些经验想记录一下。主要是我对量化交易的一些思考,还有量化平台的选择。
比亚迪宋plus车机主题设置-使用Wallpaper Engine
比亚迪的车机本来就是个安卓平板,自带的主题显得太单调了一点,而Wallpaper Engine最近又出安卓版了,本文记录一下比亚迪宋Plus EV安装设置Wallpaper Engine的过程,让车机不再单调。
投的两篇文章的时间节点记录
近期学术论文写作有感
2021年上半年健身总结
从2021年3月份开始,在健身房泡了几个月,中间由于生病等问题,差不多总共休息了2到3个月左右的时间,对于这几个月的成果进行一下总结,也希望有大佬能够指点指点我,促使我进步更快,或者纠正我训练中的问题。
重要性采样及KL散度分析与不同实现方法
最近在看《Guided policy search》这篇文章,其中,用到了Importance Sampling,KL divergence等技术,虽然这些之前都用过,但是没有系统的整理过一些文档出来,《Guided policy search》这篇文章是13年的,但是TRPO和PPO等一些算法用到的技术,在这篇文章里基本都有用到了。初步感觉这篇文章还是比较经典的。
拉萨骑行至珠峰大本营
2021年8月5日更新:由于时间安排冲突和疫情防控原因,几个小伙伴凑不到一块,只能搁置了,不过将来肯定会来填坑!
Pr在Mac mini M1和windows10虚拟机下的性能测试
PR是一款比较流行的视频剪辑软件,不同平台的性能会有很大的区别。本人的工作环境是一台Linux主机,上面装着vmware虚拟机,Pr装在这个虚拟机里,同时还有一台2021 Mac mini M1,主要对比一下这两个平台的性能测试(导出视频),测试纯属娱乐,没有那么专业,看看就好,不过对于该场景下的用户应该还是会有一定的参考意义。
所以:对比的是:虚拟机windows10 VS Mac mini M1
Model-based reinforcement learning
Model-based reinforcement learning和model-free reinforcement learning很难区分和界定,这篇文章记录一下几片关于model-based的文献,对于这几年做的强化学习做一个总结。
参考文献:
《Model-based Reinforcement Learning: A Survey》
读后总结:这篇文章写的不清不楚,没有啥干货,讲的太浅显了。
使用ADP设计线性系统最优控制器
搞了很久的ADP(Adaptive dynamic programming),但是,仿真总是会出现一些问题,因为从我个人的理解来看,很多ADP文章其实都是局部且异步的PI或者VI算法。根据《Reinforcement Learning: An Introduction》书中所介绍的方法,PI和VI都是对于离散的状态空间来说的。如果对于具有连续的状态空间的问题来说,需要采用近似的算法来拟合其值函数。本文是对多篇ADP文章进行的总结和仿真。主要包括:
- 《Nearly optimal control laws for nonlinear systems with saturating actuators using a neural network HJB approach》2004年
- 《Discrete-Time Nonlinear HJB Solution Using Approximate Dynamic Programming: Convergence Proof》2008年
- 《Policy Iteration Adaptive Dynamic Programming Algorithm for Discrete-Time Nonlinear Systems》2014年
- 《Discrete-Time Local Value Iteration Adaptive Dynamic Programming: Convergence Analysis》2018年