0%

从2019年开始就已经开始在探索基金、股票分析量化平台,但是由于个人能力和时间有限,一直没有做出来,现在炒股炒了两年,虽然交易次数不多,但是也积累了一些经验想记录一下。主要是我对量化交易的一些思考,还有量化平台的选择。

阅读全文 »

比亚迪的车机本来就是个安卓平板,自带的主题显得太单调了一点,而Wallpaper Engine最近又出安卓版了,本文记录一下比亚迪宋Plus EV安装设置Wallpaper Engine的过程,让车机不再单调。

阅读全文 »

记录一下已经被录用的两篇文章的投稿过程的时间节点,给需要的人参考一下

2021年12月12日补充第三篇投稿的信息

阅读全文 »

近期发现很久没有写博客了,主要是的确没什么内容可以写,项目上有一些事情比较忙,而且论文也没有写新的东西,主要最近都在改两篇大修的论文

写一下最近的生活吧。

阅读全文 »

从2021年3月份开始,在健身房泡了几个月,中间由于生病等问题,差不多总共休息了2到3个月左右的时间,对于这几个月的成果进行一下总结,也希望有大佬能够指点指点我,促使我进步更快,或者纠正我训练中的问题。

阅读全文 »

最近在看《Guided policy search》这篇文章,其中,用到了Importance Sampling,KL divergence等技术,虽然这些之前都用过,但是没有系统的整理过一些文档出来,《Guided policy search》这篇文章是13年的,但是TRPO和PPO等一些算法用到的技术,在这篇文章里基本都有用到了。初步感觉这篇文章还是比较经典的。

阅读全文 »

2021年8月5日更新:由于时间安排冲突和疫情防控原因,几个小伙伴凑不到一块,只能搁置了,不过将来肯定会来填坑!

阅读全文 »

PR是一款比较流行的视频剪辑软件,不同平台的性能会有很大的区别。本人的工作环境是一台Linux主机,上面装着vmware虚拟机,Pr装在这个虚拟机里,同时还有一台2021 Mac mini M1,主要对比一下这两个平台的性能测试(导出视频),测试纯属娱乐,没有那么专业,看看就好,不过对于该场景下的用户应该还是会有一定的参考意义。

所以:对比的是:虚拟机windows10 VS Mac mini M1

阅读全文 »

Model-based reinforcement learning和model-free reinforcement learning很难区分和界定,这篇文章记录一下几片关于model-based的文献,对于这几年做的强化学习做一个总结。

参考文献:

《Model-based Reinforcement Learning: A Survey》

读后总结:这篇文章写的不清不楚,没有啥干货,讲的太浅显了。

阅读全文 »

搞了很久的ADP(Adaptive dynamic programming),但是,仿真总是会出现一些问题,因为从我个人的理解来看,很多ADP文章其实都是局部且异步的PI或者VI算法。根据《Reinforcement Learning: An Introduction》书中所介绍的方法,PI和VI都是对于离散的状态空间来说的。如果对于具有连续的状态空间的问题来说,需要采用近似的算法来拟合其值函数。本文是对多篇ADP文章进行的总结和仿真。主要包括:

  1. 《Nearly optimal control laws for nonlinear systems with saturating actuators using a neural network HJB approach》2004年
  2. 《Discrete-Time Nonlinear HJB Solution Using Approximate Dynamic Programming: Convergence Proof》2008年
  3. 《Policy Iteration Adaptive Dynamic Programming Algorithm for Discrete-Time Nonlinear Systems》2014年
  4. 《Discrete-Time Local Value Iteration Adaptive Dynamic Programming: Convergence Analysis》2018年
阅读全文 »