之前实现过交叉熵优化算法,来源于我的一篇文章,使用初始策略的强化学习算法。在进行强化学习的迭代之前,使用NMPC,针对大量的初始点,求解NMPC的轨迹,利用轨迹数据训练一个控制器来初始化强化学习算法的action。然而,每一个轨迹都需要蒙特卡洛采样的方法来进行计算,耗费时间较多,此外,如果初始点较多,例如我文章中使用了160000个点,意味着我要计算160000个优化问题,当时使用了CPU多进程来进行计算,之前的博客为:基于交叉熵优化算法的非线性系统的MPC求解器,一直想要实现一个CUDA版本的方案,现在有时间实现了一下,效果非常好,特此记录一下。
overleaf搭建本地服务
overleaf的IEEE会员在早些天失效了,在用overleaf之前,用的上海交通大学的自建latex服务,latex.sjtu.edu.cn,但是存在数据安全问题以及服务挂了的问题。经常在人多的时候直接就炸了,这肯定没法长期使用,感觉不是很靠谱,于是自己按照sharelatex的仓库中的指南,搭建了一个服务,记录一下。
通信原理自学与总结
即将要去通信行业工作了,因为博士专业是自动化,所以要补一些通信相关的知识
论文阅读20230613
用chatpaper生成的论文略读,以后后续筛选一些值得阅读的论文
debian设置开机自动启动服务
我的debian上有一些需要定时执行的任务,包括一些股票数据采集,策略运行的任务等。所以需要将这些任务设计成服务,记录一下。
基于交叉熵优化算法的非线性系统的MPC求解器
交叉熵优化算法,是一种启发式算法,能够用来求解复杂的非线性优化问题。本人的最近两篇论文(under review),都采用了交叉熵优化算法去生成控制轨迹作为“专家知识”,因此,为了仿真和测试的方便,开发了一个通用的交叉熵优化求解器,专门用于求解离散时间仿射非线性系统的MPC优化问题(模型预测控制),欢迎朋友们批评指正。
backtrader换手率筛选策略回测
知乎上看到一个量化策略,一直没时间,现在回测一下看看效果,是基于换手率,量比等数据进行的筛选股票的策略
backtrader回测框架
用了很多量化平台,比如通达信,聚宽,但是感觉不得劲,最近几天尝试了一下backtrader这个框架,感觉很不错,但是文档感觉写的不是很好,暂时准备用这个框架搭建一下自己的量化交易框架。
Paperspace白嫖指南
由于Colab的使用体验不是很好,所以,在查资料的过程中发现还有一个平台paperspace.com,于是尝试用了一个月,发现还不错,分享一下使用体验和写的一些自动化小脚本。
Colab白嫖指南与测试
我放在实验室的服务器挂掉了,远程连不上了,想着测试下Colab行不行。主要包括,1:测试Colab的使用时间限制(GPU)2:测试Colab的CPU的性能 3:介绍Colab环境重置后的自动化操作方式