ChengpengLi1003

ChengpengLi ChengpengLi1003

Achievements

CoRT CoRT Public

Python 49
Awesome-Long-Chain-of-Thought-Reasoning-with-tools Awesome-Long-Chain-of-Thought-Reasoning-with-tools Public

A curated list of cutting-edge research papers and resources on Long Chain-of-Thought (CoT) Reasoning with Tools.

37 3
DotaMath DotaMath Public

30 2
Q-learning Q-learning Public

针对最经典的表格型Q learning算法进行了复现，能够支持gym中大多数的离散动作和状态空间的环境，譬如CliffWalking-v0。

Python 9 1
RL4CO RL4CO Public

A open-sourced codebase for using offline reinforcement learning in combinatorial optimization

Python 2
tensorflowbook tensorflowbook Public

Forked from csmhwu/tensorflowbook

for tensorflow book writting

1