#

cmdp

Here are 2 public repositories matching this topic...

galaxywk223 / ReinforcementLearning-Study-and-Experiments

强化学习中文学习笔记与可复现实验仓库，覆盖动态规划、表格方法、DQN、策略梯度、PPO、SAC 与安全强化学习专题。

python reinforcement-learning notes monte-carlo deep-reinforcement-learning q-learning dqn policy-gradient sarsa dynamic-programming experiments sac gymnasium actor-critic ppo safe-rl tabular-rl cmdp

Updated Jun 13, 2026
Python

Masahiko-O / Convergence-Multi-Layer-Distribution-Prompting

Multi-layer probability distribution control for creative LLM output. Preprint by Masahiko.O (2026).

les large-language-models llm prompt-engineering cmdp prompt-protocol autonomous-expression zenodo-preprint convergence-multi-layer-distribution-prompting probability-distribution-control liberation-exploration-syntax convergence-redistribution multi-layer-bias incongruity-driven-amplification typicality-bias-mitigation

Updated May 12, 2026

Improve this page

Add a description, image, and links to the cmdp topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the cmdp topic, visit your repo's landing page and select "manage topics."