更新日志¶ 本项目遵循语义化版本规范。 1.0.0¶ 新增¶ 将根包收窄为面向应用工程师的稳定核心 API 新增 rl_training.core 和 rl_training.experimental 命名空间 新增兼容性和弃用策略文档 新增 CI 和发布工作流(构建、测试、发布验证) 稳定核心算法¶ A2C, BC, CQL, DQN, DiscreteSAC, IQL, PPO, SAC, TD3, TRPO