-
Notifications
You must be signed in to change notification settings - Fork 175
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Chapter2 Discussion #10
Comments
这个应用案例Windows下能运行吗? |
应该是可以的,如果运行出现问题,可以贴一下报错截图or训练日志截图我们看下 |
您好,请问如果是单智能体的多维离散动作空间,相对于路口控制场景的多智能体,代码方面应该如何修改呢? |
课程第二讲中使用的 |
请问连续动作空间下的action mask该如何实现呢 |
这个具体是指什么样的 mask 呢,可以给一个更具体的例子么 |
单智能体的多维离散动作空间PPO损失函数的熵该怎么确定呢,虽然按照multihead输出了,但是熵还是维度的指数级吧,请教一下这个熵是怎么设置的 |
想问一下作业里的代码实践第一题重参数化,为什么不使用重参数化求梯度时第一项梯度为0呢 |
本 issue 将会追踪和记录各种有关课程第二讲的问题和思考,欢迎有兴趣的同学在这个 issue 中评论,课程组会定期整理信息。
最新的 第二讲QA 合集文档(2023.05.24更新)
The text was updated successfully, but these errors were encountered: