토론
-
Deterministic vs stochastic policy in MAB
Advanced MAB algorithms
- 추천
- 0
- 댓글
- 1
-
TD advantage actor-critic 알고리즘에 대하여
Policy gradient algorithms
- 추천
- 0
- 댓글
- 1
-
reward shaping ,Q -initialization
Reward shaping
- 추천
- 0
- 댓글
- 1
-
강의에 사용된 코드는 어디서 볼 수 있나요???
DQN
- 추천
- 0
- 댓글
- 1
-
TAQ에 대한 답이나 참조할만한 자료가 있는 지 궁금합니다.
Reward shaping
- 추천
- 0
- 댓글
- 1
-
강의자료 문의드립니다
- 추천
- 0
- 댓글
- 1