TAQ에 대한 답이나 참조할만한 자료가 있는 지 궁금합니다. 강화학습 2 : edwith

강화학습 2

KAIST 산업및시스템공학과 신하용 교수님 KOOC (KAIST Open Online Course)

http://www.edwith.org/reinforcement-learning2/forum/119061

이성령 2022.03.29

REWARD SHAPING에 대해서 잘 알려주셔서 감사합니다.

이것과 관련된 추가 자료가 있는 지 문의드리고 17분 51초에 적어주신 질문들에 대한 답과 설명을 듣고 싶습니다!

리워드 쉐이핑 함수를 바로 VALUE NET에 적용할 수 있으면 좋을 것 같은데, 이것에 대한 답이 궁금합니다

좋은 내용 감사합니다.

강화학습 2