로그인 바로가기 하위 메뉴 바로가기 본문 바로가기

강화학습 2

임시 이미지 KAIST 산업및시스템공학과 신하용 교수님 KOOC (KAIST Open Online Course)
http://www.edwith.org/reinforcement-learning2/forum/119061
좋아요 83 수강생 303

REWARD SHAPING에 대해서 잘 알려주셔서 감사합니다.

이것과 관련된 추가 자료가 있는 지 문의드리고  17분 51초에 적어주신 질문들에 대한 답과 설명을 듣고 싶습니다!

리워드 쉐이핑 함수를 바로 VALUE NET에 적용할 수 있으면 좋을 것 같은데, 이것에 대한 답이 궁금합니다


좋은 내용 감사합니다.