AWS DeepRacer相关经验

近期公司在AWS赞助下,举办了DeepRacer无人车的比赛,模型训练期间,总结了一些经验如下:

  • 如奖励函数编写分值不佳造成曲线上升下降幅度过大不利于收敛,最终训练的模型不会好到哪里去
  • 克隆模型的训练的效果普遍不如重新训练
  • 相同奖励函数下,过长和过短的时间训练都不能起到更多的帮助作用,反而有可能起反作用,一般推荐150分钟
  • Discount factor 0.999比较利于收敛,过小则需要更长时间才能收敛出结果,过小时训练的模型效果不佳(可能需要更长训练时间)
  • 实际比赛中,首次模型载入需要15秒左右,模型切换需要13-15秒生效
  • 比赛赛道反射光对模型表现影响很大,尤其是大屏幕的光源会造成干扰

未经允许不得转载:阿藏博客 » AWS DeepRacer相关经验