S
A
Agent
Environment
第1题:
通过一定的榜样来强化相应的学习行为或学习行为倾向是()
A.直接强化
B.自我强化
C.负强化
D.替代强化
第2题:
()也就是观察学习,模仿学习,指人通过观察模仿习得新的行为模式。
A、替代性学习
B、体验思考
C、语言传递法
D、强化评价法
第3题:
__________指学习者通过观察他人行为所带来的奖励性后果而受到强化。
第4题:
在强化学习中,主体和环境之间交互的要素有()。
第5题:
第6题:
A、深度学习
B、监督学习
C、强化学习
D、智能学习
第7题:
A.成熟、学习、强化
B.成熟、学习、有机体暂时的状态
C.成熟、强化、有机体暂时的状态
D.强化、学习、有机体暂时的状态
第8题:
A、直接强化
B、替代性强化
C、自我强化
D、正强化
第9题:
在强化学习过程中,()表示随机地采取某个动作,以便于尝试各种结果;()表示采取当前认为最优的动作,以便于进一步优化评估当前认为最优的动作的值。
第10题:
替代强化指学习者通过观察他人行为所带来的奖励性后果而受到强化。