强化学习的框架是智能体()通过观察当前状态作出相应动作。

题目
单选题
强化学习的框架是智能体()通过观察当前状态作出相应动作。
A

S

B

A

C

Agent

D

Environment

参考答案和解析
正确答案: C
解析: 暂无解析
如果没有搜索结果或未解决您的问题,请直接 联系老师 获取答案。
相似问题和答案

第1题:

通过一定的榜样来强化相应的学习行为或学习行为倾向是()

A.直接强化

B.自我强化

C.负强化

D.替代强化


正确答案:D

第2题:

()也就是观察学习,模仿学习,指人通过观察模仿习得新的行为模式。

A、替代性学习

B、体验思考

C、语言传递法

D、强化评价法


参考答案:A

第3题:

__________指学习者通过观察他人行为所带来的奖励性后果而受到强化。


正确答案:
替代性强化

第4题:

在强化学习中,主体和环境之间交互的要素有()。

  • A、状态
  • B、动作
  • C、回报
  • D、强化

正确答案:A,B,C

第5题:

学习过程中,学习者通过观察榜样的行为受到强化,从而在自己身上也产生了类似 的强化效果,班杜拉称这种现象为( )。
A.自我强化 B.替代强化C.内部强化 D.负强化


答案:B
解析:
题干是对替代强化的解释。

第6题:

《新一代人工智能发展规划》提出的人工智能主要是以()为基础的。

A、深度学习

B、监督学习

C、强化学习

D、智能学习


答案:D

第7题:

行为的改变来自()

A.成熟、学习、强化

B.成熟、学习、有机体暂时的状态

C.成熟、强化、有机体暂时的状态

D.强化、学习、有机体暂时的状态


参考答案:B

第8题:

在班杜拉看来,通过榜样来强化相应的学习行为或学习行为倾向是()

A、直接强化

B、替代性强化

C、自我强化

D、正强化


参考答案:B

第9题:

在强化学习过程中,()表示随机地采取某个动作,以便于尝试各种结果;()表示采取当前认为最优的动作,以便于进一步优化评估当前认为最优的动作的值。

  • A、探索;开发
  • B、开发;探索
  • C、探索;输出
  • D、开发;输出

正确答案:A

第10题:

替代强化指学习者通过观察他人行为所带来的奖励性后果而受到强化。


正确答案:正确

更多相关问题