在强化学习过程中,()表示随机地采取某个动作,以便于尝试各种结果;()表示采取当前认为最优的动作,以便于进一步优化评估当

题目
单选题
在强化学习过程中,()表示随机地采取某个动作,以便于尝试各种结果;()表示采取当前认为最优的动作,以便于进一步优化评估当前认为最优的动作的值。
A

探索;开发

B

开发;探索

C

探索;输出

D

开发;输出

如果没有搜索结果或未解决您的问题,请直接 联系老师 获取答案。
相似问题和答案

第1题:

使用链式存储结构表示线性表的优点是( )。 A.便于随机存取B.便于插入和删除操作SXB

使用链式存储结构表示线性表的优点是( )。

A.便于随机存取

B.便于插入和删除操作

C.花费的存储空间比顺序存储结构小

D.数据元素的物理顺序与逻辑顺序相同


正确答案:B
暂无解析,请参考用户分享笔记

第2题:

在()上,主动参与学习表现为学生在学习过程中能够努力摆脱对教师或他人的依赖,主动地对学习活动的各个方面进行自主选择、自主设计和自我调控,积极采取各种有效措施使自己的学习活动达到最优化,并独立地开展各种学习活动,能够从学习过程中获得积极的情感体验。

  • A、学习方法
  • B、学习过程
  • C、学习结果
  • D、学习时间

正确答案:A

第3题:

在指导员选择多方向进行示范动作时,以下哪项不是其目的()

A.便于锻炼者模仿学习

B.便于指导员观察

C.便于纠正错误动作

D.使于锻炼者找到适合自己的角度


答案:D

第4题:

继电保护原理图的主要优点是()

  • A、便于阅读
  • B、便于现场查线及调试
  • C、有整体概念
  • D、能表示动作原理

正确答案:A,C,D

第5题:

在ε-greedy策略当中,ε的值越大,表示采用随机的一个动作的概率越(),采用当前Q函数值最大的动作的概率越()。

  • A、大;小
  • B、大;大
  • C、小;小
  • D、小;大

正确答案:A

第6题:

树形表示和四元式不便于优化,而三元式和间接三元式则便于优化。 ()

此题为判断题(对,错)。


正确答案:错误

第7题:

在强化学习过程中,()表示随机地采取某个动作,以便于尝试各种结果;()表示采取当前认为最优的动作,以便于进一步优化评估当前认为最优的动作的值。

  • A、探索;开发
  • B、开发;探索
  • C、探索;输出
  • D、开发;输出

正确答案:A

第8题:

在动作列表中,批注以()色来表示。


参考答案:粉红色

第9题:

在指导员选择多方向进行示范动作时,以下哪项不是其目的()

  • A、便于锻炼者模仿学习
  • B、便于指导员观察
  • C、便于纠正错误动作
  • D、便于锻炼者找到适合自己的角度

正确答案:D

第10题:

在强化学习的过程中,学习率α越大,表示采用新的尝试得到的结果比例越(),保持旧的结果的比例越()。

  • A、大;小
  • B、大;大
  • C、小;小
  • D、小;大

正确答案:A