在Q-Learning中,所谓的Q函数是指()。

题目
单选题
在Q-Learning中,所谓的Q函数是指()。
A

状态动作函数

B

状态值函数

C

动作值函数

D

策略函数

如果没有搜索结果或未解决您的问题,请直接 联系老师 获取答案。
相似问题和答案

第1题:

Q、W、U中何者是状态函数 ( )。

A. Q

B. U

C. W

D. Q、W、U


正确答案:B

第2题:

下列函数模板定义中错误的是A.templateB.template Q F(Q x){return Q+x;} Q F

下列函数模板定义中错误的是

A.template<class Q>

B.template<class Q> Q F(Q x){return Q+x;} Q F(Q x){return x+x;}

C.template<class T>

D.template<class T> T F(T x){return x * x;} bool F(T x){return x>1;}


正确答案:A
解析:在函数模板定义中,类型参数不能参与运算。

第3题:

下列生产函数中每个生产函数的规模收益是不变的有()

A.Q=0.5X+40Y+8Z;

B.Q=3L+500;

C.Q=43L+24K;

D.Q=30L+10K+0.5TLK


参考答案:A, C

第4题:

假定某厂商短期生产的边际成本函数为SMC(Q)=3Q2-8Q+100,且已知当产量Q=10时的总成本STC=2400,求相应的STC函数、SAC函数和AVC函数。


参考答案:


切入点:对总成本函数求导数,得到边际成本函数,反过来对边际成本函数积分,会得到总成本函数。本题给了SMC,积分后得到总成本函数,再根据给的其他条件确定固定成本的数值。最后几个函数就出来了。

第5题:

命题p:不经过第一象限的图象所对应的函数一定不是幂函数.命题q:函数y=x+2/x的单调递增区间是[-√2,0)∪[√2,+∞), 则下列命题中,真命题是( ).

(A)p∧q.

(B)(¬p)∨q.

(C)(¬p)∧(¬q).

(D)p∧(¬q).


参考答案D

第6题:

状态函数的特征是其变化量只决定于(),而与变化的()无关。在热(Q)、功(W)、焓(H)和热力学能(U)中,()是状态函数,()不是状态函数。


参考答案:始末状态,途径,H、U,Q、W;

第7题:

下面的函数模板定义中错误的是A.template q F(Q x) {return Q+x;}B.template

下面的函数模板定义中错误的是

A.template <class Q> q F(Q x) {return Q+x;}

B.template <class Q> Q F(Q x){return x+x;}

C.template <class T> T F(Tx){return x*x;}

D.template <class T> bool F(Tx){return x>1;}


正确答案:A
解析:本题考核函数模板的定义。模板定义的类型参数表>中包含一个或多个由逗号分隔的类型参数项,每一项由关键字class后跟一个用户命名的标识符,此标识符为类型参数,它不是一种数据类型。A) 选项中标识符Q作为类型参数,不能用作数据类型参与"Q+x"的运算。

第8题:

假定某企业的短期成本函数是TC(Q)=Q3-10Q2+17Q+66。(1)指出该短期成本函数中的可变成本部分和不变成本部分。 (2)写出下列相应的函数:TVC(Q)、AC(Q)、AVC(Q)、AFC(Q)和MC(Q)。


正确答案:

第9题:

下面的函数模板定义中错误的是______ 。A.template QF (Q x){return Q +x;}B.template<

下面的函数模板定义中错误的是______ 。

A.template<class Q > QF (Q x){return Q +x;}

B.template<class Q > QF (Q x){returnx/x;}

C.template <class T > T F(T x) {return x*x;}

D.template <class T> bool F (T x) {return x>1;}


正确答案:A
解析:Q只是模板的语法要求,不能作为一个值。

第10题:

在某垄断竞争市场中,代表性厂商的长期成本函数为LTC =5Q3 -200Q2 +2700Q,市场的反需求函数为p= 2200A - 100Q,求:在长期均衡时,代表性厂商的产量和产品价格及A的数值。


答案:
解析:
垄断竞争市场的长期均衡条件为M=LMC= SMC和AR= LAC= SAC。 由题意及上述条件可得:LMC =15Q2 -400Q+2700,LAC =5Q2—200Q +2700。 由市场的需求函数P= 2200A -100Q可得:MR= 2200A - 200Q,AR= 2200A -100Q。 联立上述方程可得:Q =10,P=1200,A=1。