POMDP 中的 Values 行是什么意思?

奥斯卡

我正在研究 POMDP 文件格式并放弃这个和许多其他链接。我已经理解了一切,但我无法理解文件第二行中的值代表什么。它的值是奖励或成本。在别处找不到答案。感到困惑,因为在一份文件中应该可以有成本和回报,不是吗?。为什么我必须指定其中之一?在文件的其余部分也没有地方没有使用该值。

黄金

在 POMDP 中,您可以使用奖励成本来定义学习目标。唯一的区别是,在第一种情况下,您尝试最大化价值函数,而对于成本,您尝试最小化价值函数

POMDP 文件中,您可以定义使用哪一个:

values: [ reward, cost ]

当求解器读取POMDP 文件时,它将解释定义R:为奖励或成本的值。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

掌舵模板中的default(dict).Values.outer.inner语法是什么意思?

来自分类Dev

“ !!”是什么意思 在haskell中是什么意思?

来自分类Dev

javascript中的单个变量行是什么意思?

来自分类Dev

这个asm行中的.byte是什么意思?

来自分类Dev

Makefile中的这一行是什么意思?

来自分类Dev

气泡排序算法中的这些行是什么意思?

来自分类Dev

Makefile中的这一行是什么意思?

来自分类Dev

GWT中的以下代码行是什么意思

来自分类Dev

PDF文件第二行中的%öäüß是什么意思?

来自分类Dev

什么是“?” 在Erlang中是什么意思?

来自分类Dev

什么 /; 在 Mathematica 中是什么意思?

来自分类Dev

PHP中“ | =”是什么意思?

来自分类Dev

`:`和`?`在{{??}`中是什么意思

来自分类Dev

<?..?>在XML中是什么意思?

来自分类Dev

“ \”在ng样式中是什么意思?

来自分类Dev

//在<a>标记中是什么意思

来自分类Dev

%=在Java中是什么意思?

来自分类Dev

*在sql中是什么意思?

来自分类Dev

<*>在Perl中是什么意思?

来自分类Dev

“ SomeType [_]”在scala中是什么意思?

来自分类Dev

在VB中“&_”是什么意思?

来自分类Dev

::在angularJS中是什么意思

来自分类Dev

%A在F#中是什么意思?

来自分类Dev

网址中的句点是什么意思?

来自分类Dev

$ a = [$ a]在PHP中是什么意思?

来自分类Dev

!src在HTML中是什么意思

来自分类Dev

=>符号在Haskell中是什么意思?

来自分类Dev

PHP中的“?:”是什么意思?

来自分类Dev

@ [参数]在makefile中是什么意思?