我想微基准谓词int_cntA / 2 ...
int_cntA(I,W) :- I >= 0, int_cntA0_cntA(I,0,W).
int_cntA0_cntA(0,W0,W) :- !, W0 = W.
int_cntA0_cntA(I,W0,W) :- I0 is I/\(I-1), W1 is W0+1, int_cntA0_cntA(I0,W1,W).
...针对谓词int_cntB / 2:
int_cntB(I,W) :- I >= 0, int_cntB0_cntB(I,0,W).
int_cntB0_cntB(0,W0,W) :- !, W0 = W.
int_cntB0_cntB(I,W0,W) :- I0 is I>>1, W1 is W0+(I/\1), int_cntB0_cntB(I0,W1,W).
我不确定要获得良好的结果需要考虑什么... 100%甚至是有趣的尺寸?
到目前为止,我想到了:我应该将元通话性能纳入基准,还是应该处理原始号码?回路是否应由故障驱动?我是否应该关心执行过程中产生的垃圾?
以下代码段是一个简单的基准测试实现,可实现原始性能,受故障驱动并且(因此)不关心垃圾:
:- use_module(library(between)).
rep_10.
rep_10.
rep_10.
rep_10.
rep_10.
rep_10.
rep_10.
rep_10.
rep_10.
rep_10.
rep_100M :- rep_10, rep_10, rep_10, rep_10, rep_10, rep_10, rep_10, rep_10.
int_cntA / 2的代码:
benchA_1(I,W,Rt) :- statistics(runtime,_),
( repeat(100000000), int_cntA(I,W), false ; true ),
statistics(runtime,[_,Rt]),
int_cntA(I,W).
benchA_2(I,W,Rt) :- statistics(runtime,_),
( between(1,100000000,_), int_cntA(I,W), false ; true ),
statistics(runtime,[_,Rt]),
int_cntA(I,W).
benchA_3(I,W,Rt) :- statistics(runtime,_),
( rep_100M, int_cntA(I,W), false ; true ),
statistics(runtime,[_,Rt]),
int_cntA(I,W).
int_cntB / 2的代码:
benchB_1(I,W,Rt) :- statistics(runtime,_),
( repeat(100000000), int_cntB(I,W), false ; true ),
statistics(runtime,[_,Rt]),
int_cntB(I,W).
benchB_2(I,W,Rt) :- statistics(runtime,_),
( between(1,100000000,_), int_cntB(I,W), false ; true ),
statistics(runtime,[_,Rt]),
int_cntB(I,W).
benchB_3(I,W,Rt) :- statistics(runtime,_),
( rep_100M, int_cntB(I,W), false ; true ),
statistics(runtime,[_,Rt]),
int_cntB(I,W).
在运行SICStus Prolog 4.3.1的Intel Core i7 Haswell计算机上,由于不同的基准测试方法(A,B,C)导致的最坏情况下的性能差异超过100%:
| ?- benchA_1(0,W,Rt).
W = 0,
Rt = 3140 ?
yes
| ?- benchA_2(0,W,Rt).
W = 0,
Rt = 4130 ?
yes
| ?- benchA_3(0,W,Rt).
W = 0,
Rt = 1960 ?
yes
您是否有想法/是否可以进一步减少微基准测试的开销?谢谢!
您必须注意冷暖运行。现代的Prolog系统具有及时索引甚至编译功能。这样不同的运行行为可能会有所不同。同样,垃圾收集会使时间变化。
我总是测量暖跑,所以我至少要先运行一次基准测试并放弃测量。然后我再次运行它并记下该措施。
融合不同的循环。通常的方法是通过将伪谓词插入到循环中并测量循环时间来测量循环开销。然后再减去这个时间。伪谓词可以轻松定义为:
dummy.
如果您看到循环的开销很小,那么我认为不要花费减去循环开销的长度,并且明确指出您的测量结果也可以测量循环,这也是有效的。
使用相同的循环时,即使不进行减法运算,仍然可以比较线束所运行的不同测试对象的结果。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句