以下代码(由Reid Barton在Criterion上建议,导致内存消耗激增,看不到CAF)具有基准时间,该基准时间与通过优化进行编译时成比例。但是,使用优化似乎会导致基准时间独立于。结果被缓存在核心的什么地方,我该怎么做才能防止结果被缓存?num
O0
O3
num
代码是:
{-# OPTIONS_GHC -fno-cse #-}
{-# LANGUAGE BangPatterns #-}
module Main where
import Criterion.Main
import Data.List
num :: Int
num = 100000000
lst :: a -> [Int]
lst _ = [1,2..num]
myadd :: Int -> Int -> Int
myadd !x !y = let !result = x + y in
result
mysum = foldl' myadd 0
main :: IO ()
main = defaultMain [
bgroup "summation"
[bench "mysum" $ whnf (mysum . lst) ()]
]
核心是:
main7
main7 = unpackCString# "mysum"#
main8
main8 = unpackCString# "summation"#
Rec {
$wlgo
$wlgo =
\ ww_s6vW w_s6vT ->
case w_s6vT of _ {
[] -> ww_s6vW;
: x_a4dz xs_a4dA ->
case x_a4dz of _ { I# ipv_s4d4 ->
$wlgo (+# ww_s6vW ipv_s4d4) xs_a4dA
}
}
end Rec }
lst1
lst1 = efdtInt 1 2 100000000
lvl_r6yu
lvl_r6yu = case $wlgo 0 lst1 of ww_s6w5 { __DEFAULT -> I# ww_s6w5 }
Rec {
main_$s$wa
main_$s$wa =
\ sc_s6xB sc1_s6xC sc2_s6xD ->
case tagToEnum# (<=# sc1_s6xC 0) of _ {
False ->
case seq# lvl_r6yu sc2_s6xD of _ { (# ipv_a4BO, ipv1_a4BP #) ->
main_$s$wa sc_s6xB (-# sc1_s6xC 1) ipv_a4BO
};
True -> (# sc2_s6xD, () #)
}
end Rec }
main6
main6 =
\ w_s6w9 w1_s6wa ->
case w_s6w9 of _ { I64# ww1_s6wd ->
main_$s$wa () ww1_s6wd w1_s6wa
}
main5
main5 = Benchmark main7 (main6 `cast` ...)
main4
main4 = : main5 ([])
main3
main3 = BenchGroup main8 main4
main2
main2 = : main3 ([])
main1
main1 = \ eta_B1 -> defaultMain2 defaultConfig main2 eta_B1
main9
main9 = \ eta_B1 -> runMainIO1 (main1 `cast` ...) eta_B1
lst
lst = \ @ a_a40V _ -> lst1
main
main = main1 `cast` ...
myadd
myadd =
\ x_a3Io y_a3Ip ->
case x_a3Io of _ { I# ipv_s4d1 ->
case y_a3Ip of _ { I# ipv1_s4d4 -> I# (+# ipv_s4d1 ipv1_s4d4) }
}
mysum
mysum =
\ w_s6w2 ->
case $wlgo 0 w_s6w2 of ww_s6w5 { __DEFAULT -> I# ww_s6w5 }
num
num = I# 100000000
main
main = main9 `cast` ...
我在标记-ddump-simpl -fforce-recomp -O3 -dsuppress-all
到ghc --make -no-link ...
调用的命令的末尾cabal build
。我正在使用标准1.1.0.0和GHC版本7.8.3。
结果被缓存在您的中lvl_r6yu
。您可以看到它lst1
被[0..num]
提升到了顶层,从中$wlgo 0 lst1
可以看到求和的结果也被提升了。
如果添加顶级定义foo = mysum . lst
,然后查看的核心,则更容易看到正在发生的事情foo
。您可以看到那里有foo
一个常量函数返回求和结果。
如果添加{-# OPTIONS -fno-full-laziness #-}
,则不会提升子表达式,因此基准将按预期运行。
通常,criterion
通过提供给的参数来控制评估时,这是一个好主意whnf
。在我们的情况下:
bench "mysum" $ whnf (\size -> mysum [1..size]) num
无论优化或提升,此方法都可以正常工作。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句