minghegy
火狐狸
火狐狸
  • UID37982
  • 注册日期2011-12-17
  • 最后登录2014-02-24
  • 发帖数132
  • 经验10枚
  • 威望0点
  • 贡献值0点
  • 好评度0点
165楼#
发布于:2011-12-27 13:45
我的CPU是Intel的
msky
千年狐狸
千年狐狸
  • UID14649
  • 注册日期2006-09-21
  • 最后登录2023-04-03
  • 发帖数2959
  • 经验166枚
  • 威望0点
  • 贡献值12点
  • 好评度9点
  • 社区居民
166楼#
发布于:2011-12-27 13:45
不好意思,JS效率的确是有进步的,sunspider有14%的提升,可能刚才我测试的时候运行了其他软件,影响了

10b3原版
sunspider-0.9.1 —— 551.5ms +/- 2.9%
V8 ——2255
kraken —— 10799.4ms +/- 1.5%

SIMD Math版
sunspider-0.9.1 —— 474.7ms +/- 0.7%
V8 —— 2443
kraken —— 10040.7ms +/- 0.7%

忘了说了,CPU也是Intel的
dongyuanxun
非常火狐
非常火狐
  • UID28632
  • 注册日期2009-04-19
  • 最后登录2013-02-14
  • 发帖数898
  • 经验10枚
  • 威望0点
  • 贡献值0点
  • 好评度0点
167楼#
发布于:2011-12-27 13:45

对了,你的wiki用英文写还是用中文写?英语我不灵啊

我简单的英译了下
我不知道默认显示哪个
你可以在上面选
zh-Hans 就是简体中文
en 就是英文
dongyuanxun
非常火狐
非常火狐
  • UID28632
  • 注册日期2009-04-19
  • 最后登录2013-02-14
  • 发帖数898
  • 经验10枚
  • 威望0点
  • 贡献值0点
  • 好评度0点
168楼#
发布于:2011-12-27 13:45
测试下这个版本

http://pcxfirefox.googlecode.com/files/ ... tterpgo.7z

这个是全部由Intel C/C++ Compiler 12 PGO编译的,由于icc默认fast math,这会导致一些测试跑偏,所以加入了-fp:precise编译,虽然导致了部分性能下降。

因为icc的pgo和gcc的pgo构建形式基本相同,所以这个可以作为gcc编译的前期探索,只是icc在编译jemalloc/angle模块时没什么压力。这个版本主要想观察icc betterpgo的性能如何还有编译出版本耗用内存情形。据我观察,内存耗用情形也可以接受,不是预计那么高。

编译器科学计算的基准测试速度比较一般为 icc  > gcc lto+pgo > icc with fp:precise > gcc > vc,如果不要求浮点数计算精度才可以用icc默认编译。
内存耗用比较为 vc < gcc < icc 。

所以转换用gcc编译的效能可以期待,只不过编译时间还有lto/pgo共同作用的bug和icc有的一拼。
Lawliet
火狐狸
火狐狸
  • UID34414
  • 注册日期2010-11-03
  • 最后登录2017-04-02
  • 发帖数201
  • 经验13枚
  • 威望0点
  • 贡献值0点
  • 好评度0点
  • 社区居民
  • 忠实会员
169楼#
发布于:2011-12-27 13:45
刪除........
Lawliet
火狐狸
火狐狸
  • UID34414
  • 注册日期2010-11-03
  • 最后登录2017-04-02
  • 发帖数201
  • 经验13枚
  • 威望0点
  • 贡献值0点
  • 好评度0点
  • 社区居民
  • 忠实会员
170楼#
发布于:2011-12-27 13:45
成績上與我的差不多,V8要高上一些
貌似就算直接用fast math開關,應該也不會有問題
dongyuanxun
非常火狐
非常火狐
  • UID28632
  • 注册日期2009-04-19
  • 最后登录2013-02-14
  • 发帖数898
  • 经验10枚
  • 威望0点
  • 贡献值0点
  • 好评度0点
171楼#
发布于:2011-12-27 13:45
Lawliet:成績上與我的差不多,V8要高上一些
貌似就算直接用fast math開關,應該也不會有問題
回到原帖

不行
开启fast math会在js符合性测试中大大跑偏

FF10官方版只有160的失败

ICC默认直接上升到400+

加入fp:precise才回归到160
msky
千年狐狸
千年狐狸
  • UID14649
  • 注册日期2006-09-21
  • 最后登录2023-04-03
  • 发帖数2959
  • 经验166枚
  • 威望0点
  • 贡献值12点
  • 好评度9点
  • 社区居民
172楼#
发布于:2011-12-27 13:45
运行还比较流畅,貌似又正常了,好奇怪。
liuxb
非常火狐
非常火狐
  • UID26160
  • 注册日期2008-09-05
  • 最后登录2021-12-02
  • 发帖数659
  • 经验324枚
  • 威望0点
  • 贡献值184点
  • 好评度16点
173楼#
发布于:2011-12-27 13:45
我是AMD的CPU,
贴一下我的测试结果:

有个小问题,在运行icc12编译的那个版本的时候,有这样的提示
“OMP: Warning #72: KMP_AFFINITY: affinity only supported for Intel(R) processors.
OMP: Warning #71: KMP_AFFINITY: affinity not supported, using "disabled".”
不过可是正常运行。

下面是结果:
sunspider 0.9.1

120106-vc2010-sse2-nopgo-sse2Math-jstest ------------281.1ms +/- 0.7%
120107-icc12-sse2-betterpgo --------------------279.3ms +/- 0.7%

10b3-1-win32-lawlietfox-sse2 --------------------276.9ms +/- 1.2%
10b4-3-lawlietfox ------------------------282.1ms +/- 0.9%
10-1-win32-lawlietfox-sse2 --------------------281.6ms +/- 0.9%

10.0-2012020100.win32-tete009 --------------------286.8ms +/- 0.9%

12.0a1-ayakawa-120107-PGO --------------------280.6ms +/- 1.2%
12.0a1-ayakawa-120125-PGO --------------------287.0ms +/- 0.6%



google v8

120106-vc2010-sse2-nopgo-sse2Math-jstest ------------4786
120107-icc12-sse2-betterpgo --------------------4795

10b3-1-win32-lawlietfox-sse2 --------------------4751
10b4-3-lawlietfox ------------------------4730
10-1-win32-lawlietfox-sse2 --------------------4759

10.0-2012020100.win32-tete009 --------------------4679

12.0a1-ayakawa-120107-PGO --------------------4644
12.0a1-ayakawa-120125-PGO --------------------4617



krakenbenchmark

120106-vc2010-sse2-nopgo-sse2Math-jstest ------------5845.9ms +/- 0.4%
120107-icc12-sse2-betterpgo --------------------5843.4ms +/- 0.4%

10b3-1-win32-lawlietfox-sse2 --------------------5760.6ms +/- 0.3%
10b4-3-lawlietfox ------------------------5798.1ms +/- 0.3%
10-1-win32-lawlietfox-sse2 --------------------5836.1ms +/- 0.3%

10.0-2012020100.win32-tete009 --------------------5846.7ms +/- 0.4%

12.0a1-ayakawa-120107-PGO --------------------6033.4ms +/- 0.3%
12.0a1-ayakawa-120125-PGO --------------------6034.6ms +/- 0.3%

最后问个弱问题,v8的页面上写了数值越大越好,另外两个呢,大了成绩好还是小的好?
我的...
msky
千年狐狸
千年狐狸
  • UID14649
  • 注册日期2006-09-21
  • 最后登录2023-04-03
  • 发帖数2959
  • 经验166枚
  • 威望0点
  • 贡献值12点
  • 好评度9点
  • 社区居民
174楼#
发布于:2011-12-27 13:45
V8是越大越好,另外两个是越小越好
dongyuanxun
非常火狐
非常火狐
  • UID28632
  • 注册日期2009-04-19
  • 最后登录2013-02-14
  • 发帖数898
  • 经验10枚
  • 威望0点
  • 贡献值0点
  • 好评度0点
175楼#
发布于:2011-12-27 13:45
OMP那个问题icc历年就有

需要加入一个环境变量为KMP_AFFINITY,值为0

有外国人给我发邮件说icc那个版本WebGL很流畅,还有dromaeo dom测试很高,不过我没测

icc这个版本编译太费事,所以我暂无计划在release版本中使用icc编译
dongyuanxun
非常火狐
非常火狐
  • UID28632
  • 注册日期2009-04-19
  • 最后登录2013-02-14
  • 发帖数898
  • 经验10枚
  • 威望0点
  • 贡献值0点
  • 好评度0点
176楼#
发布于:2011-12-27 13:45
不过极有可能在10 release时推出并列版本
一个传统的VC2010
一个VC2010+ICC混合版本,仅在JS/WebGL上应用icc编译,不过我想要自动SSE3优化
liuxb
非常火狐
非常火狐
  • UID26160
  • 注册日期2008-09-05
  • 最后登录2021-12-02
  • 发帖数659
  • 经验324枚
  • 威望0点
  • 贡献值184点
  • 好评度16点
177楼#
发布于:2011-12-27 13:45
dongyuanxun:OMP那个问题icc历年就有

需要加入一个环境变量为KMP_AFFINITY,值为0

有外国人给我发邮件说icc那个版本WebGL很流畅,还有dromaeo dom测试很高,不过我没测

icc这个版本编译太费事,所以我暂无计划在release版本中使用icc编译
回到原帖


我在系统变量里加入了
重启后,在set命令中可以看到KMP_AFFINITY=0。
但是还是会有提示。。。

OMP: Warning #61: KMP_AFFINITY: 'default' type does not take any integer paramet
ers, ignoring them.
OMP: Warning #72: KMP_AFFINITY: affinity only supported for Intel(R) processors.

OMP: Warning #71: KMP_AFFINITY: affinity not supported, using "disabled".
我的...
dongyuanxun
非常火狐
非常火狐
  • UID28632
  • 注册日期2009-04-19
  • 最后登录2013-02-14
  • 发帖数898
  • 经验10枚
  • 威望0点
  • 贡献值0点
  • 好评度0点
178楼#
发布于:2011-12-27 13:45
那我就不知道了,原来是这样的,可能改了,反正不影响运行

Matlab高版本也是用的intel的库,估计也是相同的提示
liuxb
非常火狐
非常火狐
  • UID26160
  • 注册日期2008-09-05
  • 最后登录2021-12-02
  • 发帖数659
  • 经验324枚
  • 威望0点
  • 贡献值184点
  • 好评度16点
179楼#
发布于:2011-12-27 13:45
加入了那个系统变量以后,提示中多了
OMP: Warning #61: KMP_AFFINITY: 'default' type does not take any integer parameters, ignoring them.
这句。

另外还有个问题,用了icc12版本以后,tabutilities 1.2pre17完全失效了,也不显示不兼容什么的,就是所有功能都失效了。
试过120106-vc2010-sse2-nopgo-sse2Math-jstest也一样。

同样的配置用Lawliet的那个10b3的就一切正常。

个人感觉icc12这个版本的界面反应速度似乎确实要快一些,希望能出个完美的。
我的...
游客

返回顶部