1
yangqi 2017 年 5 月 6 日
|
3
denghongcai 2017 年 5 月 6 日
|
4
denghongcai 2017 年 5 月 6 日
循环次数这么一点点就不要搞 OpenMP 了
|
5
aliipay OP @yangqi
gcc version 4.8.5 20150623 warning: ignoring #pragma omp parallel [-Wunknown-pragmas] 我单独编译一个 demo 是正常的 加入到现有工程就报这个警告 |
6
Fishdrowned 2017 年 5 月 6 日 via Android
|
7
aliipay OP @Fishdrowned
这个试过了,能提高 10%左右 |
8
zk8802 2017 年 5 月 6 日 via iPhone
开启优化之后,编译器应该可以自动进行 loop unrolling 的。你编译之后的汇编代码长什么样?
|
9
zwzmzd 2017 年 5 月 6 日 via iPhone
|
10
billlee 2017 年 5 月 6 日
你编译的时候加了 -march=native 吗?
|
11
aliipay OP @billlee 每加,加了更慢
现在用的是-fprefetch-loop-arrays -g -ggdb -D__USE_ISOC99 -DNDEBUG -Ofast -fPIC -Wall -std=c++11 |
12
linux40 2017 年 5 月 7 日 via Android
不考虑 memcpy 吗
|
14
linux40 2017 年 5 月 7 日 via Android
不考虑 restrict 吗
|