展示一下MSVC的逆天优化

写了一个优化版的快速排序（svQuickSort）和一个归并排序（svMergeSort），和stdlib中的qsort一较高下。
先说说svQuickSort使用的优化。
首先使用Median-3算法寻找pivot。
其次短排序使用插入排序优化。因为Shell sort是进阶版的插排
而且Shell sort是第一个打破Quadratic barrier的排序算法，所以短排序我们使用Shell sort优化。
别急，至此，Shell sort还能被优化。我们知道，一般来说Shell sort取得gap值是以2为倍数的，
但是这个gap还能被进一步优化。在维基百科上我找到了Macin Ciura‘s gap sequence
这个数组的使用使得Shell sort的效率又上了一个档次。
最后因为svQuickSort有4个参数，压栈的时候要压4个指针长度的整数。
我们可以自己制造一个raw stack总共需要压栈两个指针整数的长度即可。
详情请看下图代码。
测试结果，Linux上clang开O3优化执行后约22秒。
svMergeSort约27秒，stdlib自带的qsort约17秒。
接下来，用MSVC编译优化的结果就逆天了，
一个1024*1024*128的int数组排序耗时7.7秒！
MSVC自带的cstdlib排序用时11秒。

这是svQuickSort源码：
00

这是Shell sort源码：

MSVC优化编译测试结果：

以上代码均可以在这里下载：

逆天优化(×
面向msvc编程(✓

虽然我测你的svQuickSort是msvc比clang快，但std::qsort则是clang比msvc快。
以及Rust的sort_unstable最快（

粗略地看了一下msvcrt库的qsort实现。寻找pivot同样也是用Median-3算法，但是细节上略有不同，没有最后一次swap。CUTOFF为8，之后shortsort采用选择排序（非常合理）。后续的处理采用了一种更加复杂（将数组分为3部分，避免后续处理相等部分）和安全（避免了cmp(mid, mid)情况的出现）的实现方式，最后同样采用自定义栈来避免递归，栈深度为STKSIZ=(8*sizeof(void*) - 2)。
然后用IDA Pro看了一下WOW64中msvcrt的qsort，优化的并不是很好，但是跑出来的结果看起来还是比较满意的。

算算时间复杂度和空间复杂度

感觉如果纯算时间的话原始数组单次随机还不够吧还要尽量覆盖各种分布倾向吧

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频！

11回复贴，共1页

<<返回c语言吧

分享到:

日	一	二	三	四	五	六