基于经验的评价格式

每一个算法都会运行一系列的基准测试来证明性能。附录提供了性能计时机制的更多细节。一般来说,我们在两个不同的平台上运行算法:一个是通用的桌面环境,另一个是高端的Linux集群。这些平台基本上就是现有系统运行的平台了。为了正确地评测性能,一个测试套件由k个独立的实验组成(通常k≥10)。最好和最坏的结果将会作为离群点抛弃掉,剩余的k-2次实验结果会综合在一起,计算出平均值和标准方差。有一张表会表示问题样本的规模n,n从2~220