基准及稳定性测试 
SonmiHPC集成了一套基准测试及稳定性测试套件。该套件要求使用非root用户进行测试,因此在进行相关测试之前,请切换到非root用户。
该测试套件主要用于生成以下程序的测试文件:
- HPCC
- FIO
- OpenFoam
- LAMMPS
- VASP
- STRESS
用户通过以下命令可以查看该测试套件的使用方法。
[sonmi@sonmi ~]$ sonmi-run-test-suite 
sonmihpc benchmark and stability test suite.
Usage:
    sonmi-run-test-suite [command] [option] [item]
Available Commands:
    submit    Submit the benchmark and stability jobs
    select    Select the nodes to run the test
    clean     Clean the jobs' output files
    result    Show the benchmark result
Available submit options:
    benchmark [item]
    stability [item]
Available test items:
    hpcc      benchmark
    fio       benchmark
    openfoam  benchmark
    lammps    benchmark/stability
    vasp      benchmark/stability
    stree     stability[sonmi@sonmi ~]$ sonmi-run-test-suite 
sonmihpc benchmark and stability test suite.
Usage:
    sonmi-run-test-suite [command] [option] [item]
Available Commands:
    submit    Submit the benchmark and stability jobs
    select    Select the nodes to run the test
    clean     Clean the jobs' output files
    result    Show the benchmark result
Available submit options:
    benchmark [item]
    stability [item]
Available test items:
    hpcc      benchmark
    fio       benchmark
    openfoam  benchmark
    lammps    benchmark/stability
    vasp      benchmark/stability
    stree     stability选择节点 
用户可以通过sonmi-run-test-suite select <nodes>来选择要进行测试的节点,默认为sonmi节点,下面以测试compute-0-0节点为例子。
[sonmi@sonmi ~]$ sonmi-run-test-suite select compute-0-0
You had selected the nodes: compute-0-0[sonmi@sonmi ~]$ sonmi-run-test-suite select compute-0-0
You had selected the nodes: compute-0-0要测试多个节点也可以用如下的命令实现,select子命令后的参数格式与slurm的一致。
[sonmi@sonmi ~]$ sonmi-run-test-suite select compute-0-[0-1],sonmi
You had selected the nodes: compute-0-[0-1],sonmi[sonmi@sonmi ~]$ sonmi-run-test-suite select compute-0-[0-1],sonmi
You had selected the nodes: compute-0-[0-1],sonmi基准测试 
目前基准测试主要包含了如下测试模块:
- HPCC
- FIO
- OpenFoam
- LAMMPS
- VASP
即可以针对以上的单个模块进行测试,也可以对所有模块进行测试。
HPCC测试 
运行HPCC测试之前需要修改以下的几个参数:
- Ns 
- NBs 
- Ps 
- Qs 
其中Ps*Qs=系统核数,这两个值通常取偶数,并且Ps <= Qs。
NBs为块大小,是将问题规模划分为块的基本单元,针对V2 CPU设置为256,V3、V4 CPU设置为192,V5 CPU设置为384。
Ns为Linkpack测试问题的规模大小,其值通常更集群中的内存大小相关,可以通过以下的公式进行计算。其中nodes为要测试的节点数量,memory为所有节点的内存空间, 以GB为单位。

[sonmi@sonmi ~]$ vim ~/test-suite/benchmark/hpcc/hpccinf.txt
... ...
12800        Ns
... ...
256          NBs
... ...
2            Ps
4            Qs
... ...[sonmi@sonmi ~]$ vim ~/test-suite/benchmark/hpcc/hpccinf.txt
... ...
12800        Ns
... ...
256          NBs
... ...
2            Ps
4            Qs
... ...修改完以上的参数之后就可以通过以下的命令提交测试。
sonmi-run-test-suite submit benchmark hpccsonmi-run-test-suite submit benchmark hpcc测试完成后可以通过以下命令查看测试结果:
sonmi-run-test-suite result hpccsonmi-run-test-suite result hpccFIO测试 
FIO主要用于对当前用户HOME目录所在的文件系统性能进行测试。用户可以通过以下命令进行测试:
sonmi-run-test-suite submit benchmark fiosonmi-run-test-suite submit benchmark fio测试完成后可以通过以下的命令查看测试结果:
sonmi-run-test-suite result fiosonmi-run-test-suite result fioOpenFoam测试 
该模块主要测试OpenFoam的基准测试。用户可以通过以下的命令进行测试:
sonmi-run-test-suite submit benchmark openfoamsonmi-run-test-suite submit benchmark openfoam测试完成后可以通过以下的命令查看测试结果:
sonmi-run-test-suite result openfoamsonmi-run-test-suite result openfoamLAMMPS测试 
该模块主要用于测试分子动力学程序LAMMPS的基准测试。用户可以通过以下的命令进行测试:
sonmi-run-test-suite submit benchmark lammpssonmi-run-test-suite submit benchmark lammps测试完成后可以通过以下的命令查看测试结果:
sonmi-run-test-suite result lammpssonmi-run-test-suite result lammpsVASP测试 
该模块主要用于测试第一性原理计算程序VASP的基准测试。用户可以通过以下的命令进行测试:
sonmi-run-test-suite submit benchmark vaspsonmi-run-test-suite submit benchmark vasp测试完成后可以通过以下的命令查看测试结果:
sonmi-run-test-suite result vaspsonmi-run-test-suite result vasp提交所有基准测试 
用户在修改完HPCC测试的输入文件之后,也可以通过以下的命令来一次性提交所有的基准测试:
sonmi-run-test-suite submmit benchmarksonmi-run-test-suite submmit benchmark测试完成之后用户可以通过以下的命令来查看所有的基准测试结果:
sonmi-run-test-suite resultsonmi-run-test-suite result稳定性测试 
目前的稳定性测试主要由以下的3个模块:
- LAMMPS
- VASP
- STRESS
每个模块的测试时间为2小时,总共6小时。在整个测试过程中查看CPU温度情况,以及根据是否发生宕机行为来评估集群的稳定性。
用户可以通过以下的命令来提交稳定性测试:
sonmi-run-test-suite submitsonmi-run-test-suite submit清空测试 
当用户测试完成后,若要重新进行测试,可以先清除原先残留的测试文件:
sonmi-run-test-suite cleansonmi-run-test-suite clean