原文链接:http://muchong.com/t-2238311-1-pid-3

并行平台构建与管理[8]:并行测试 GotoBLAS+hpl测试之L.dat各行意义及其设置

HPL.dat文件见附件
下面说说每行的意思和设置方法
1、2行,这个是说明性语句,不用更改。
3、4行,指定输出方式,加入4行选择file输出,则3表示输出文件名,这个名字可以根据你自己的习惯更改。比如,你测试16节点,为了区分其他测试,可以改为16nodes.out等等。
5、6行,5行相当于说你要测试的矩阵个数,第6行则是矩阵规模,第六行设置的数字必须不小于5行的大小。第6行的设置原则是:N^2*64=节点内存*节点数*8,N=0.8~0.9N。举个例子,我每节点有2G内存,4节点,N的算法为:N^2*64=1024*1024*1024*2*4*8,-〉N=32000~33000,再*0.8~0.9即可。按照经验,在0.9左右效果会更好。
7、8行设置矩阵分块方法。第7行是指分块方法的种数,第八行是指分块的大小,根据经验,对于GotoBLAS在AMD4000+上,用196,232,256效果比较好,当然其他也有一些说法,不过本人觉得经验性比较强,所以多试试总会有很好的结论。
9行是HPL 1.0a的新增项,是选择处理器阵列是按列的排列方式还是按行的排列方式。
10~12行说明二维处理器网格(P×Q)。二维处理器网格(P×Q)的要遵循以下几个要求:P×Q=进程数。这是HPL的硬性规定;P×Q=系统CPU数=进程数。一般来说一个进程对于一个CPU可以得到最佳性能。对于Intel Xeon来说,关闭超线程可以提高HPL性能;P≤Q,这是一个测试经验值,一般来说,P的值尽量取得小一点,因为列向通信量(通信次数和通信数据量)要远大于横向通信.等等这些,需要测试者多摸索。
后面的可以不用修改。
13行说明阈值。
第14~21行指明L分解的方式。

附件:
HPLinpack benchmark input file
Innovative Computing Laboratory, University of Tennessee
HPL.out      output file name (if any)
6            device out (6=stdout,7=stderr,file)
4            # of problems sizes (N)
10000 10000 10000 10000  Ns
4            # of NBs
1 2 3 4      NBs
0            PMAP process mapping (0=Row-,1=Column-major)
3            # of process grids (P x Q)
1 1 1        Ps
1 1 1        Qs
16.0         threshold
3            # of panel fact
0 1 2        PFACTs (0=left, 1=Crout, 2=Right)
2            # of recursive stopping criterium
2 4          NBMINs (>= 1)
1            # of panels in recursion
2            NDIVs
3            # of recursive panel fact.
0 1 2        RFACTs (0=left, 1=Crout, 2=Right)
1            # of broadcast
0            BCASTs (0=1rg,1=1rM,2=2rg,3=2rM,4=Lng,5=LnM)
1            # of lookahead depth
0            DEPTHs (>=0)
2            SWAP (0=bin-exch,1=long,2=mix)
64           swapping threshold
0            L1 in (0=transposed,1=no-transposed) form
0            U  in (0=transposed,1=no-transposed) form
1            Equilibration (0=no,1=yes)
8            memory alignment in double (> 0)

HPL.dat 配置说明相关推荐

  1. 山威SDUWH高性能计算课程HPL HPCC软件快速安装脚本

    写了一个编写过程和原理解释,有兴趣的同学可以看一下,一起交流^ ^ 2023年3月13日更新: 2022年3月2日更新: [重要]2020年3月14日 18:40更新: 2020年3月14日 11:4 ...

  2. HPL HPCG benchmark test

    本文章将记录多机和单机运行HPL和HPCG时碰到的问题,以及关于Linux使用的一些命令. 首先我想看一下这个文件是什么时候更新的,可以使用stat命令: stat:文件/文件系统的详细信息显示: 使 ...

  3. 安装GotoBLAS和hpl

    参考博客: 1.作者:安利FFF,博客链接https://blog.csdn.net/u014126257/article/details/110426847 2.作者:GUANYX~,博客链接htt ...

  4. 基于oneAPI的HPL.2.3编译安装

    基于oneAPI的HPL.2.3编译安装 1 环境准备 1.1 激活oneAPI环境变量 1.2 下载 HPL 2.3 源码包 1.3 解压缩 HPL 2.3 源码包 2 编译 2.1 复制模板到主目 ...

  5. HPL+Openmpi+GOTOBLAS2

    HPL+Openmpi+GOTOBLAS2 终于成功了!!! 废话:之前mpi安装的有问题,编译完之后不能mpirun真的让人头大..于是我就卸载了之前安装的mpich和lam4-dev,然后安装了o ...

  6. linux提示密码没有凑效,陈连福的生信博客 | 第16期培训班将于2021.01.23-2021.02.01期间在武汉市举办,提前报名有有优惠!...

    安装HPL软件 # 安装mpich wget http://www.mpich.org/static/downloads/3.3/mpich-3.3.tar.gz -P ~/software/ tar ...

  7. Linux高性能集群(AMD处理器)Linpack测试方法

    一.标准linpack简介 Linpack是国际上最流行的用于测试高性能计算机系统浮点性能的benchmark.通过对高性能计算机采用高斯消元法求解一元N次稠密线性代数方程组的测试,评价高性能计算机的 ...

  8. Linpack测试环境的搭建

    Linpack测试方法 一.编译器 安装gcc. 二.并行环境MPI的建立(MPI的使用需要用到Python) 1.创建SSH信任连接(在root目录下) (1)更改/etc/hosts文件 #vi ...

  9. Linux下Linpack测试CPU性能的相关库、环境搭建部署

    1.简介: Linpack是线性系统软件包(Linear system package) 的缩写,是国际上使用最广泛的测试高性能计算机系统浮点性能的基准测试. 2.相关条件: 编译器:支持C和Fort ...

最新文章

  1. Android执行shell命令
  2. html 接收 图片流_Microsoft Flow 利用自动化工作流增强Power BI使用效率
  3. eclipse下如何打开被关闭的项目_如何在Windows 10中打开和关闭平板电脑模式
  4. pycharm打包.py程序为可执行文件exe
  5. 最年轻图灵奖女性得主:谁说女的数学都比男的差
  6. web前端期末大作业--奥迪RS汽车主题官网设计(HTML+CSS+JavaScript)实现
  7. Java并发专题 带返回结果的批量任务运行 CompletionService ExecutorService.invokeAll
  8. Java Annotation(注解)使用教程
  9. 动手制作Dos、WinPE、Slax Linux|winpe+dos+Mini Linux U盘启动盘
  10. 蓝桥杯 ADV-84 算法提高 图形输出
  11. r语言 新增一列数字类型_R语言实战之R语言基础语法精讲(一)
  12. 【ACL2020】tBERT: 结合主题模型和BERT实现语义相似度分析
  13. PDF文件修改最常用的方式有哪些?
  14. 嵌入式编程规范与原则
  15. 为什么达芬奇能“艺工结合”,要从“T型设计”说起
  16. css 软键盘,移动端键盘,数字键盘效果实现
  17. html用手机什么软件能编写,目前编写一款简单的手机应用APP一般用什么编程语言?...
  18. C++ Reference: Standard C++ Library reference: C Library: cstdio: clearerr
  19. CloudComparePCL Ear Clipping三角化算法
  20. Zhong__安装配置ElasticSearch

热门文章

  1. 《算法撕裂者》系列0 - TopK问题
  2. 不要和一种编程语言厮守终生:为工作正确选择(转)
  3. 利用OpenCV的flip()函数实现图像的水平镜像(水平翻转)、垂直镜像(垂直翻转)
  4. python编程学了可以干嘛-学Python能干嘛,很少人知道的秘密
  5. WIN10 Hyper-V 新建虚拟机 步骤以及一些有坑的地方说明
  6. Windows10如何快速安装虚拟机! Hyper-V
  7. poj3723 招兵 最大权森林
  8. 微信小程序 - tab选项卡切换的实现方法
  9. 让Courier New字体完美显示中文
  10. (转)Linux下使用parted分区工具为大于2T硬盘分区