alt

Как сравнить производительность с помощью HPL?
Как сравнить производительность с помощью SHOC?

HPL RESULTS FOR NVIDIA GPU

Подробнее об установке HPL.

Мой файл с параметрами HPL.dat

HPLinpack benchmark input file
    Innovative Computing Laboratory, University of Tennessee
    HPL.out      output file name (if any)
    6            device out (6=stdout,7=stderr,file)
    1            # of problems sizes (N)
    30000 25000 30000 40000 Ns
    1             # of NBs
    768 1024 512 384 640 NBs
    0            PMAP process mapping (0=Row-,1=Column-major)
    1            # of process grids (P x Q)
    1 2 1 2 1        Ps
    1 2 2 2 4        Qs
    16.0         threshold
    1            # of panel fact
    0 1 2        PFACTs (0=left, 1=Crout, 2=Right)
    1            # of recursive stopping criterium
    2 8          NBMINs (>= 1)
    1            # of panels in recursion
    2            NDIVs
    1            # of recursive panel fact.
    0 1 2        RFACTs (0=left, 1=Crout, 2=Right)
    1            # of broadcast
    0 2          BCASTs (0=1rg,1=1rM,2=2rg,3=2rM,4=Lng,5=LnM)
    1            # of lookahead depth
    1 0          DEPTHs (>=0)
    1            SWAP (0=bin-exch,1=long,2=mix)
    192          swapping threshold
    1            L1 in (0=transposed,1=no-transposed) form
    1            U  in (0=transposed,1=no-transposed) form
    1            Equilibration (0=no,1=yes)
    8            memory alignment in double (> 0)

В таблице приведено время работы теста HPL для различных NVIDIA GPU, в секундах.

=============================================================================
  V100  |   K80     |          |         |         |          |
-----------------------------------------------------------------------------
  13.6  |   25.1    |          |         |         |          |
=============================================================================
Актуальная версия HPL для GPU покрыта тайной. Судя по тому, что в архиве от NVIDIA содержится копирайт 2011 года, сложно ожидать от современных GPU заявленных результатов. Поэтому в таблице приведено время расчетов, а не производительность.

SHOC RESULTS FOR NVIDIA GPU

Подробнее об установке SHOC.

В таблице приведена производительность (Гфлопс) с одинарной и двойной точностью, полученная для различных NVIDIA GPU, с помощью теста SHOC.

=============================================================================
  K40   |  V100  |          |          |         |         |          |
-----------------------------------------------------------------------------
  3652  |  15560 |          |          |         |         |          |
  1434  |  7830  |          |          |         |         |          |
=============================================================================