NVIDIA_Tesla
[Wikipedia|▼Menu]
□記事を途中から表示しています
[最初から表示]

M4/M40は主に機械学習ディープラーニング向けのソリューションとして提供されている[22] [23] [24] [25]

機種名GPU数CUDAメモリ性能
単精度
(TFLOPS)性能
倍精度
(TFLOPS)形状など
CUDAコア数SM数CUDAコアクロック (MHz)最大帯域幅 (GB/s)バス規格バス幅 (bit)総容量 (GiB)クロック (GHz)
M6 [26]1153612950

1051 (Boost)147.3GDDR525682.53.6 (Boost)0.11 (Boost)MXM
M60 [27]24096
(2048x2)32

(16x2)899

1178 (Boost)320

(160x2)GDDR525616
(8x2)2.59.65

(4.825x2)0.3

(0.15x2)フルハイト
M4 [28]110248517

1074 (Boost)88GDDR512842.752.2 (Boost)0.07 (Boost)ロープロファイル/
パッシブ
M40 [29]1307224948
1114 (Boost)288GDDR53841235.8
6.8 (Boost)0.18
0.21 (Boost)フルハイト/
パッシブ・ヒートシンク型

Pascalマイクロアーキテクチャ

最初の製品であるTesla P100は2016年4月に発表された[30]。16nmプロセスルールを採用。GP100ベースのP100では、Fermi世代のようなハーフレートの倍精度対応のほか、ダブルレートの半精度対応も実現されている(半精度の理論演算性能は単精度の場合の2倍になっている)。メモリに第2世代のHigh Bandwidth Memory (HBM2) を採用する。NVIDIA独自のインターコネクト規格であるNVLinkにも対応し、これまでプロセッサ間の通信ボトルネックとなっていたPCI Expressを大幅に超える伝送帯域幅を実現できる。

GP102ベースのP40およびGP104ベースのP4では、倍精度の理論演算性能は単精度の場合の1/32になっている[31]。また、SMあたりのCUDAコア数は128、共有メモリも96KBとなっており、Maxwellアーキテクチャに近い[32]

機種名GPU数CUDAメモリ性能
単精度
(TFLOPS)性能
倍精度
(TFLOPS)形状など
CUDAコア数SM数CUDAコアクロック (MHz)最大帯域幅 (GB/s)バス規格バス幅 (bit)総容量 (GiB)クロック (GHz)
P4 [33]1256020810
1063 (Boost)192GDDR5256834.15
5.44 (Boost)0.13
0.17 (Boost)ロープロファイル
P40 [34]13840301303
1531 (Boost)346GDDR5384247.2510.01
11.76 (Boost)0.31
0.36(Boost)フルハイト
P100 PCIe [35]13584561189
1328 (Boost)540 /

720HBM2409612 /

160.7159.5 (Boost)4.8 (Boost)フルハイト/

パッシブ
P100 SXM2 [36]13583561328
1480 (Boost)720HBM24096160.71510.6 (Boost)5.3 (Boost)NVLink/

パッシブ

Voltaマイクロアーキテクチャ[37]

最初の製品であるTesla V100は2017年5月に発表された[38]。12nmプロセスルールを採用。行列演算を実行するための専用プロセッサ「Tensor Core」を搭載する。

機種名GPU数CUDAメモリ性能
単精度
(TFLOPS)性能
倍精度
(TFLOPS)形状など
CUDAコア数SM数CUDAコアクロック (MHz)最大帯域幅 (GB/s)バス規格バス幅 (bit)総容量 (GiB)クロック (GHz)
V100 PCIe15120801245
1380 (Boost)900HBM24096160.87614 (Boost)7 (Boost)フルハイト/

パッシブ
V100 SXM215120801312

1530 (Boost)900HBM24096160.87615 (Boost)7.5 (Boost)NVLink/

パッシブ

Turingマイクロアーキテクチャ

Tesla T4が2018年9月に発売された。

機種名GPU数CUDAメモリ性能
単精度
(TFLOPS)性能
倍精度
(TFLOPS)形状など
CUDAコア数SM数CUDAコアクロック (MHz)最大帯域幅 (
GB/s)バス規格バス幅 (bit)総容量 (GiB)クロック (GHz)
T41256040585

1590 (Boost)320GDDR6256161.258.1不明フルハイト

Ampereマイクロアーキテクチャ

最初の製品であるTesla A100は2020年5月に発売された。

機種名GPU数CUDAメモリ性能
単精度
(TFLOPS)性能
倍精度
(TFLOPS)形状など
CUDAコア数SM数CUDAコアクロック (MHz)最大帯域幅 (
GB/s)バス規格バス幅 (bit)総容量 (GiB)クロック (GHz)
A211280不明1440

1770 (Boost)200GDDR6128166.254.5310.14ハーフハイト
A101921684885

1695 (Boost)600GDDR638424不明31.240.976フルハイト
A1645120

(1280x4)20885

1695 (Boost)800

(200x4)GDDR6128x464

(16x4)6.2518.432

(4.608x4)1.0848フルハイト/

2スロット
A3013584128930

1440 (Boost)933HBM23072241.21510.325.161フルハイト/

2スロット
A40110752841305

1740 (Boost)696GDDR6384487.25137.421.168フルハイト/

2スロット
A100 PCIe16912108765

1410 (Boost)1555HBM2512040 / 80不明19.59.7フルハイト/

2スロット
A100 SXM1555

2039不明SXM(英語版)

Hopperマイクロアーキテクチャ

最初の製品であるTesla H100は2022年3月に発売された。

機種名GPU数CUDAメモリ性能
単精度
(TFLOPS)性能
倍精度
(TFLOPS)形状など
CUDAコア数SM数CUDAコアクロック (MHz)最大帯域幅 (
GB/s)バス規格バス幅 (bit)総容量 (GiB)クロック (GHz)
H100 PCIe1145921141065

1650 (Boost)2000HBM2e512080不明4824フルハイト/

2スロット
H100 SXM1168961323350HBM3不明6030SXM(英語版)
H200 SXM4800HBM3e141不明6734SXM

脚注^Release 352 Quadro, NVS, Tesla, GRID, & Notebook Drivers - Version 353.06; RN-WQ35306-01_v01 。June 1, 2015; Windows 7, Windows 8, & Windows 8.1; Release Notes
^ NVIDIA、G80ベースのHPC向けGPU「Tesla」
^Tesla Technical Brief (PDF)


次ページ
記事の検索
おまかせリスト
▼オプションを表示
ブックマーク登録
mixiチェック!
Twitterに投稿
オプション/リンク一覧
話題のニュース
列車運行情報
暇つぶしWikipedia

Size:43 KB
出典: フリー百科事典『ウィキペディア(Wikipedia)
担当:undef