【インフィニバンド】

InfiniBand(インフィニバンド) とは?

💡 GPU同士を"光速の高速道路"でつなぐネットワーク
📌 このページのポイント
GPUクラスタのInfiniBand接続 InfiniBandスイッチ GPUノード1 GPU×8 400Gbps GPUノード2 GPU×8 400Gbps GPUノード3 GPU×8 400Gbps ノード4 GPU×8 400Gbps RDMA対応 CPUを介さず直接メモリ転送 vs Ethernet レイテンシ→ 1μs以下(Eth→ 数十μs)
GPUクラスタのInfiniBand接続トポロジー
ひよこ ひよこ

InfiniBandって普通のLANケーブルと何が違うの?

ペンギン先生 ペンギン先生

普通のEthernetが「一般道」だとしたら、InfiniBandは「専用高速道路」みたいなものだよ。レイテンシが1マイクロ秒以下で、帯域も400Gbps以上出るんだ。

ひよこ ひよこ

なんでそんなに速いの?

ペンギン先生 ペンギン先生

RDMAという技術で、CPUを通さずにメモリ同士が直接データをやり取りできるんだ。荷物を倉庫から倉庫へ直送するイメージだね。CPUという「仲介業者」を通さないから速いんだよ。

ひよこ ひよこ

どんなところで使われてるの?

ペンギン先生 ペンギン先生

大規模なAI学習が代表例だね。ChatGPTのような大規模言語モデルを学習するとき、数千台のGPUが一斉にデータをやり取りする必要があるから、InfiniBandが必須なんだよ。

ひよこ ひよこ

Ethernetじゃダメなの?

ペンギン先生 ペンギン先生

最近は400GbEなどEthernetも高速化しているけど、レイテンシの低さではまだInfiniBandに軍配が上がるんだ。ただしコストが高いから、用途によって使い分けるのが現実的だね。

ひよこ ひよこ

NVIDIAがInfiniBandに関わってるって聞いたけど?

ペンギン先生 ペンギン先生

NVIDIAは2020年にMellanoxというInfiniBandの主要メーカーを買収したんだ。GPU+InfiniBandを一体で提供することで、AIクラスタ全体の性能を最適化する戦略だよ。これがNVIDIAの「データセンター支配」の鍵になっているんだね。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「InfiniBand」って出てきたら「GPUクラスタをつなぐ超高速ネットワーク」と思えればだいたいOK!
📖 おまけ:英語の意味
「InfiniBand」 = 無限の帯域
💬 Infinite(無限)+ Band(帯域)を組み合わせた造語で、「帯域幅の限界を超える」という意気込みが込められているんだよ
← 用語集にもどる