AIが"詰まる"データセンター — East-Westトラフィックが爆増する仕組み


データセンターのトラフィックフロー インターネット (ユーザー) North-South ゲートウェイ / LB Server 1 GPU×8 Server 2 GPU×8 Server 3 GPU×8 East-West East-West North-South(外部) 全体の約20〜30% East-West(サーバー間) 全体の約70〜80%(AI時代に急増)
East-Westトラフィックの急増:AI分散学習がデータセンターを変える
ひよこ ひよこ

ペンギン先生、「AIでデータセンターネットワーク設計が変わってきた」って読んだんだけど、どういうこと?

ペンギン先生 ペンギン先生

普通のWebサービスのリクエスト(外→中)を「North-Southトラフィック」、データセンター内のサーバー同士の通信(横→横)を「East-Westトラフィック」と呼ぶんだよ。昔はNorth-Southが中心だったんだけど、今はEast-Westが全体の70〜80%を占めるようになってきたんだ。

ひよこ ひよこ

サーバー同士ってそんなにたくさん話してるの?なんでそんなに急に増えたの?

ペンギン先生 ペンギン先生

分散学習が原因だよ。GPT-4クラスのAIを学習させるとき、何百台ものGPUサーバーが1秒間に何百回もパラメータ重み)を互いに同期させるんだ。あのサイズのモデルは1台のサーバーには収まらないから、ネットワークを通じた「集団作業」が必要なんだよ。

ひよこ ひよこ

普通のオフィスのLANじゃだめなの?

ペンギン先生 ペンギン先生

速度が全然足りないんだよ。一般的なEthernetは10〜100Gbpsだけど、AI学習では400Gbps〜1.6Tbpsが必要になってきた。さらにレイテンシ(遅延)も超重要で、数μ秒の差が何千GPUで累積すると学習が何日も延びちゃう。具体的に比べてみよう。

項目従来EthernetInfiniBand/RoCEv2
帯域幅10〜100Gbps400Gbps〜1.6Tbps
レイテンシ数百μ秒1〜2μ秒以下
CPU負荷OS経由(高い)RDMACPUをバイパス)
主な用途WebトラフィックAI分散学習・HPC
RDMARemote Direct Memory Accessの略で、CPUを介さずGPUのメモリ同士が直接やり取りできる技術だよ。

ひよこ ひよこ

CPUを通らないってすごい!でもデータセンター全体の設計も変えないといけないの?

ペンギン先生 ペンギン先生

大きく変わってるよ。従来は「コア→集約→アクセス」の3層ツリー型でNorth-Southに最適化されてた。でも今はSpine-Leaf(スパイン-リーフ)アーキテクチャへの移行が進んでるんだ。スパイン(背骨)スイッチに全リーフ(葉)スイッチが直結されていて、どのサーバー間も2ホップ以内でつながり、遅延が均一になるよ。

ひよこ ひよこ

GoogleAWSみたいな大手はもうそういうネットワークを持ってるの?

ペンギン先生 ペンギン先生

かなり進んでいるよ。GoogleTPU学習専用の「Jupiter」ネットワークファブリックを持っていて、2026年時点で1.3Pb/s(ペタビット毎秒)の内部帯域を実現してるんだ。NVIDIAのH100/B200 GPUを搭載するDGXシステムでは400Gbps InfiniBandGPUを接続して、学習効率を従来比10倍以上にしているよ。

ひよこ ひよこ

AIが賢くなるほど、見えないところのネットワークも進化し続けるんだね!

ペンギン先生 ペンギン先生

まさにそう!生成AIのコストの多くは実はこのネットワーク設計に依存してるんだよ。East-Westの最適化が遅れると学習に何日も余計にかかったり、電力を無駄に消費したりする。「AIのかしこさ」の裏には、物理インフラの地道な進化があるんだね。