【れいてんし】

レイテンシ とは?

💡 リクエストから応答までの「待ち時間」
📌 このページのポイント
レイテンシ — リクエスト/レスポンスの時間 クライアント ブラウザ等 サーバー 処理実行 リクエスト送信 レスポンス受信 ← レイテンシ(往復時間) → 低レイテンシ 1〜50ms 快適な応答速度 ゲーム・通話向き 中レイテンシ 50〜200ms Web閲覧は問題なし 多少の待ちを感じる 高レイテンシ 200ms以上 明らかな遅延を体感 操作性に影響大
レイテンシのイメージ
ひよこ ひよこ

レイテンシって何で決まるの?

ペンギン先生 ペンギン先生

①物理的な距離(光の速度の限界。東京↔ニューヨークで約100ms)、②ネットワーク機器の処理時間(ルーター、スイッチ)、③サーバーの処理時間(DB問い合わせ、アプリの計算)、④プロトコルオーバーヘッドTLSハンドシェイク等)。この合計がレイテンシだよ

ひよこ ひよこ

スループットとの違いは?

ペンギン先生 ペンギン先生

レイテンシは「1つのリクエストの応答速度」、スループットは「単位時間あたりの処理量」。高速道路に例えると、レイテンシは「東京から大阪までの所要時間」、スループットは「1時間に何台の車が通過するか」。両方が大事で、片方が良くてもサービス体験は悪くなりうるよ

ひよこ ひよこ

レイテンシを下げるには?

ペンギン先生 ペンギン先生

CDN(ユーザーの近くからコンテンツを配信)、②キャッシュRedisでミリ秒レベルで応答)、③コネクションプーリング(DB接続の使い回し)、④HTTP/2HTTP/3で接続確立を高速化、⑤データセンターの配置(ユーザーが多い地域にサーバーを設置)。地道な改善の積み重ねだよ

ひよこ ひよこ

P99レイテンシって何?

ペンギン先生 ペンギン先生

リクエストの99%が完了するまでの時間だよ。平均レイテンシが50msでも、1%のリクエストが5秒かかっていたらユーザー体験は最悪。P50(中央値)、P95(95パーセンタイル)、P99で「最悪のケースでもどれくらいか」を把握するのがSREの基本。AmazonはP99で100ms以下を目標にしているよ

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「レイテンシ」って出てきたら「リクエストから応答までの遅延時間」と思えればだいたいOK!
📖 おまけ:英語の意味
「Latency」 = 遅延
💬 Late(遅い)が語源。通信にかかる「遅延時間」を表す指標だよ
← 用語集にもどる