パーセンタイル指標(p50/p75/p90/p95/p99)の意味と使い分け
パフォーマンス監視
パーセンタイル指標は、全体のうち何%のリクエストがその値以下かを示す。
各指標の意味:
- p50(中央値): 50%のリクエストがこの値以下
- p95: 95%のリクエストがこの値以下
- p99: 99%のリクエストがこの値以下
具体例: 100リクエスト中、99回が200ms、1回が10秒の場合:
- 平均: 298ms(一見良好)
- p99: 10秒(実際には1%のユーザーが非常に遅い)
なぜ平均値ではなくパーセンタイルか:
- 平均値は外れ値に引っ張られる
- パーセンタイルは実際のユーザー体験を反映
- p95/p99をSLA設定に使用するのが一般的
ビジネスインパクト: 月間100万リクエストでp99=3秒の場合、1万リクエスト(1%)が3秒以上かかり、1万人のユーザーが「遅い」と感じる可能性がある。
推奨される監視設定:
- p95: 一般的なSLA設定に使用
- p99: 最悪ケースに近い体験の把握
- 平均値のみの監視は避ける