GPU 使用率 (GPU Utilization)

  • GPU 全体の計算ユニットがどの程度活用されているかを示すもの
  • この指標は、GPU コアやシェーダーがどれだけ稼働しているかをパーセンテージで表示
  • 高負荷の演算処理が行われている場合、この数値は高くなる

メモリ使用率 (Memory Utilization)

  • GPU メモリ(VRAM)の使用量と利用可能なメモリ量の割合

GPU メモリ帯域幅の使用率 (Memory Bandwidth Utilization)

  • GPU のメモリバスがデータ転送に対してどれだけ使用されているかを示す
  • メモリ帯域幅は、GPU がメモリからデータを読み書きする速度を示し、この帯域幅の使用率が高いほど、メモリのアクセスが重要なボトルネックになっている可能性がある

温度 (Temperature)

  • GPU コアの温度を示す指標
  • 高温になると、GPU のパフォーマンスが制限される(サーマルスロットリング)ため、温度管理は重要
  • 温度が高すぎると自動的にクロック速度が低下し、全体のパフォーマンスが落ちる

電力使用率 (Power Utilization)

  • GPU が消費している電力の割合
  • GPU の消費電力を監視することで、演算処理がどれだけエネルギーを使用しているかを把握できる
  • 高負荷な演算やレンダリングでは、消費電力が増加するため、特定の処理において電力効率を最適化するためにも重要
  • nvidia-smi では「Power Draw」を確認

スレッド使用率 (Thread Utilization)

  • GPU 内で実行されているスレッドの利用率
  • 特定の演算処理が GPU コアのスレッドやスレッドブロック(CUDA ではワープ)がどの程度効率的に使用されているかを示す
  • スレッドが過剰に割り当てられていると、パフォーマンスに影響が出る可能性があります
  • NVIDIA の CUDA プロファイラや、AMD の GPU プロファイラなどで確認

バス使用率 (PCIe Bus Utilization)

  • GPU と CPU 間でデータが転送される PCIe バスの使用率
  • データの転送量が多い場合、この使用率が高くなる
  • バスがボトルネックになると、GPU が本来のパフォーマンスを発揮できないことがある
  • nvidia-smi では「PCIe Bandwidth Utilization」を確認

クロック速度 (Clock Speed)

  • GPU コアやメモリのクロック周波数
  • 演算処理中のクロック速度を確認することで、GPU が最高性能で動作しているかを確認できる
  • 負荷が高い状況ではクロックが上昇し、軽い処理ではクロックが低く抑えられる
  • nvidia-smi では「Clocks」セクションを確認

キューレイテンシー (Queue Latency)

  • 演算処理のキューに滞留している処理の待ち時間
  • キューの処理遅延が大きいと、GPU が十分に活用されていない可能性がある
  • リアルタイム処理ではレイテンシーの管理が重要

SM使用率 (Streaming Multiprocessor Utilization)

  • GPU 内部のストリーミングマルチプロセッサ(SM)の使用率
  • GPU コアがどれだけ効率的に使用されているかを示す重要な指標
  • CUDA では SM の使用率が高いほど、GPU の並列計算能力がフルに活用されていることを示します
  • NVIDIA の CUDA プロファイラや、AMD の GPU プロファイラなどで確認

インストラクションスループット (Instruction Throughput)

  • GPU が実行している命令のスループット(単位時間あたりの命令実行数)
  • 演算命令がどれだけ効率的に実行されているかを示す
  • 特定の演算(例えば行列計算や浮動小数点演算)におけるボトルネックを特定するために使用される