This tool is currently only available in nightly builds.
すべてのアクティビティ(TPU と GPU)は HW パフォーマンス カウンタを提供します。パフォーマンス カウンタ ツールは、プロファイリング セッション中に収集された HW パフォーマンス カウンタを表形式で表示します。ユーザーが関心のあるカウンタをフィルタして検索するために使用できます。
ツールの使用方法
このツールには、次の 4 つの列を含むテーブルが表示されます。
![[パフォーマンス カウンタ] ページ](https://openxla.org/static/xprof/images/perf_counters.png?hl=ja)
最初の列はタイトルなしで、行番号が表示されます。
[カウンタ] には、カウンタまたは指標の名前が表示されます。
[値(10 進数)] には、カウンタの数値が 10 進数で表示されます。
[値(16 進数)] には、カウンタの数値が 16 進数で表示されます。
表の上には、表の行のサブセットのみを表示するために使用できるフィルタがあります。
[ホスト] フィルタを使用すると、特定のホストマシンで収集されたカウンタのみを表示できます。
TPU プログラムの場合:
[チップ] フィルタを使用すると、特定のチップで収集されたカウンタのみを表示できます。
[Sample] フィルタを使用すると、プロファイルからサンプリングするカウンタを選択して表示できます。通常、プロファイルには、プロファイリング期間の終了時に取得された単一のサンプルが含まれます。このサンプルは、開始時にカウンタをクリアした後に取得されます。「継続的パフォーマンス カウンタ プロファイル」を使用する場合など、プロファイルに複数のサンプルが含まれることがあります。
「Set」フィルタを使用すると、選択したセットに属するカウンタのみを表示できます。「issue」は問題カウンタのみを選択します。
GPU プログラムの場合:
「Kernel」フィルタでは、GPU カーネル計算のフィンガープリントの名前を選択できます。
[デバイス] フィルタを使用すると、特定のデバイス(選択したホストに接続されている)で収集されたカウンタのみを表示できます。
「カウンタ」フィルタにはテキスト ボックスがあります。テキスト ボックスに文字列を入力すると、カウンタ名に入力文字列が部分文字列として含まれている行のみが表示されます。
デフォルトでは、ゼロ以外のカウンタのみが表示されます。