Инструмент статистики ядра графического процессора

Вы можете использовать инструмент GPU Kernel Stats для просмотра статистики производительности и исходной операции фреймворка для каждого ядра с ускорением GPU, запущенного во время сеанса профилирования. Этот инструмент помогает выявить потенциальные узкие места на низком уровне и выявляет возможности оптимизации.

Поддерживаемые платформы

Графический процессор: Поддерживается

ТПУ: не поддерживается

Компоненты интерфейса

Интерфейс инструмента GPU Kernel Stats представляет собой таблицу с одной строкой для каждой уникальной пары операций ядра-фреймворка. Вы можете щелкнуть любой из заголовков столбцов, чтобы отсортировать таблицу соответствующим образом. Порядок по умолчанию основан на общей продолжительности пары ядра-операции.

Таблица содержит следующую информацию для каждой пары ядро-операция:

  • Имя ядра: Имя запущенного ядра.
  • Регистров на поток: количество регистров графического процессора, используемых ядром на поток.
  • Используемая общая память: общий размер общей памяти, используемой ядром, в байтах.
  • Размер блока: Размеры блока резьбы, выраженные как blockDim.x, blockDim.y, blockDim.z.
  • Размеры сетки: Размеры сетки блоков потоков, выраженные как gridDim.x, gridDim.y, gridDim.z.
  • Теоретическая занятость: Теоретическая занятость графического процессора, выраженная в процентах. Это показатель способности скрывать задержку памяти.
  • Ядро использует Tensor Core: эвристика, указывающая, содержит ли само ядро ​​инструкции Tensor Core, на основе наличия общих инструкций Tensor Core.
  • Приемлемость тензорных ядер: эвристика, указывающая, имеет ли исходная операция фреймворка право использовать тензорные ядра, на основе часто встречающихся операций, использующих тензорные ядра.
  • Имя операции: Имя операции фреймворка, запустившей это ядро.
  • Вхождения: количество раз, когда данная пара ядро-операция была выполнена в течение периода профилирования.
  • Общая длительность (мкс): Накопленная сумма времени выполнения всех вхождений этой пары ядро-операция.
  • Средняя длительность (мкс): среднее время выполнения для всех случаев выполнения этой пары ядро-операция.
  • Минимальная продолжительность (мкс): наименьшее время выполнения, наблюдаемое для этой пары ядро-операция.
  • Максимальная длительность (мкс): самое длительное время выполнения, наблюдаемое для этой пары ядро-операция.