Инструмент статистики ядра графического процессора
Вы можете использовать инструмент GPU Kernel Stats для просмотра статистики производительности и исходной операции фреймворка для каждого ядра с ускорением GPU, запущенного во время сеанса профилирования. Этот инструмент помогает выявить потенциальные узкие места на низком уровне и выявляет возможности оптимизации.
Поддерживаемые платформы
Графический процессор: Поддерживается
ТПУ: не поддерживается
Компоненты интерфейса
Интерфейс инструмента GPU Kernel Stats представляет собой таблицу с одной строкой для каждой уникальной пары операций ядра-фреймворка. Вы можете щелкнуть любой из заголовков столбцов, чтобы отсортировать таблицу соответствующим образом. Порядок по умолчанию основан на общей продолжительности пары ядра-операции.
Таблица содержит следующую информацию для каждой пары ядро-операция:
- Имя ядра: Имя запущенного ядра.
- Регистров на поток: количество регистров графического процессора, используемых ядром на поток.
- Используемая общая память: общий размер общей памяти, используемой ядром, в байтах.
- Размер блока: Размеры блока резьбы, выраженные как blockDim.x, blockDim.y, blockDim.z.
- Размеры сетки: Размеры сетки блоков потоков, выраженные как gridDim.x, gridDim.y, gridDim.z.
- Теоретическая занятость: Теоретическая занятость графического процессора, выраженная в процентах. Это показатель способности скрывать задержку памяти.
- Ядро использует Tensor Core: эвристика, указывающая, содержит ли само ядро инструкции Tensor Core, на основе наличия общих инструкций Tensor Core.
- Приемлемость тензорных ядер: эвристика, указывающая, имеет ли исходная операция фреймворка право использовать тензорные ядра, на основе часто встречающихся операций, использующих тензорные ядра.
- Имя операции: Имя операции фреймворка, запустившей это ядро.
- Вхождения: количество раз, когда данная пара ядро-операция была выполнена в течение периода профилирования.
- Общая длительность (мкс): Накопленная сумма времени выполнения всех вхождений этой пары ядро-операция.
- Средняя длительность (мкс): среднее время выполнения для всех случаев выполнения этой пары ядро-операция.
- Минимальная продолжительность (мкс): наименьшее время выполнения, наблюдаемое для этой пары ядро-операция.
- Максимальная длительность (мкс): самое длительное время выполнения, наблюдаемое для этой пары ядро-операция.