Обзорная страница

Страница обзора предоставляет агрегированное общее представление о том, как ваша модель работала во время профилирования, насколько эффективно она использовала аппаратные ресурсы и на что было потрачено время. Страница обзора служит отправной точкой для более детального анализа с использованием других инструментов XProf.

Обзорная страница XProf

Поддерживаемые платформы

Поддерживаются как TPU, так и GPU.

Компоненты страницы обзора

На странице «Обзор» показаны два основных раздела:

  • Сводка по производительности отображает сведения о среднем времени шага, соотношении операций фреймворка, выполненных на хосте и устройстве, проценте времени, потраченного на активное выполнение, и точности вычислений устройства.

  • График времени выполнения шага отображает график времени выполнения шага устройства (в миллисекундах) для всех профилируемых шагов. Каждый шаг разбит на несколько категорий (с разными цветами), в зависимости от того, на что затрачено время.

Страница обзора адаптирует отображаемую информацию в зависимости от типа профилируемого ускорителя. Например, для TPU отображается показатель использования матричных блоков (MXU) (только обучение) на основе счётчиков аппаратной производительности, тогда как для GPU отображается распределение времени, затраченного на запуск ядра, по сравнению с вычислительными процессами.

Основные сведения о странице обзора

  • XProf различает профили обучения и вывода, проверяя их на наличие определенных операций XLA, которые выполняются во время обратного распространения; затем он автоматически адаптирует информацию, представленную на странице обзора, соответствующим образом.
  • Для тренировочных прогонов расчёт времени шага работает лучше всего, если пользовательская программа явно аннотирует шаги в тренировочном цикле. При отсутствии такой явной информации XProf использует эвристический подход для оценки времени шага, что может привести к снижению точности.
  • Поддержка обзора прогонов вывода в настоящее время находится в стадии разработки; некоторые данные могут быть неверными.