Perf 计数器

This tool is currently only available in nightly builds.

所有加速器(TPU 和 GPU)都提供硬件性能计数器,而 Perf Counters 工具会以表格形式显示在剖析会话期间收集的硬件性能计数器。可用于过滤和搜索用户感兴趣的计数器。

如何使用该工具

  • 该工具会显示一个包含 4 列的表格:

    Perf 计数器页面

    • 第一列没有标题,显示的是行号。

    • “计数器”显示计数器或指标名称。

    • “值(十进制)”显示的是计数器的十进制数值。

    • “值(十六进制)”显示的是计数器的十六进制数值。

  • 表格上方有过滤条件,可用于仅显示表格中的部分行:

    • 借助“主机”过滤条件,您可以仅显示在给定主机上收集的计数器。

    • 对于 TPU 程序:

      • 借助“芯片”过滤条件,您可以仅显示在指定芯片上收集的计数器。

      • 借助“样本”过滤条件,您可以选择要显示哪些来自个人资料的计数器样本。配置文件通常包含在分析时间段结束时(在开始时清除计数器后)采集的单个样本。在某些情况下,一个配置文件可能包含多个样本,例如在使用“持续性能计数器配置文件”时。

      • “Set”过滤条件允许仅显示属于所选集的计数器,例如,“issue”仅选择问题计数器。

    • 对于 GPU 程序:

      • “内核”过滤器允许选择 GPU 内核计算指纹的名称。

      • 借助“设备”过滤条件,您可以仅显示在指定设备(连接到所选主机)上收集的计数器。

    • “计数器”过滤条件有一个文本框。在文本框中输入字符串后,系统只会显示计数器名称包含输入字符串(作为子字符串)的行。

  • 默认情况下,该工具仅显示非零计数器。