圖表檢視器工具

您可以使用圖表檢視器,以視覺化方式呈現 XLA 程式的圖表結構。這會顯示高階運算 (HLO) 圖表。

支援平台

TPU:支援

GPU:支援

介面元件

您可以使用下列選項控制圖表檢視器:

  1. 「Select XLA Module」下拉式選單,可讓您從可用清單中選擇要用於視覺化的 HLO 模組。

  2. 作業名稱方塊:輸入作業名稱,即可將其選為主要節點,並將相鄰節點顯示為可視化資料。輸入運算子名稱後按下 Enter 鍵,即可將周圍節點視覺化。

  3. 圖表寬度選取器,用於控制節點與視覺化中主要節點的最大距離。

  4. 中繼資料選取器,可用於切換是否顯示編譯器所納入的作業中繼資料 (如有)。請注意,選取這個核取方塊後,您必須再次點選「Search Graph」。

  5. 「Merge Fusion」核取方塊,可用於收合或展開已融合的運算元件。請注意,勾選這個核取方塊後,您必須再次按一下「搜尋圖表」。

  6. 放大/縮小按鈕或按鍵,但您也可以使用滑鼠縮放畫面。

  7. 下載圖表的 SVG 或 dot 檔案連結。

  8. 您可以使用搜尋功能,快速找出並專注於可能龐大的圖表中的特定作業。

  9. 如要將特定作業的執行階段資料面板凍結,請按一下該作業的滑鼠右鍵。

使用圖表檢視器

根據預設,Graph Viewer 不會選取任何運算,因此您會看到空白畫面。搜尋要放大的操作,然後開始遍歷圖表。通常,您會先使用其他工具 (例如 Op Profile,用於找出耗用時間最長的作業,或是 Trace Viewer,用於找出管線泡沫的原因)。在這些工具中按一下操作,即可在圖表檢視器中直接連結至相同的操作。

將滑鼠游標懸停在代表 HLO 作業的方塊上時,您經常會看到使用者程式碼的該行,對應函式定義所在的作業。只有在 Python 程式產生加速器可執行檔時,透過多層轉換將這項中繼資料提供給 XProf,才能取得這項資訊。

請注意,分析器會從「最佳化 HLO」圖表接收 HLO 層級資訊,這類資訊已接近編譯器後端準備將其降級為加速器專屬程式碼的程度。因此,Graph Viewer 和所有 XProf 工具都會處理這個低層級 XLA 內部 HLO 表示法,而不是 StableHLO 或接近 ML 架構的表示法。

雖然圖表本身是純靜態的,而且即使不執行程式也能直接從 XLA 取得,但圖表檢視器會在圖表上疊加額外的執行階段資訊,讓圖表更實用。舉例來說,將滑鼠游標懸停在作業上,UI 左側就會顯示該作業在設定檔時間長度內執行的次數,以及平均執行時間。它也會計算並顯示各種用量和頻寬數字;這些數字會採用 XLA 的靜態成本分析,針對 FLOPS 和消耗的位元組,並根據測量執行時間計算費率。