그래프 뷰어 도구
그래프 뷰어를 사용하여 XLA 프로그램의 그래프 구조를 시각화할 수 있습니다. 상위 수준 작업 (HLO) 그래프를 표시합니다.
지원되는 플랫폼
TPU: 지원됨
GPU: 지원됨
인터페이스 구성요소
그래프 뷰어는 다음 옵션으로 제어할 수 있습니다.
Select XLA Module(XLA 모듈 선택) 드롭다운 메뉴: 시각화할 수 있는 목록에서 HLO 모듈을 선택합니다.
Op Name(연산 이름) 상자: 연산의 이름을 입력하여 기본 노드로 선택하고 이웃을 시각화합니다. 연산자 이름을 입력한 후 Enter 키를 누르면 주변 노드가 시각화됩니다.
시각화에 포함된 기본 노드에서 노드까지의 최대 거리를 제어하는 그래프 너비 선택기입니다.
컴파일러에 포함된 작업 메타데이터의 표시를 전환하는 데 사용하는 메타데이터 선택기(있는 경우) 이 체크박스를 선택한 후에는 'Search Graph'(그래프 검색)를 다시 클릭해야 합니다.
융합된 연산의 구성요소를 접거나 펼치는 데 사용할 수 있는 융합 병합 체크박스 이 체크박스를 전환한 후에는 '그래프 검색'을 다시 클릭해야 합니다.
확대/축소 버튼 또는 키. 마우스를 사용하여 확대/축소할 수도 있습니다.
그래프를 SVG 또는 점 파일로 다운로드할 수 있는 링크입니다.
검색 기능을 사용하면 대규모 그래프 내에서 특정 작업을 빠르게 찾아 집중할 수 있습니다.
특정 연산에서 런타임 데이터 패널을 고정하려면 연산을 마우스 오른쪽 버튼으로 클릭합니다.
그래프 뷰어 사용
기본적으로 그래프 뷰어에는 선택된 작업이 없으므로 빈 화면이 표시됩니다. 관심 있는 연산을 검색하여 확대하고 그래프 탐색을 시작합니다. 다른 도구 (예: 가장 시간이 많이 소요되는 작업을 식별하는 Op 프로필 또는 파이프라인 버블의 원인을 식별하는 Trace Viewer) 중 하나로 시작하는 경우가 많습니다. 이러한 도구에서 op를 클릭하면 그래프 뷰어 내의 동일한 op로 연결되는 직접 링크가 표시됩니다.
HLO 작업을 나타내는 상자 위로 마우스를 가져가면 함수가 정의된 작업에 해당하는 사용자 코드 줄이 자주 표시됩니다. 이 정보는 이 메타데이터가 Python 프로그램이 가속기 실행 파일을 생성하는 과정에서 거치는 여러 변환 레이어를 통해 XProf에 제공되는 경우에만 사용할 수 있습니다.
프로파일러는 컴파일러 백엔드에서 가속기별 코드로 낮출 준비가 될 때 가까운 '최적화된 HLO' 그래프에서 HLO 수준 정보를 수신합니다. 따라서 그래프 뷰어와 모든 XProf 도구는 StableHLO 또는 ML 프레임워크에 가까운 표현이 아닌 이 하위 수준의 XLA 내부 HLO 표현을 처리합니다.
그래프 자체는 순전히 정적이며 프로그램을 실행하지 않고도 XLA에서 직접 가져오지만 그래프 뷰어는 그래프에 추가 런타임 정보를 오버레이하여 더 유용하게 만듭니다. 예를 들어 연산자 위로 마우스를 가져가면 UI 왼쪽에 프로필 기간 동안 해당 연산자가 실행된 횟수와 평균 실행 시간이 표시되는 섹션이 표시됩니다. 또한 다양한 사용률 및 대역폭 숫자를 계산하고 표시합니다. 이러한 숫자는 XLA의 정적 비용 분석을 사용하여 소비된 FLOPS 및 바이트 수를 고려하고 측정된 실행 시간을 기반으로 비율을 계산합니다.