Strona Przegląd
Strona Przegląd zawiera ogólne podsumowanie dotyczące tego, jak model radził sobie podczas wykonywania profilu, jak dobrze korzystał z zasobów sprzętowych itp. Strona Przegląd stanowi punkt wyjścia do przeprowadzenia bardziej szczegółowej analizy za pomocą innych narzędzi w XProf.
Obsługiwane platformy
TPU: obsługiwane
GPU: obsługiwany
Strona przeglądu dostosowuje wyświetlane informacje na podstawie typu sprofilowanego akceleratora. W przypadku TPU pokazuje na przykład wykorzystanie jednostki macierzy (MXU) (tylko podczas trenowania) na podstawie liczników wydajności sprzętu, a w przypadku procesorów graficznych pokazuje podział czasu spędzonego na uruchamianiu jądra i wykonywaniu obliczeń.
Najważniejsze informacje na stronie Przegląd
- XProf rozróżnia profile treningowe i wywnioskowania, sprawdzając, czy zawierają one konkretne operacje XLA, które są wykonywane podczas propagacji wstecznej. Następnie automatycznie dostosowuje informacje wyświetlane na stronie przeglądu.
- W przypadku treningów obliczanie czasu kroku działa najlepiej, jeśli program użytkownika wyraźnie oznacza kroki w pętli treningowej. W przypadku braku tych informacji XProf używa heurystyki do oszacowania czasu trwania kroku, co może skutkować niższą dokładnością.
- Obecnie pracujemy nad obsługą podsumowania przebiegu wnioskowania. Niektóre dane mogą być nieprawidłowe.