Übersichtsseite
Die Übersichtsseite bietet eine zusammengefasste Übersicht über die Leistung Ihres Modells während eines Profilings, die Auslastung der Hardwareressourcen usw. Die Übersichtsseite dient als Ausgangspunkt für detailliertere Analysen mit den anderen Tools in XProf.
Unterstützte Plattformen
TPU: unterstützt
GPU: unterstützt
Auf der Übersichtsseite werden die angezeigten Informationen anhand des Typs des geprofileten Accelerators angepasst. Bei TPUs wird beispielsweise eine Auslastungszahl für Matrixeinheiten (MXU, nur Training) basierend auf Hardwareleistungszählern angezeigt, während bei GPUs eine Aufschlüsselung der Zeit aufgeschlüsselt wird, die für Kernelstarts und für die Berechnung aufgewendet wird.
Wichtige Details für die Übersichtsseite
- XProf unterscheidet zwischen Trainings- und Inferenzprofilen, indem es sie auf bestimmte XLA-Vorgänge prüft, die während der Backpropagation ausgeführt werden. Anschließend werden die Informationen auf der Übersichtsseite automatisch angepasst.
- Bei Trainingsläufen funktioniert die Berechnung der Schrittzeit am besten, wenn der Nutzer Schritte im Trainings-Loop explizit annotiert. In Ermangelung dieser expliziten Informationen verwendet XProf Heuristiken, um die Schrittzeit zu schätzen, was zu einer potenziell geringeren Genauigkeit führt.
- Die Unterstützung für eine Übersicht über Inferenzläufe befindet sich derzeit in der Entwicklungsphase. Einige Daten sind möglicherweise falsch.