XProf, मशीन लर्निंग के लिए प्रोफ़ाइलिंग और परफ़ॉर्मेंस का विश्लेषण करने वाला टूल है.
सुविधाएं
- हार्डवेयर इवेंट और काउंटर के साथ-साथ कंपाइलर मेटाडेटा के आधार पर, प्रोफ़ाइल की अच्छी क्वालिटी की जानकारी.
- डेटा इकट्ठा करने में कम खर्च होता है. आम तौर पर, प्रोफ़ाइलिंग के दौरान टीपीयू पर 1% से कम और जीपीयू पर 5% से कम खर्च होता है.
- टूल का एक बड़ा सुइट, जो आपके वर्कलोड के बारे में पूरी जानकारी देता है:
- खास जानकारी वाला पेज: प्रोफ़ाइल के चलने के दौरान आपके मॉडल की परफ़ॉर्मेंस के बारे में, एग्रीगेट किए गए टॉप-लेवल व्यू देखें. इसमें यह भी दिखेगा कि उसने हार्डवेयर संसाधनों का कितना अच्छा इस्तेमाल किया.
- ट्रेस व्यूअर: इससे, हुए इवेंट की ज़्यादा जानकारी वाली टाइमलाइन देखी जा सकती है. साथ ही, यह भी पता चलता है कि सिस्टम के किस हिस्से ने इवेंट को पूरा किया (उदाहरण के लिए, सीपीयू, टीपीयू या जीपीयू).
- ग्राफ़ व्यूअर: अपने XLA प्रोग्राम के ग्राफ़ स्ट्रक्चर को विज़ुअलाइज़ करें. यह हाई लेवल ऑपरेशंस (एचएलओ) ग्राफ़ दिखाता है.
- मेमोरी व्यूअर: प्रोग्राम के पूरे जीवनकाल में मेमोरी के इस्तेमाल को विज़ुअलाइज़ करें और मेमोरी के ज़्यादा से ज़्यादा इस्तेमाल के समय, मेमोरी में मौजूद कॉन्टेंट की जानकारी देखें.
- मेमोरी प्रोफ़ाइल: प्रोग्राम के दौरान, अपने ऐक्सेलरेटर के डाइनैमिक मेमोरी इस्तेमाल को विज़ुअलाइज़ करें.
- एचएलओ ऑपरेशन प्रोफ़ाइल: अपने प्रोग्राम से किए गए, अलग-अलग कैटगरी के हाई लेवल ऑपरेशन (एचएलओ) ऑपरेशन के लिए हार्डवेयर की परफ़ॉर्मेंस को समझें.
- एचएलओ ऑपरेशन के आंकड़े: अपने प्रोग्राम से किए गए, हाई लेवल ऑप्टिमाइज़र (एचएलओ) ऑपरेशन की परफ़ॉर्मेंस के आंकड़े देखें. साथ ही, एचएलओ ग्राफ़ में सबसे ज़्यादा समय लेने वाले ऑपरेशन की पहचान करें.
- फ़्रेमवर्क के ऑपरेशन के आंकड़े: फ़्रेमवर्क-लेवल के ऑपरेशन की परफ़ॉर्मेंस के आंकड़े देखें. उदाहरण के लिए, JAX, TensorFlow या PyTorch/XLA) का इस्तेमाल किया जाता है.
- रूफ़लाइन विश्लेषण: एक आसान विज़ुअल परफ़ॉर्मेंस मॉडल देखें. इससे, आपके प्रोग्राम की परफ़ॉर्मेंस पर असर डालने वाली, हार्डवेयर की बुनियादी सीमाओं के बारे में पता चलता है. साथ ही, यह भी पता चलता है कि प्रोग्राम पर मेमोरी का असर पड़ रहा है या कंप्यूट का.
- मेगास्केल आंकड़े: एक से ज़्यादा TPU स्लाइस पर काम करने वाले वर्कलोड के बीच इंटर-स्लाइस कम्यूनिकेशन की परफ़ॉर्मेंस का विश्लेषण करें. ये वर्कलोड, डेटा सेंटर नेटवर्क (डीसीएन) पर कम्यूनिकेट करते हैं.
- जीपीयू कर्नेल के आंकड़े: अपने प्रोग्राम में, जीपीयू की मदद से तेज़ किए गए हर कर्नेल की परफ़ॉर्मेंस के आंकड़े और ऑरिजिनल फ़्रेमवर्क ऑपरेशन देखें.
शुरू करें
इंस्टॉल करने के निर्देशों के लिए, XProf को आसानी से इस्तेमाल करना देखें.
अगर आपने Google Cloud का इस्तेमाल करके अपना वर्कलोड चलाया है, तो हमारा सुझाव है कि आप xprofiler टूल का इस्तेमाल करें. यह XProf पर चलने वाले वर्चुअल मशीन का इस्तेमाल करके, प्रोफ़ाइल इकट्ठा करने और देखने का बेहतर अनुभव देता है.
XProf की सुविधाओं का तुरंत डेमो पाने के लिए, डेमो नोटबुक आज़माएं.
Tensorboard इंटिग्रेशन
पहले, XProf को इंस्टॉल और इस्तेमाल करने का सिर्फ़ एक तरीका था. इसके लिए, Tensorboard का इस्तेमाल करना पड़ता था. इसे tensorboard प्लग इन प्रोफ़ाइल कहा जाता था. हो सकता है कि कुछ पुराने दस्तावेज़ों में अब भी इस शब्द का इस्तेमाल किया गया हो. यह इंटिग्रेशन अब ज़रूरी नहीं है: Tensorboard को टूल के XProf सुइट के कंटेनर के तौर पर देखा जा सकता है. इसे स्टैंडअलोन के तौर पर भी इंस्टॉल और इस्तेमाल किया जा सकता है.