XLA से जुड़ी गड़बड़ियों को, XLA से जुड़ी गड़बड़ी के अलग-अलग सोर्स के हिसाब से कैटगरी में बांटा जाता है. हर सोर्स में, गड़बड़ी के मैसेज के अलावा अन्य जानकारी की सूची होती है. यह सूची, कैटगरी में मौजूद हर गड़बड़ी के साथ अटैच की जाएगी.
🚧 ध्यान दें कि गड़बड़ी के मैसेज को स्टैंडर्ड बनाने का काम जारी है. इसलिए, फ़िलहाल सभी गड़बड़ी के मैसेज में गड़बड़ी का कोड नहीं जुड़ा होगा.
गड़बड़ी का लॉग इस तरह दिख सकता है:
XlaRuntimeError: RESOURCE_EXHAUSTED: XLA:TPU compile permanent error. Ran out of memory in memory space hbm. Used 49.34G of 32.00G hbm. Exceeded hbm capacity by 17.34G. Total hbm usage >= 49.34G: reserved 3.12M program unknown size arguments 49.34G
JaxRuntimeError: RESOURCE_EXHAUSTED: Ran out of memory in memory space vmem while allocating on stack for %ragged_latency_optimized_all_gather_lhs_contracting_gated_matmul_kernel.18 = bf16[2048,4096]{1,0:T(8,128)(2,1)} custom-call(%get-tuple-element.18273, %get-tuple-element.18274, %get-tuple-element.18275, %get-tuple-element.18276, %get-tuple-element.18277, /*index=5*/%bitcast.8695, %get-tuple-element.19201, %get-tuple-element.19202, %get-tuple-element.19203, %get-tuple-element.19204), custom_call_target=""
स्टेटस और CHECK फ़ेल होने की वजहें
आम तौर पर, XLA में हम दो तरीकों से खराब एक्ज़ीक्यूशन को फ़्लैग कर सकते हैं: स्टेटस और CHECK मैक्रो फ़ेल होने पर.
स्टेटस का इस्तेमाल, नुकसान न पहुंचाने वाली ऐसी गड़बड़ियों के लिए किया जाता है जिन्हें ठीक किया जा सकता है. यह माना जाता है कि फ़ंक्शन वैल्यू दिखाता है और एक्ज़ीक्यूशन उस पाथ पर जारी रहता है जहां कॉलर, दिखाए गए स्टेटस ऑब्जेक्ट की साफ़ तौर पर जांच करता है. यह अमान्य उपयोगकर्ता इनपुट या संसाधन की अनुमानित सीमाओं को मैनेज करने के लिए उपयोगी है.
दूसरी ओर, CHECK फ़ेल होने का मतलब है कि प्रोग्रामर की गड़बड़ियों या इनवेरिएंट के उल्लंघनों की वजह से ऐसा हुआ है. अगर कोड सही है, तो ऐसा कभी नहीं होना चाहिए. चालू किए गए CHECK के मामले में, प्रोग्राम गड़बड़ी के मैसेज को लॉग करेगा और तुरंत बंद हो जाएगा. इससे यह पक्का किया जा सकता है कि कोड में कोई गड़बड़ी न हो. जैसे, किसी पॉइंटर को डीरेफ़रंस करने से पहले, यह जांच करना कि वह शून्य नहीं है.
गड़बड़ी के कोड
यहां सभी गड़बड़ी कोड की इंडेक्स सूची दी गई है.