XLA কাস্টম কল আপনাকে এমন কাস্টম কার্নেল বা অপারেশন সম্পাদন করার সুযোগ দেয় যা XLA দ্বারা স্বাভাবিকভাবে সমর্থিত নয়। ট্রেস ভিউয়ার-এর মধ্যে এই কাস্টম কলগুলির পারফরম্যান্স সম্পর্কে বিস্তারিত জানতে, আপনি নির্দিষ্ট XLA ফ্ল্যাগ ব্যবহার করে বিশদ ট্রেসিং এবং LLO (লো-লেভেল অপটিমাইজার) ডিবাগ তথ্য সক্রিয় করতে পারেন।
কাস্টম কল দৃশ্যমানতা সক্ষম করা
কাস্টম কল প্রোফাইলিং সক্রিয় করতে, আপনার ওয়ার্কলোড চালানোর সময় নিম্নলিখিত XLA ফ্ল্যাগগুলি সেট করতে হবে:
-
--xla_enable_custom_call_region_trace=true: এই ফ্ল্যাগটি কাস্টম কল থাকা অঞ্চলগুলির জন্য ট্রেসিং সক্ষম করে। -
--xla_xprof_register_llo_debug_info=true: এই ফ্ল্যাগটি LLO ডিবাগ তথ্য রেজিস্টার করে, যা XProf-কে কাস্টম কলের জন্য বিস্তারিত ইউটিলাইজেশন পরিসংখ্যান প্রদর্শন করতে সক্ষম করে।
উদাহরণ :
LIBTPU_INIT_ARGS="--xla_enable_custom_call_region_trace=true --xla_xprof_register_llo_debug_info=true" python your_jax_workload.py
এই ফ্ল্যাগগুলি সক্রিয় করা হলে, কাস্টম কলটি সম্পাদনকারী প্রতিটি TPU কোর বা ডিভাইসের জন্য ট্রেস ভিউয়ারে একটি নতুন LLO ইউটিলাইজেশন লাইন প্রদর্শিত হবে।
এলএলও ইউটিলাইজেশন লাইন
এলএলও ইউটিলাইজেশন লাইনটি একটি কাস্টম কল সম্পাদনের সময় হার্ডওয়্যার রিসোর্স কীভাবে ব্যবহৃত হয় তার একটি ভিজ্যুয়ালাইজেশন প্রদান করে। কাস্টম কার্নেলের (যেমন, প্যালাস বা মোজাইকে লেখা) অভ্যন্তরীণ বাধা বা বটলনেক শনাক্ত করার জন্য এটি বিশেষভাবে উপযোগী।

সর্বোত্তম অনুশীলন
- শুধুমাত্র প্রয়োজনে সক্রিয় করুন : এই ফ্ল্যাগগুলি ক্যাপচার করা প্রোফাইলের আকার বাড়াতে পারে এবং সংগ্রহের সময় পারফরম্যান্সে সামান্য প্রভাব ফেলতে পারে। এগুলি প্রধানত কাস্টম কল ডিবাগিং এবং অপ্টিমাইজ করার জন্য ব্যবহার করুন।
- LLO তথ্যের জন্য পরীক্ষা করুন : যদি আপনি এই ফ্ল্যাগগুলি সক্রিয় করেন কিন্তু LLO ব্যবহারের লাইনটি দেখতে না পান, তাহলে নিশ্চিত করুন যে আপনার কম্পাইলার ব্যাকএন্ড আপনার নির্দিষ্ট কাস্টম কল বাস্তবায়নের জন্য LLO ডিবাগ তথ্য নিবন্ধন করা সমর্থন করে।