এক্সপ্রোফ: অ্যাক্সিলারেটর পারফরম্যান্স বিশ্লেষণ

XProf মেশিন লার্নিং এর জন্য একটি প্রোফাইলিং এবং কর্মক্ষমতা বিশ্লেষণ টুল।

বৈশিষ্ট্য

  • হার্ডওয়্যার ইভেন্ট এবং কাউন্টার এবং কম্পাইলার মেটাডেটার উপর ভিত্তি করে উচ্চ মানের প্রোফাইল তথ্য।
  • কম সংগ্রহ ওভারহেড, সাধারণত প্রোফাইলিং সময়কালে TPU-তে <1% এবং GPU-তে <5%।
  • টুলের বিস্তৃত স্যুট আপনার কাজের চাপের গভীর উপলব্ধি প্রদান করে:
    • ওভারভিউ পৃষ্ঠা : প্রোফাইল চালানোর সময় আপনার মডেল কীভাবে পারফর্ম করেছে তার একটি সমষ্টিগত শীর্ষ-স্তরের ভিউ দেখুন, এতে হার্ডওয়্যার সংস্থানগুলি কতটা ভালভাবে ব্যবহার করা হয়েছে।
    • ট্রেস ভিউয়ার : ঘটে যাওয়া ইভেন্টগুলির একটি বিশদ টাইমলাইন কল্পনা করুন এবং সিস্টেমের কোন অংশ সেগুলি কার্যকর করেছে (যেমন, CPU, TPU, বা GPU)।
    • গ্রাফ ভিউয়ার : আপনার XLA প্রোগ্রামের গ্রাফ কাঠামো কল্পনা করুন। এটি হাই লেভেল অপারেশনস (HLO) গ্রাফ প্রদর্শন করে।
    • মেমরি ভিউয়ার : প্রোগ্রামের জীবদ্দশায় মেমরির ব্যবহার কল্পনা করুন এবং সর্বোচ্চ মেমরি ব্যবহারের বিন্দুতে মেমরির বিষয়বস্তুর বিশদ বিবরণে ডুব দিন।
    • মেমরি প্রোফাইল : আপনার প্রোগ্রামটি চালানোর সময় আপনার এক্সিলারেটরের গতিশীল মেমরি ব্যবহার কল্পনা করুন।
    • এইচএলও অপ প্রোফাইল : আপনার প্রোগ্রাম দ্বারা সম্পাদিত হাই লেভেল অপারেশন (এইচএলও) অপারেশনের বিভিন্ন বিভাগের জন্য হার্ডওয়্যার পারফরম্যান্স বুঝুন।
    • HLO Op পরিসংখ্যান : আপনার প্রোগ্রাম দ্বারা সম্পাদিত হাই লেভেল অপ্টিমাইজার (HLO) অপারেশনের পারফরম্যান্স পরিসংখ্যান দেখুন এবং আপনার HLO গ্রাফের মধ্যে সবচেয়ে বেশি সময়সাপেক্ষ অপারেশন চিহ্নিত করুন৷
    • ফ্রেমওয়ার্ক অপ পরিসংখ্যান : হোস্ট এবং অ্যাক্সিলারেটরে সম্পাদিত ফ্রেমওয়ার্ক-স্তরের অপারেশনগুলির (যেমন, JAX, TensorFlow, বা PyTorch/XLA) কর্মক্ষমতা পরিসংখ্যান দেখুন।
    • রুফলাইন বিশ্লেষণ : একটি স্বজ্ঞাত ভিজ্যুয়াল পারফরম্যান্স মডেল দেখুন যা আপনার প্রোগ্রামের কর্মক্ষমতাকে প্রভাবিত করে এমন অন্তর্নিহিত হার্ডওয়্যার সীমাবদ্ধতা দেখায়, এটি মেমরি-বাউন্ড বা কম্পিউট-বাউন্ড কিনা তা নির্দেশ করে।
    • মেগাস্কেল পরিসংখ্যান : ডেটা সেন্টার নেটওয়ার্ক (DCN) জুড়ে যোগাযোগ করে এমন একাধিক TPU স্লাইস বিস্তৃত ওয়ার্কলোডগুলির আন্তঃ-স্লাইস যোগাযোগ কর্মক্ষমতা বিশ্লেষণ করুন।
    • GPU কার্নেল পরিসংখ্যান : আপনার প্রোগ্রামে প্রতিটি GPU ত্বরিত কার্নেলের জন্য কর্মক্ষমতা পরিসংখ্যান এবং মূল কাঠামো অপারেশন দেখুন।

শুরু করা

ইনস্টলেশন নির্দেশাবলীর জন্য, XProf কুইক স্টার্ট দেখুন।

আপনি যদি আপনার কাজের চাপ চালানোর জন্য Google ক্লাউড ব্যবহার করেন, তাহলে আমরা xprofiler টুলের সুপারিশ করি। এটি XProf চলমান VM ব্যবহার করে একটি সুবিন্যস্ত প্রোফাইল সংগ্রহ এবং দেখার অভিজ্ঞতা প্রদান করে।

XProf ক্ষমতাগুলির একটি দ্রুত ডেমো পেতে, ডেমো নোটবুকটি চেষ্টা করুন৷

টেনসরবোর্ড ইন্টিগ্রেশন

ঐতিহাসিকভাবে, XProf ইনস্টল এবং ব্যবহার করার একমাত্র উপায় ছিল Tensorboard ব্যবহার করা। এটিকে টেনসরবোর্ড প্লাগইন প্রোফাইল বলা হত; কিছু পুরানো ডকুমেন্টেশন এখনও এই শব্দটি ব্যবহার করতে পারে। এই ইন্টিগ্রেশনটি এখন ঐচ্ছিক: আপনি XProf স্যুটের টুলস-এর জন্য একটি ধারক হিসাবে টেনসরবোর্ডকে ভাবতে পারেন, যেটি একই আচরণের সাথে ইনস্টল এবং স্বতন্ত্র ব্যবহার করা যেতে পারে।