ওভারভিউ পৃষ্ঠা

ওভারভিউ পৃষ্ঠাটি প্রোফাইল রানের সময় আপনার মডেলটি কীভাবে পারফর্ম করেছে, হার্ডওয়্যার রিসোর্সগুলি কতটা ভালোভাবে ব্যবহার করেছে এবং কোথায় সময় ব্যয় করা হয়েছে তার একটি সমষ্টিগত শীর্ষ-স্তরের দৃশ্য প্রদান করে। ওভারভিউ পৃষ্ঠাটি XProf-এর মধ্যে অন্যান্য সরঞ্জামগুলি ব্যবহার করে আরও বিশদ বিশ্লেষণ অনুসরণ করার জন্য একটি সূচনা বিন্দু হিসাবে কাজ করে।

XProf overview page

সমর্থিত প্ল্যাটফর্মগুলি

Both TPU and GPU are supported.

Overview Page Components

TPU এবং GPU পরিবেশের মধ্যে ওভারভিউ পৃষ্ঠাটি ভিন্ন। এখানে উভয় বৈচিত্র্যের একটি বিশদ বিবরণ দেওয়া হল:

টিপিইউ (প্রশিক্ষণ)

  • Performance Summary contains:
    • গড় ধাপের সময় (শুধুমাত্র প্রশিক্ষণের জন্য) : নমুনাভুক্ত সমস্ত ধাপের উপর ধাপের গড় সময়।
    • FLOPS ব্যবহার
    • টিপিইউ ডিউটি ​​সাইকেল
    • মেমরি ব্যান্ডউইথ ব্যবহার
    • প্রোগ্রাম গুডপুট এফিসিয়েন্সি : এই হার্ডওয়্যারের আদর্শ পারফরম্যান্সের তুলনায় আপনার মডেলটি কেমন পারফর্ম করছে তা পরিমাপ করে।
    • TF Op প্লেসমেন্ট : op হোস্টে নাকি ডিভাইসে চলছে।
    • আগ্রহী সম্পাদনের উপর সময় ব্যয় করা : এই মেট্রিক আগ্রহী সম্পাদনের সাথে সম্পর্কিত সম্ভাব্য অপ্টিমাইজেশনগুলিকে গাইড করতে সহায়তা করে।
    • ডিভাইস কম্পিউট প্রিসিশন : ১৬-বিট কম্পিউটেশন এবং ৩২-বিট কম্পিউটেশন ব্যবহার করে ডিভাইস কম্পিউট সময়ের শতাংশ রিপোর্ট করে।
  • ধাপ-সময় গ্রাফ (প্রশিক্ষণ) নমুনাভুক্ত সমস্ত ধাপের উপর ধাপের সময়ের (মিলিসেকেন্ডে) একটি গ্রাফ প্লট করে। চার্টের প্রতিটি স্তূপীকৃত রঙ ধাপের সময়ের একটি বিভাগকে প্রতিনিধিত্ব করে, যেমন TensorCore নিষ্ক্রিয় সময় বা হোস্টের সাথে যোগাযোগ করার জন্য ব্যয় করা সময়।

টিপিইউ (অনুমান)

TPU ইনফারেন্স কাজের জন্য, দৃশ্যটি কিছুটা ভিন্ন:

স্টেপ-টাইম গ্রাফ বিভাগটি ইনফারেন্স সেশন লেটেন্সি ব্রেকডাউন বিভাগ দ্বারা প্রতিস্থাপিত হয়েছে এবং এতে একটি চার্ট অন্তর্ভুক্ত রয়েছে:

  • শতকরা হারে অনুমান সেশন লেটেন্সি : হোস্ট কম্পিউট, ডিভাইস কম্পিউট এবং হোস্ট-ডিভাইস যোগাযোগে অনুমান কাজের ব্যয় করা সময়ের অনুপাত দেখায়।

পারফরম্যান্স সারাংশ বিভাগে, গড় ধাপের সময় নিম্নলিখিত দ্বারা প্রতিস্থাপিত হয়:

  • গড় সেশন সময় (শুধুমাত্র অনুমান) : গড় সেশন সময় সহ সমস্ত সেশনের সেশন সময়ের বন্টন দেখানো একটি চার্ট।

জিপিইউ নির্দিষ্ট

ধাপ-সময় ভাঙ্গনে , গড় ধাপ সময়কে একাধিক বিভাগে ভাগ করা হয়েছে:

  • অন্যান্য সকল সময় : পাইথন ওভারহেড সহ অন্যান্য সকল সময়।
  • সংকলনের সময় : কার্নেলগুলি সংকলনে ব্যয়িত সময়।
  • আউটপুট সময় : আউটপুট ডেটা লেখার জন্য ব্যয় করা সময়।
  • ইনপুট সময় : ইনপুট ডেটা পড়ার জন্য ব্যয় করা সময়।
  • কার্নেল লঞ্চের সময় : কার্নেল লঞ্চের জন্য হোস্ট সময়।
  • Host Compute Time : Host computation time.
  • ডিভাইসের যৌথ যোগাযোগের সময় : যৌথ GPU যোগাযোগে ব্যয় করা সময়।
  • ডিভাইস থেকে ডিভাইসের সময় : ডিভাইস থেকে ডিভাইসের যোগাযোগের সময়।
  • ডিভাইস কম্পিউট সময় : ডিভাইসে কম্পিউটেশন সময়।

GPU প্রোফাইলের পারফরম্যান্স সারাংশে নিম্নলিখিত ক্ষেত্রগুলি অন্তর্ভুক্ত রয়েছে:

  • TF Op প্লেসমেন্ট : op হোস্টে নাকি ডিভাইসে চলছে।
  • আগ্রহী এক্সিকিউশনের উপর ব্যয়িত সময় : এই মেট্রিকটি আগ্রহী এক্সিকিউশনের অতিরিক্ত ব্যবহারের সাথে সম্পর্কিত সম্ভাব্য অপ্টিমাইজেশনগুলিকে গাইড করতে সহায়তা করে (গ্রাফ এক্সিকিউশনের বিপরীতে)।
  • ডিভাইস কম্পিউট প্রিসিশন : ১৬-বিট কম্পিউটেশন এবং ৩২-বিট কম্পিউটেশন ব্যবহার করে ডিভাইস কম্পিউট সময়ের শতাংশ রিপোর্ট করে।