ابزار آمار هسته GPU

می‌توانید از ابزار آمار هسته GPU برای مشاهده آمار عملکرد و عملیات چارچوب اولیه برای هر هسته شتاب‌دهی شده توسط GPU که در طول جلسه پروفایل راه‌اندازی می‌شود، استفاده کنید. این ابزار به شناسایی تنگناهای بالقوه در سطح پایین کمک می‌کند و فرصت‌های بهینه‌سازی را سطح می‌دهد.

پلتفرم های پشتیبانی شده

GPU: پشتیبانی می شود

TPU: پشتیبانی نمی شود

اجزای رابط

رابط ابزار GPU Kernel Stats یک جدول با یک ردیف برای هر جفت عملیات هسته-فریم ورک منحصر به فرد است. می توانید بر روی هر یک از عناوین ستون ها کلیک کنید تا جدول بر اساس آن مرتب شود. ترتیب پیش‌فرض بر اساس طول کل جفت kernel-op است.

جدول شامل اطلاعات زیر برای هر جفت kernel-op است:

  • Kernel name: نام هسته ای که راه اندازی شد.
  • ثبات در هر رشته: تعداد رجیسترهای GPU که توسط هسته در هر رشته استفاده می شود.
  • حافظه اشتراکی مورد استفاده: اندازه کل حافظه مشترک استفاده شده توسط هسته بر حسب بایت.
  • بعد بلوک: ابعاد بلوک نخ به صورت blockDim.x، blockDim.y، blockDim.z بیان می‌شود.
  • ابعاد شبکه: ابعاد شبکه بلوک های نخ به صورت gridDim.x، gridDim.y، gridDim.z بیان می شود.
  • اشغال نظری: اشغال نظری GPU به صورت درصد بیان می شود. این نشانه ای از توانایی پنهان کردن تاخیر حافظه است.
  • هسته از Tensor Core استفاده می کند: یک اکتشافی که نشان می دهد آیا هسته خود حاوی دستورالعمل های Tensor Core است، بر اساس وجود دستورالعمل های Tensor Core رایج.
  • واجد شرایط بودن Tensor Cores: یک اکتشافی که نشان می‌دهد آیا عملیات چارچوب مبدا واجد شرایط استفاده از Tensor Cores است یا خیر، بر اساس عملیات‌های معمولی که از Tensor Core استفاده می‌کنند.
  • نام عملیات: نام عملیات چارچوبی که این هسته را راه اندازی کرده است.
  • رخدادها: تعداد دفعاتی که این جفت عملیات هسته خاص در طول دوره پروفایل اجرا شده است.
  • مدت زمان کل (us): مجموع تجمعی زمان اجرای تمام رخدادهای این جفت هسته-عملیات.
  • میانگین مدت زمان (ما): میانگین زمان اجرا در تمام رخدادهای این جفت هسته-عملیات.
  • حداقل مدت زمان (ما): کوتاه ترین زمان اجرای مشاهده شده برای این جفت هسته-عملیات.
  • حداکثر مدت زمان (ما): طولانی ترین زمان اجرای مشاهده شده برای این جفت هسته-عملیات.