ابزار آمار هسته GPU
میتوانید از ابزار آمار هسته GPU برای مشاهده آمار عملکرد و عملیات چارچوب اولیه برای هر هسته شتابدهی شده توسط GPU که در طول جلسه پروفایل راهاندازی میشود، استفاده کنید. این ابزار به شناسایی تنگناهای بالقوه در سطح پایین کمک میکند و فرصتهای بهینهسازی را سطح میدهد.
پلتفرم های پشتیبانی شده
GPU: پشتیبانی می شود
TPU: پشتیبانی نمی شود
اجزای رابط
رابط ابزار GPU Kernel Stats یک جدول با یک ردیف برای هر جفت عملیات هسته-فریم ورک منحصر به فرد است. می توانید بر روی هر یک از عناوین ستون ها کلیک کنید تا جدول بر اساس آن مرتب شود. ترتیب پیشفرض بر اساس طول کل جفت kernel-op است.
جدول شامل اطلاعات زیر برای هر جفت kernel-op است:
- Kernel name: نام هسته ای که راه اندازی شد.
- ثبات در هر رشته: تعداد رجیسترهای GPU که توسط هسته در هر رشته استفاده می شود.
- حافظه اشتراکی مورد استفاده: اندازه کل حافظه مشترک استفاده شده توسط هسته بر حسب بایت.
- بعد بلوک: ابعاد بلوک نخ به صورت blockDim.x، blockDim.y، blockDim.z بیان میشود.
- ابعاد شبکه: ابعاد شبکه بلوک های نخ به صورت gridDim.x، gridDim.y، gridDim.z بیان می شود.
- اشغال نظری: اشغال نظری GPU به صورت درصد بیان می شود. این نشانه ای از توانایی پنهان کردن تاخیر حافظه است.
- هسته از Tensor Core استفاده می کند: یک اکتشافی که نشان می دهد آیا هسته خود حاوی دستورالعمل های Tensor Core است، بر اساس وجود دستورالعمل های Tensor Core رایج.
- واجد شرایط بودن Tensor Cores: یک اکتشافی که نشان میدهد آیا عملیات چارچوب مبدا واجد شرایط استفاده از Tensor Cores است یا خیر، بر اساس عملیاتهای معمولی که از Tensor Core استفاده میکنند.
- نام عملیات: نام عملیات چارچوبی که این هسته را راه اندازی کرده است.
- رخدادها: تعداد دفعاتی که این جفت عملیات هسته خاص در طول دوره پروفایل اجرا شده است.
- مدت زمان کل (us): مجموع تجمعی زمان اجرای تمام رخدادهای این جفت هسته-عملیات.
- میانگین مدت زمان (ما): میانگین زمان اجرا در تمام رخدادهای این جفت هسته-عملیات.
- حداقل مدت زمان (ما): کوتاه ترین زمان اجرای مشاهده شده برای این جفت هسته-عملیات.
- حداکثر مدت زمان (ما): طولانی ترین زمان اجرای مشاهده شده برای این جفت هسته-عملیات.