ابزار آمار هسته پردازنده گرافیکی
شما میتوانید از ابزار GPU Kernel Stats برای مشاهده آمار عملکرد و عملیات اولیه فریمورک برای هر هسته شتابیافته با GPU که در طول یک جلسه پروفایلینگ اجرا شده است، استفاده کنید. این ابزار به شناسایی گلوگاههای بالقوه در سطح پایین کمک میکند و فرصتهای بهینهسازی را آشکار میسازد.
پلتفرمهای پشتیبانیشده
ابزار GPU Kernel Stats فقط روی پردازندههای گرافیکی (GPU) پشتیبانی میشود.
اجزای رابط
رابط ابزار GPU Kernel Stats جدولی با یک ردیف برای هر جفت عملیات منحصر به فرد kernel-frame است. میتوانید روی هر یک از عناوین ستونها کلیک کنید تا جدول بر اساس آن مرتب شود. ترتیب پیشفرض بر اساس کل مدت زمان جفت kernel-op است.

جدول آمار هسته پردازنده گرافیکی (GPU Kernel Statistics Table) شامل اطلاعات زیر برای هر جفت عملیات هسته است:
- نام هسته: نام هسته ای که راه اندازی شده است.
- رجیسترها در هر رشته: تعداد رجیسترهای GPU که توسط هسته در هر رشته استفاده میشود.
- حافظه مشترک استفاده شده: کل اندازه حافظه مشترک استفاده شده توسط هسته بر حسب بایت.
- بُعد بلوک: ابعاد بلوک نخ که به صورت blockDim.x، blockDim.y، blockDim.z بیان میشود.
- ابعاد شبکه: ابعاد شبکه بلوکهای نخ که به صورت gridDim.x، gridDim.y، gridDim.z بیان میشوند.
- اشغال نظری: اشغال نظری پردازنده گرافیکی که به صورت درصد بیان میشود. این نشانهای از توانایی پنهان کردن تأخیر حافظه است.
- هسته از Tensor Core استفاده میکند: یک روش اکتشافی که نشان میدهد آیا خود هسته شامل دستورالعملهای Tensor Core است یا خیر، بر اساس وجود دستورالعملهای رایج Tensor Core.
- واجد شرایط بودن برای هستههای تنسور: یک روش اکتشافی که نشان میدهد آیا عملیات چارچوب اولیه واجد شرایط استفاده از هستههای تنسور است یا خیر، بر اساس عملیات رایجی که از هسته تنسور استفاده میکنند.
- نام عملیات: نام عملیات چارچوبی که این هسته را راهاندازی کرده است.
- تعداد دفعات اجرا: تعداد دفعاتی که این جفت عملیات هسته خاص در طول دوره پروفایلینگ اجرا شده است.
- مدت زمان کل (us): مجموع تجمعی زمان اجرای همه رخدادهای این جفت عملیات هسته.
- میانگین مدت زمان (us): میانگین زمان اجرا در تمام رخدادهای این جفت عملیات هسته.
- حداقل مدت زمان (us): کوتاهترین زمان اجرای مشاهدهشده برای این جفت هسته-عملیات.
- حداکثر مدت زمان (us): طولانیترین زمان اجرای مشاهده شده برای این جفت هسته-عملیات.
- کادرهای جستجو به شما امکان میدهند ردیفها را بر اساس نام هسته GPU یا نام عملیات فیلتر کنید.
- شما میتوانید با کلیک بر روی دکمهی «خروجی به عنوان CSV»، جدول را به یک فایل CSV خروجی بگیرید.
