ابزار آمار هسته پردازنده گرافیکی

شما می‌توانید از ابزار GPU Kernel Stats برای مشاهده آمار عملکرد و عملیات اولیه فریم‌ورک برای هر هسته شتاب‌یافته با GPU که در طول یک جلسه پروفایلینگ اجرا شده است، استفاده کنید. این ابزار به شناسایی گلوگاه‌های بالقوه در سطح پایین کمک می‌کند و فرصت‌های بهینه‌سازی را آشکار می‌سازد.

پلتفرم‌های پشتیبانی‌شده

ابزار GPU Kernel Stats فقط روی پردازنده‌های گرافیکی (GPU) پشتیبانی می‌شود.

اجزای رابط

رابط ابزار GPU Kernel Stats جدولی با یک ردیف برای هر جفت عملیات منحصر به فرد kernel-frame است. می‌توانید روی هر یک از عناوین ستون‌ها کلیک کنید تا جدول بر اساس آن مرتب شود. ترتیب پیش‌فرض بر اساس کل مدت زمان جفت kernel-op است.

آمار هسته پردازنده گرافیکی XProf

جدول آمار هسته پردازنده گرافیکی (GPU Kernel Statistics Table) شامل اطلاعات زیر برای هر جفت عملیات هسته است:

  • نام هسته: نام هسته ای که راه اندازی شده است.
  • رجیسترها در هر رشته: تعداد رجیسترهای GPU که توسط هسته در هر رشته استفاده می‌شود.
  • حافظه مشترک استفاده شده: کل اندازه حافظه مشترک استفاده شده توسط هسته بر حسب بایت.
  • بُعد بلوک: ابعاد بلوک نخ که به صورت blockDim.x، blockDim.y، blockDim.z بیان می‌شود.
  • ابعاد شبکه: ابعاد شبکه بلوک‌های نخ که به صورت gridDim.x، gridDim.y، gridDim.z بیان می‌شوند.
  • اشغال نظری: اشغال نظری پردازنده گرافیکی که به صورت درصد بیان می‌شود. این نشانه‌ای از توانایی پنهان کردن تأخیر حافظه است.
  • هسته از Tensor Core استفاده می‌کند: یک روش اکتشافی که نشان می‌دهد آیا خود هسته شامل دستورالعمل‌های Tensor Core است یا خیر، بر اساس وجود دستورالعمل‌های رایج Tensor Core.
  • واجد شرایط بودن برای هسته‌های تنسور: یک روش اکتشافی که نشان می‌دهد آیا عملیات چارچوب اولیه واجد شرایط استفاده از هسته‌های تنسور است یا خیر، بر اساس عملیات رایجی که از هسته تنسور استفاده می‌کنند.
  • نام عملیات: نام عملیات چارچوبی که این هسته را راه‌اندازی کرده است.
  • تعداد دفعات اجرا: تعداد دفعاتی که این جفت عملیات هسته خاص در طول دوره پروفایلینگ اجرا شده است.
  • مدت زمان کل (us): مجموع تجمعی زمان اجرای همه رخدادهای این جفت عملیات هسته.
  • میانگین مدت زمان (us): میانگین زمان اجرا در تمام رخدادهای این جفت عملیات هسته.
  • حداقل مدت زمان (us): کوتاه‌ترین زمان اجرای مشاهده‌شده برای این جفت هسته-عملیات.
  • حداکثر مدت زمان (us): طولانی‌ترین زمان اجرای مشاهده شده برای این جفت هسته-عملیات.
  • کادرهای جستجو به شما امکان می‌دهند ردیف‌ها را بر اساس نام هسته GPU یا نام عملیات فیلتر کنید.
  • شما می‌توانید با کلیک بر روی دکمه‌ی «خروجی به عنوان CSV»، جدول را به یک فایل CSV خروجی بگیرید.

گزینه خروجی گرفتن از آمار هسته پردازنده گرافیکی XProf به فرمت CSV