Framework Op Stats Tool

می توانید از Framework Op Stats برای مشاهده آمار عملکرد عملیات سطح چارچوب (به عنوان مثال، JAX یا TensorFlow) که در هاست و شتاب دهنده در طول جلسه پروفایل اجرا می شوند، استفاده کنید. این ابزار برای شناسایی اهداف بالقوه برای بهینه‌سازی عملکرد با برجسته کردن زمان‌برترین عملیات در طول دوره نمایه‌شده ارزشمند است.

پلتفرم های پشتیبانی شده

TPU: پشتیبانی می شود

GPU: پشتیبانی می شود

اجزای آمار عملیات چارچوب

Framework Op Stats دارای اجزای کلیدی زیر است:

  • جدول آمار عملیات چارچوب: این جزء اصلی است که تفکیک دقیقی از هر عملیات فریمورک اجرا شده در طول جلسه پروفایل در قالب جدولی را ارائه می دهد. یک ردیف برای هر عملیات فریمورک متمایز و ستون هایی وجود دارد که جزئیات مختلفی را در مورد آن عملیات ثبت می کند.
    • جعبه های جستجو به شما امکان می دهند بر اساس میزبان/دستگاه، نوع عملیات یا نام عملیات فیلتر کنید. فیلترها برای رشته ارائه شده که در هر نقطه از ستون مربوطه ظاهر می شود، انتخاب می کنند.
  • بخش نمودارهای خلاصه شده: این بخش دارای نمودارهایی است که جدول تفصیلی هر عملیات را به روش های زیر خلاصه می کند:
    • یک جفت نمودار دایره ای (یکی برای شتاب دهنده و دیگری برای میزبان) که کسری از زمان مصرف شده توسط دسته های مختلف عملیات فریم ورک را نشان می دهد.
    • نمودار دایره‌ای که کسری از زمان مصرف‌شده توسط عملیات‌های فریمورک مختلف را نشان می‌دهد (به عملیات‌های top-N کوتاه شده، و بقیه به‌عنوان «سایر» طبقه‌بندی می‌شوند تا خوانایی را بهبود بخشد)
  • بخش جداول خلاصه شده: این بخش دارای یک جفت جدول (یکی برای شتاب دهنده و یکی برای میزبان)، با تعداد رخدادها و کل زمان مصرف شده (هم به صورت مطلق و هم به صورت کسری از کل زمان جلسه) توسط دسته های مختلف عملیات فریم ورک است.
  • انتخابگر کشویی به شما امکان می دهد تصمیم بگیرید که آیا زمان بیکاری را در نمودارهای دایره ای و جداول خلاصه قرار دهید یا نه.

جزئیات جدول آمار عملیات چارچوب

برای مرتب کردن جدول آمار عملیات چارچوب، می توانید روی هر یک از عناوین ستون کلیک کنید. ترتیب پیش‌فرض بر اساس زمان خود کل عملیات است (همچنین در جدول "رتبه" نامگذاری شده است).

جدول شامل اطلاعات زیر برای هر عملیات است:

  • مکان اجرای عملیات: این که آیا عملیات بر روی هاست یا دستگاه اجرا می شود.
  • نوع عملیات چارچوب: اینها مستقیماً از رشته نام عملیات (آخرین قسمت پشته تماس) مشتق شده اند تا به مرتب سازی آسان کمک کنند.
  • نام عملیات چارچوب: این از فراداده سطح چارچوب که توسط XLA به XProf ارسال شده است، مشتق شده است.
  • اتفاقات: تعداد کل دفعاتی که این عملیات چارچوب خاص در طول دوره پروفایل اجرا شده است.
  • زمان کل (μs): زمان تجمعی صرف شده برای اجرای این عملیات در تمام موارد آن. اگر این عمل جراحی کودکی داشته باشد، این زمان شامل زمان صرف شده در آن کودکان می شود.
  • میانگین زمان (μs): میانگین زمان در هر اجرای این عملیات، شامل هر زمان صرف شده در عملیات کودکان، در صورت وجود.
  • زمان خود کل (μs): زمان تجمعی صرف شده صرفاً در بدنه این عملیات HLO، به استثنای هر زمانی که در عملیات فرزندان آن صرف شده است.
  • میانگین زمان خود (μs): میانگین زمان در هر اجرای این عملیات، به استثنای هر زمانی که در عملیات فرزندان آن صرف شده است.
  • کل زمان خود در دستگاه (%): زمان خود عملیات به عنوان درصدی از کل زمان روی دستگاه در تمام عملیات ها.
  • کل زمان خود انباشته در دستگاه (%): مجموع در حال اجرا کل زمان خود (%) برای همه عملیات هایی که زودتر به ترتیب مرتب شده فعلی ظاهر می شوند.
  • کل زمان خود در میزبان (%): زمان خود عملیات به عنوان درصدی از کل زمان روی میزبان در تمام عملیات ها.
  • کل زمان خود انباشته در میزبان (%): مجموع در حال اجرا کل زمان خود (%) برای همه عملیاتی که زودتر به ترتیب مرتب شده فعلی ظاهر می شوند.

می‌توانید از دکمه صادرات به‌عنوان CSV در سمت راست پنجره بالا استفاده کنید تا داده‌ها را از این جدول به‌عنوان یک فایل CSV صادر کنید و از کادر تأیید چاپ زیبا برای ارائه‌ی انسان‌پسندتر استفاده کنید.