ابزار تحلیل خط پشت بام

ابزار Roofline Analysis یک مدل عملکرد بصری بصری ارائه می دهد که می توانید از آن برای درک محدودیت های سخت افزاری ذاتی موثر بر عملکرد برنامه خود استفاده کنید. به طور خاص، بر روی این موضوع تمرکز می کند که آیا برنامه محدود به حافظه است یا محاسبات، و عملکرد برنامه چقدر نزدیک به اوج عملکرد تئوری سخت افزار است که به عنوان "خط سقف" نشان داده می شود.

پلتفرم های پشتیبانی شده

TPU: پشتیبانی می شود

GPU: پشتیبانی شده (در نسخه بتا)

نمودار خط سقف چیست؟

نمودار خط سقف رابطه بین شدت عملیاتی (FLOPS در هر بایت دسترسی) و FLOPS بدست آمده در ثانیه را به تصویر می کشد.

\[ Roofline = min(Operational Intensity \times Peak Memory Bandwidth, Peak FLOPS) \]

شکل "سقف" توسط پایین ترین FLOPS اوج و عملکرد قابل دستیابی با توجه به پهنای باند حافظه و شدت عملیاتی تشکیل می شود. نقطه برآمدگی حداقل شدت عملیاتی مورد نیاز برای رسیدن به اوج FLOPS را نشان می دهد.

می‌توانید در مورد مدل‌های خطوط سقف در Roofline: An Insightful Visual Performance Model for Floating-Point Programs and Multicore Architectures یا در مبحث مدل Roofline در ویکی پدیا اطلاعات بیشتری کسب کنید.

تفسیر نمودار خط پشت بام

با ترسیم شدت عملیات و FLOPS به دست آمده برای مراحل مختلف، بخش‌های برنامه، یا عملیات تک تک HLO بر روی نمودار خط سقف، می‌توانید بینشی در مورد تنگناهای عملکرد به دست آورید:

  • اگر یک نقطه داده در قسمت شیبدار خط سقف قرار داشته باشد، عملکرد احتمالاً توسط پهنای باند حافظه (محافظه به حافظه) محدود می شود. افزایش شدت عملیاتی (انجام محاسبات بیشتر به ازای هر بایت داده قابل دسترسی) به طور بالقوه می تواند عملکرد را بهبود بخشد.
  • اگر یک نقطه داده در قسمت صاف خط سقف قرار داشته باشد، عملکرد احتمالاً توسط قابلیت محاسبه (محاسبات محدود) محدود می شود. در این مورد، افزایش بیشتر شدت عملیات ممکن است منجر به افزایش عملکرد قابل توجهی نشود، مگر اینکه بتوان از حداکثر FLOPS سخت افزار بهتر استفاده کرد.
  • فاصله یک نقطه داده از خط سقف، پتانسیل بهبود عملکرد را نشان می دهد. فاصله بیشتر نشان می دهد که فرصت هایی برای بهینه سازی برنامه برای استفاده بهتر از قابلیت های سخت افزار وجود دارد.

اجزای رابط

رابط ابزار آنالیز Roofline دارای چندین جزء کلیدی است:

  • بخش اطلاعات دستگاه مشخصات سخت افزاری را شرح می دهد. اینها برای ترسیم استاتیک "خط(های)" روی نمودار استفاده می شوند
  • نمودار خط سقف در سطح برنامه با نقاط داده مربوط به موارد زیر:
    • کل مدت زمان پروفایل
    • کل مدت زمان نمایه، اما با داده‌های FLOPS/s که از شمارنده‌های عملکرد سخت‌افزار به‌جای مدل‌های هزینه پیش‌فرض محاسبه‌شده توسط کامپایلر XLA مشتق شده‌اند.
    • میانگین مراحل کاملی که در طول مدت نمایه اجرا شده است (برای مشاغل آموزشی، ممکن است اصطلاحات مرحله را برای کارهای استنتاج نادیده بگیرید).
    • هر مرحله کاملی که در طول مدت نمایه اجرا شده است (برای مشاغل آموزشی، ممکن است اصطلاحات مرحله را برای کارهای استنتاج نادیده بگیرید).
  • نمودار خط سقف نیز دارای ویژگی های زیر است:
    • می‌توانید با استفاده از منوی کشویی ارائه شده، عملیات ورودی/خروجی را اضافه یا حذف کنید.
    • نگه داشتن ماوس روی هر یک از نقاط داده در نمودار، اطلاعات مرتبط اضافی مانند اعداد پهنای باند برای حافظه های مختلف، کل زمان صرف شده و غیره را نشان می دهد.
  • یک جدول آماری در سطح برنامه که جزئیات بیشتری را برای هر نقطه داده ارائه می دهد، مانند حداکثر استفاده از حافظه، حداکثر نرخ FLOP، و غیره.
  • دومین نمودار خط سقفی که اطلاعات دقیق‌تری را ارائه می‌کند، با نقاط داده‌ای که برای ۱۰۰۰ عملیات زمان‌بر برتر در طول دوره نمایه‌سازی ترسیم شده‌اند:
    • مانند نمودار خط سقف در سطح برنامه، شناور کردن روی هر نقطه داده اطلاعات بیشتری در مورد آن عملیات به ارمغان می آورد.
    • می توانید نقاط داده نشان داده شده در نمودار را به روش های زیر سفارشی کنید:
      • شامل/استثنای عملیات ورودی و خروجی از طریق کشویی.
      • فیلتر کردن برای دسته های خاصی از عملیات.
      • فیلتر کردن عملیات محدود شده توسط یک منبع خاص.
      • فیلتر کردن برای یک عملیات با نام خاص.
  • یک جدول آماری دوم، مشابه جدول سطح برنامه، که جزئیات بیشتری را برای هر نقطه داده ارائه می کند.

در تمام بخش‌هایی که در بالا توضیح داده شد، حافظه‌های زیر پشتیبانی می‌شوند:

  • برای TPU ها: HBM، VMEM، CMEM (فقط TPU v4).
  • برای پردازنده‌های گرافیکی: HBM، L1/SharedMem.
  • خطوط مربوطه در نمودار فقط در صورتی ظاهر می شوند که در طول مدت نمایه عملیاتی وجود داشته باشد که توسط آن حافظه محدود شده باشد. به عنوان مثال، اگر همه عملیات ها یا HBM یا محاسباتی محدود باشند، خطوطی برای VMEM یا CMEM نخواهید دید.
،

ابزار تحلیل خط پشت بام

ابزار Roofline Analysis یک مدل عملکرد بصری بصری ارائه می دهد که می توانید از آن برای درک محدودیت های سخت افزاری ذاتی موثر بر عملکرد برنامه خود استفاده کنید. به طور خاص، بر روی این موضوع تمرکز می کند که آیا برنامه محدود به حافظه است یا محاسبات، و عملکرد برنامه چقدر نزدیک به اوج عملکرد تئوری سخت افزار است که به عنوان "خط سقف" نشان داده می شود.

پلتفرم های پشتیبانی شده

TPU: پشتیبانی می شود

GPU: پشتیبانی شده (در نسخه بتا)

نمودار خط سقف چیست؟

نمودار خط سقف رابطه بین شدت عملیاتی (FLOPS در هر بایت دسترسی) و FLOPS بدست آمده در ثانیه را به تصویر می کشد.

\[ Roofline = min(Operational Intensity \times Peak Memory Bandwidth, Peak FLOPS) \]

شکل "سقف" توسط پایین ترین FLOPS اوج و عملکرد قابل دستیابی با توجه به پهنای باند حافظه و شدت عملیاتی تشکیل می شود. نقطه برآمدگی حداقل شدت عملیاتی مورد نیاز برای رسیدن به اوج FLOPS را نشان می دهد.

می‌توانید در مورد مدل‌های خطوط سقف در Roofline: An Insightful Visual Performance Model for Floating-Point Programs and Multicore Architectures یا در مبحث مدل Roofline در ویکی پدیا اطلاعات بیشتری کسب کنید.

تفسیر نمودار خط پشت بام

با ترسیم شدت عملیات و FLOPS به دست آمده برای مراحل مختلف، بخش‌های برنامه، یا عملیات تک تک HLO بر روی نمودار خط سقف، می‌توانید بینشی در مورد تنگناهای عملکرد به دست آورید:

  • اگر یک نقطه داده در قسمت شیبدار خط سقف قرار داشته باشد، عملکرد احتمالاً توسط پهنای باند حافظه (محافظه به حافظه) محدود می شود. افزایش شدت عملیاتی (انجام محاسبات بیشتر به ازای هر بایت داده قابل دسترسی) به طور بالقوه می تواند عملکرد را بهبود بخشد.
  • اگر یک نقطه داده در قسمت صاف خط سقف قرار داشته باشد، عملکرد احتمالاً توسط قابلیت محاسبه (محاسبات محدود) محدود می شود. در این مورد، افزایش بیشتر شدت عملیات ممکن است منجر به افزایش عملکرد قابل توجهی نشود، مگر اینکه بتوان از حداکثر FLOPS سخت افزار بهتر استفاده کرد.
  • فاصله یک نقطه داده از خط سقف، پتانسیل بهبود عملکرد را نشان می دهد. فاصله بیشتر نشان می دهد که فرصت هایی برای بهینه سازی برنامه برای استفاده بهتر از قابلیت های سخت افزار وجود دارد.

اجزای رابط

رابط ابزار آنالیز Roofline دارای چندین جزء کلیدی است:

  • بخش اطلاعات دستگاه مشخصات سخت افزاری را شرح می دهد. اینها برای ترسیم استاتیک "خط(های)" روی نمودار استفاده می شوند
  • نمودار خط سقف در سطح برنامه با نقاط داده مربوط به موارد زیر:
    • کل مدت زمان پروفایل
    • کل مدت زمان نمایه، اما با داده‌های FLOPS/s که از شمارنده‌های عملکرد سخت‌افزار به‌جای مدل‌های هزینه پیش‌فرض محاسبه‌شده توسط کامپایلر XLA مشتق شده‌اند.
    • میانگین مراحل کاملی که در طول مدت نمایه اجرا شده است (برای مشاغل آموزشی، ممکن است اصطلاحات مرحله را برای کارهای استنتاج نادیده بگیرید).
    • هر مرحله کاملی که در طول مدت نمایه اجرا شده است (برای مشاغل آموزشی، ممکن است اصطلاحات مرحله را برای کارهای استنتاج نادیده بگیرید).
  • نمودار خط سقف نیز دارای ویژگی های زیر است:
    • می‌توانید با استفاده از منوی کشویی ارائه شده، عملیات ورودی/خروجی را اضافه یا حذف کنید.
    • نگه داشتن ماوس روی هر یک از نقاط داده در نمودار، اطلاعات مرتبط اضافی مانند اعداد پهنای باند برای حافظه های مختلف، کل زمان صرف شده و غیره را نشان می دهد.
  • یک جدول آماری در سطح برنامه که جزئیات بیشتری را برای هر نقطه داده ارائه می دهد، مانند حداکثر استفاده از حافظه، حداکثر نرخ FLOP، و غیره.
  • دومین نمودار خط سقفی که اطلاعات دقیق‌تری را ارائه می‌کند، با نقاط داده‌ای که برای ۱۰۰۰ عملیات زمان‌بر برتر در طول دوره نمایه‌سازی ترسیم شده‌اند:
    • مانند نمودار خط سقف در سطح برنامه، شناور کردن روی هر نقطه داده اطلاعات بیشتری در مورد آن عملیات به ارمغان می آورد.
    • می توانید نقاط داده نشان داده شده در نمودار را به روش های زیر سفارشی کنید:
      • شامل/استثنای عملیات ورودی و خروجی از طریق کشویی.
      • فیلتر کردن برای دسته های خاصی از عملیات.
      • فیلتر کردن عملیات محدود شده توسط یک منبع خاص.
      • فیلتر کردن برای یک عملیات با نام خاص.
  • یک جدول آماری دوم، مشابه جدول سطح برنامه، که جزئیات بیشتری را برای هر نقطه داده ارائه می کند.

در تمام بخش‌هایی که در بالا توضیح داده شد، حافظه‌های زیر پشتیبانی می‌شوند:

  • برای TPU ها: HBM، VMEM، CMEM (فقط TPU v4).
  • برای پردازنده‌های گرافیکی: HBM، L1/SharedMem.
  • خطوط مربوطه در نمودار فقط در صورتی ظاهر می شوند که در طول مدت نمایه عملیاتی وجود داشته باشد که توسط آن حافظه محدود شده باشد. به عنوان مثال، اگر همه عملیات ها یا HBM یا محاسباتی محدود باشند، خطوطی برای VMEM یا CMEM نخواهید دید.
،

ابزار تحلیل خط پشت بام

ابزار Roofline Analysis یک مدل عملکرد بصری بصری ارائه می دهد که می توانید از آن برای درک محدودیت های سخت افزاری ذاتی موثر بر عملکرد برنامه خود استفاده کنید. به طور خاص، بر روی این موضوع تمرکز می کند که آیا برنامه محدود به حافظه است یا محاسبات، و عملکرد برنامه چقدر نزدیک به اوج عملکرد تئوری سخت افزار است که به عنوان "خط سقف" نشان داده می شود.

پلتفرم های پشتیبانی شده

TPU: پشتیبانی می شود

GPU: پشتیبانی شده (در نسخه بتا)

نمودار خط سقف چیست؟

نمودار خط سقف رابطه بین شدت عملیاتی (FLOPS در هر بایت دسترسی) و FLOPS بدست آمده در ثانیه را به تصویر می کشد.

\[ Roofline = min(Operational Intensity \times Peak Memory Bandwidth, Peak FLOPS) \]

شکل "سقف" توسط پایین ترین FLOPS اوج و عملکرد قابل دستیابی با توجه به پهنای باند حافظه و شدت عملیاتی تشکیل می شود. نقطه برآمدگی حداقل شدت عملیاتی مورد نیاز برای رسیدن به اوج FLOPS را نشان می دهد.

می‌توانید در مورد مدل‌های خطوط سقف در Roofline: An Insightful Visual Performance Model for Floating-Point Programs and Multicore Architectures یا در مبحث مدل Roofline در ویکی پدیا اطلاعات بیشتری کسب کنید.

تفسیر نمودار خط پشت بام

با ترسیم شدت عملیات و FLOPS به دست آمده برای مراحل مختلف، بخش‌های برنامه، یا عملیات تک تک HLO بر روی نمودار خط سقف، می‌توانید بینشی در مورد تنگناهای عملکرد به دست آورید:

  • اگر یک نقطه داده در قسمت شیبدار خط سقف قرار داشته باشد، عملکرد احتمالاً توسط پهنای باند حافظه (محافظه به حافظه) محدود می شود. افزایش شدت عملیاتی (انجام محاسبات بیشتر به ازای هر بایت داده قابل دسترسی) به طور بالقوه می تواند عملکرد را بهبود بخشد.
  • اگر یک نقطه داده در قسمت صاف خط سقف قرار داشته باشد، عملکرد احتمالاً توسط قابلیت محاسبه (محاسبات محدود) محدود می شود. در این مورد، افزایش بیشتر شدت عملیات ممکن است منجر به افزایش عملکرد قابل توجهی نشود، مگر اینکه بتوان از حداکثر FLOPS سخت افزار بهتر استفاده کرد.
  • فاصله یک نقطه داده از خط سقف، پتانسیل بهبود عملکرد را نشان می دهد. فاصله بیشتر نشان می دهد که فرصت هایی برای بهینه سازی برنامه برای استفاده بهتر از قابلیت های سخت افزار وجود دارد.

اجزای رابط

رابط ابزار آنالیز Roofline دارای چندین جزء کلیدی است:

  • بخش اطلاعات دستگاه مشخصات سخت افزاری را شرح می دهد. اینها برای ترسیم استاتیک "خط(های)" روی نمودار استفاده می شوند
  • نمودار خط سقف در سطح برنامه با نقاط داده مربوط به موارد زیر:
    • کل مدت زمان پروفایل
    • کل مدت زمان نمایه، اما با داده‌های FLOPS/s که از شمارنده‌های عملکرد سخت‌افزار به‌جای مدل‌های هزینه پیش‌فرض محاسبه‌شده توسط کامپایلر XLA مشتق شده‌اند.
    • میانگین مراحل کاملی که در طول مدت نمایه اجرا شده است (برای مشاغل آموزشی، ممکن است اصطلاحات مرحله را برای کارهای استنتاج نادیده بگیرید).
    • هر مرحله کاملی که در طول مدت نمایه اجرا شده است (برای مشاغل آموزشی، ممکن است اصطلاحات مرحله را برای کارهای استنتاج نادیده بگیرید).
  • نمودار خط سقف نیز دارای ویژگی های زیر است:
    • می‌توانید با استفاده از منوی کشویی ارائه شده، عملیات ورودی/خروجی را اضافه یا حذف کنید.
    • نگه داشتن ماوس روی هر یک از نقاط داده در نمودار، اطلاعات مرتبط اضافی مانند اعداد پهنای باند برای حافظه های مختلف، کل زمان صرف شده و غیره را نشان می دهد.
  • یک جدول آماری در سطح برنامه که جزئیات بیشتری را برای هر نقطه داده ارائه می دهد، مانند حداکثر استفاده از حافظه، حداکثر نرخ FLOP، و غیره.
  • دومین نمودار خط سقفی که اطلاعات دقیق‌تری را ارائه می‌کند، با نقاط داده‌ای که برای ۱۰۰۰ عملیات زمان‌بر برتر در طول دوره نمایه‌سازی ترسیم شده‌اند:
    • مانند نمودار خط سقف در سطح برنامه، شناور کردن روی هر نقطه داده اطلاعات بیشتری در مورد آن عملیات به ارمغان می آورد.
    • می توانید نقاط داده نشان داده شده در نمودار را به روش های زیر سفارشی کنید:
      • شامل/استثنای عملیات ورودی و خروجی از طریق کشویی.
      • فیلتر کردن برای دسته های خاصی از عملیات.
      • فیلتر کردن عملیات محدود شده توسط یک منبع خاص.
      • فیلتر کردن برای یک عملیات با نام خاص.
  • یک جدول آماری دوم، مشابه جدول سطح برنامه، که جزئیات بیشتری را برای هر نقطه داده ارائه می کند.

در تمام بخش‌هایی که در بالا توضیح داده شد، حافظه‌های زیر پشتیبانی می‌شوند:

  • برای TPU ها: HBM، VMEM، CMEM (فقط TPU v4).
  • برای پردازنده‌های گرافیکی: HBM، L1/SharedMem.
  • خطوط مربوطه در نمودار فقط در صورتی ظاهر می شوند که در طول مدت نمایه عملیاتی وجود داشته باشد که توسط آن حافظه محدود شده باشد. به عنوان مثال، اگر همه عملیات ها یا HBM یا محاسباتی محدود باشند، خطوطی برای VMEM یا CMEM نخواهید دید.
،

ابزار تحلیل خط پشت بام

ابزار Roofline Analysis یک مدل عملکرد بصری بصری ارائه می دهد که می توانید از آن برای درک محدودیت های سخت افزاری ذاتی موثر بر عملکرد برنامه خود استفاده کنید. به طور خاص، بر روی این موضوع تمرکز می کند که آیا برنامه محدود به حافظه است یا محاسبات، و عملکرد برنامه چقدر نزدیک به اوج عملکرد تئوری سخت افزار است که به عنوان "خط سقف" نشان داده می شود.

پلتفرم های پشتیبانی شده

TPU: پشتیبانی می شود

GPU: پشتیبانی شده (در نسخه بتا)

نمودار خط سقف چیست؟

نمودار خط سقف رابطه بین شدت عملیاتی (FLOPS در هر بایت دسترسی) و FLOPS بدست آمده در ثانیه را به تصویر می کشد.

\[ Roofline = min(Operational Intensity \times Peak Memory Bandwidth, Peak FLOPS) \]

شکل "سقف" توسط پایین ترین FLOPS اوج و عملکرد قابل دستیابی با توجه به پهنای باند حافظه و شدت عملیاتی تشکیل می شود. نقطه برآمدگی حداقل شدت عملیاتی مورد نیاز برای رسیدن به اوج FLOPS را نشان می دهد.

می‌توانید در مورد مدل‌های خطوط سقف در Roofline: An Insightful Visual Performance Model for Floating-Point Programs and Multicore Architectures یا در مبحث مدل Roofline در ویکی پدیا اطلاعات بیشتری کسب کنید.

تفسیر نمودار خط پشت بام

با ترسیم شدت عملیات و FLOPS به دست آمده برای مراحل مختلف، بخش‌های برنامه، یا عملیات تک تک HLO بر روی نمودار خط سقف، می‌توانید بینشی در مورد تنگناهای عملکرد به دست آورید:

  • اگر یک نقطه داده در قسمت شیبدار خط سقف قرار داشته باشد، عملکرد احتمالاً توسط پهنای باند حافظه (محافظه به حافظه) محدود می شود. افزایش شدت عملیاتی (انجام محاسبات بیشتر به ازای هر بایت داده قابل دسترسی) به طور بالقوه می تواند عملکرد را بهبود بخشد.
  • اگر یک نقطه داده در قسمت صاف خط سقف قرار داشته باشد، عملکرد احتمالاً توسط قابلیت محاسبه (محاسبات محدود) محدود می شود. در این مورد، افزایش بیشتر شدت عملیات ممکن است منجر به افزایش عملکرد قابل توجهی نشود، مگر اینکه بتوان از حداکثر FLOPS سخت افزار بهتر استفاده کرد.
  • فاصله یک نقطه داده از خط سقف، پتانسیل بهبود عملکرد را نشان می دهد. فاصله بیشتر نشان می دهد که فرصت هایی برای بهینه سازی برنامه برای استفاده بهتر از قابلیت های سخت افزار وجود دارد.

اجزای رابط

رابط ابزار آنالیز Roofline دارای چندین جزء کلیدی است:

  • بخش اطلاعات دستگاه مشخصات سخت افزاری را شرح می دهد. اینها برای ترسیم استاتیک "خط(های)" روی نمودار استفاده می شوند
  • نمودار خط سقف در سطح برنامه با نقاط داده مربوط به موارد زیر:
    • کل مدت زمان پروفایل
    • کل مدت زمان نمایه، اما با داده‌های FLOPS/s که از شمارنده‌های عملکرد سخت‌افزار به‌جای مدل‌های هزینه پیش‌فرض محاسبه‌شده توسط کامپایلر XLA مشتق شده‌اند.
    • میانگین مراحل کاملی که در طول مدت نمایه اجرا شده است (برای مشاغل آموزشی، ممکن است اصطلاحات مرحله را برای کارهای استنتاج نادیده بگیرید).
    • هر مرحله کاملی که در طول مدت نمایه اجرا شده است (برای مشاغل آموزشی، ممکن است اصطلاحات مرحله را برای کارهای استنتاج نادیده بگیرید).
  • نمودار خط سقف نیز دارای ویژگی های زیر است:
    • می‌توانید با استفاده از منوی کشویی ارائه شده، عملیات ورودی/خروجی را اضافه یا حذف کنید.
    • نگه داشتن ماوس روی هر یک از نقاط داده در نمودار، اطلاعات مرتبط اضافی مانند اعداد پهنای باند برای حافظه های مختلف، کل زمان صرف شده و غیره را نشان می دهد.
  • یک جدول آماری در سطح برنامه که جزئیات بیشتری را برای هر نقطه داده ارائه می دهد، مانند حداکثر استفاده از حافظه، حداکثر نرخ FLOP، و غیره.
  • دومین نمودار خط سقفی که اطلاعات دقیق‌تری را ارائه می‌کند، با نقاط داده‌ای که برای ۱۰۰۰ عملیات زمان‌بر برتر در طول دوره نمایه‌سازی ترسیم شده‌اند:
    • مانند نمودار خط سقف در سطح برنامه، شناور کردن روی هر نقطه داده اطلاعات بیشتری در مورد آن عملیات به ارمغان می آورد.
    • می توانید نقاط داده نشان داده شده در نمودار را به روش های زیر سفارشی کنید:
      • شامل/استثنای عملیات ورودی و خروجی از طریق کشویی.
      • فیلتر کردن برای دسته های خاصی از عملیات.
      • فیلتر کردن عملیات محدود شده توسط یک منبع خاص.
      • فیلتر کردن برای یک عملیات با نام خاص.
  • یک جدول آماری دوم، مشابه جدول سطح برنامه، که جزئیات بیشتری را برای هر نقطه داده ارائه می کند.

در تمام بخش‌هایی که در بالا توضیح داده شد، حافظه‌های زیر پشتیبانی می‌شوند:

  • برای TPU ها: HBM، VMEM، CMEM (فقط TPU v4).
  • برای پردازنده‌های گرافیکی: HBM، L1/SharedMem.
  • خطوط مربوطه در نمودار فقط در صورتی ظاهر می شوند که در طول مدت نمایه عملیاتی وجود داشته باشد که توسط آن حافظه محدود شده باشد. به عنوان مثال، اگر همه عملیات ها یا HBM یا محاسباتی محدود باشند، خطوطی برای VMEM یا CMEM نخواهید دید.