XProf: تجزیه و تحلیل عملکرد شتاب دهنده

XProf یک ابزار پروفایل و تجزیه و تحلیل عملکرد برای یادگیری ماشین است.

ویژگی ها

  • اطلاعات نمایه با کیفیت بالا بر اساس رویدادها و شمارنده های سخت افزاری و ابرداده های کامپایلر.
  • سربار جمع آوری کم، معمولاً کمتر از 1٪ در TPU و <5٪ در GPU در طول دوره پروفایل.
  • مجموعه گسترده ای از ابزارها که درک عمیقی از حجم کاری شما ارائه می دهد:
    • صفحه نمای کلی : یک نمای سطح بالا از نحوه عملکرد مدل خود در طول اجرای نمایه، از جمله میزان استفاده از منابع سخت افزاری را مشاهده کنید.
    • Trace Viewer : یک جدول زمانی دقیق از رویدادهایی که رخ داده اند و کدام قسمت از سیستم آنها را اجرا کرده است (مثلاً CPU، TPU یا GPU) تجسم کنید.
    • Graph Viewer : ساختار نمودار برنامه XLA خود را تجسم کنید. این نمودار عملیات سطح بالا (HLO) را نشان می دهد.
    • Memory Viewer : مصرف حافظه را در طول عمر برنامه تجسم کنید و در نقطه اوج استفاده از حافظه به جزئیات محتویات حافظه بپردازید.
    • نمایه حافظه : استفاده از حافظه پویا شتاب دهنده های خود را در حین اجرای برنامه تجسم کنید.
    • HLO Op Profile : عملکرد سخت افزار را برای دسته های مختلف عملیات سطح بالا (HLO) که توسط برنامه شما اجرا می شود را درک کنید.
    • آمار عملیات HLO : آمار عملکرد عملیات بهینه ساز سطح بالا (HLO) را که توسط برنامه شما اجرا شده است را مشاهده کنید و زمان برترین عملیات را در نمودار HLO خود شناسایی کنید.
    • آمار عملیات Framework : آمار عملکرد عملیات سطح چارچوب (به عنوان مثال، JAX، TensorFlow، یا PyTorch/XLA) اجرا شده بر روی میزبان و شتاب دهنده را مشاهده کنید.
    • تجزیه و تحلیل خط پشت بام : یک مدل عملکرد بصری بصری را ببینید که محدودیت‌های سخت‌افزاری ذاتی را نشان می‌دهد که بر عملکرد برنامه شما تأثیر می‌گذارد و نشان می‌دهد که آیا محدود به حافظه است یا محاسبات.
    • آمارهای Megascale : عملکرد ارتباط بین برش‌های بارهای کاری را در برش‌های TPU متعددی که در سراسر شبکه مرکز داده (DCN) ارتباط برقرار می‌کنند، تجزیه و تحلیل می‌کند.
    • آمار هسته GPU : آمار عملکرد و عملیات چارچوب اولیه را برای هر هسته پردازشگر گرافیکی در برنامه خود مشاهده کنید.

شروع به کار

برای دستورالعمل‌های نصب، به XProf Quick Start مراجعه کنید.

اگر از Google Cloud برای اجرای بارهای کاری خود استفاده می کنید، ابزار xprofiler را توصیه می کنیم. با استفاده از VMهایی که XProf را اجرا می کنند، مجموعه ای ساده از پروفایل و تجربه مشاهده را فراهم می کند.

برای دریافت نسخه ی نمایشی سریع از قابلیت های XProf، نوت بوک نسخه ی نمایشی را امتحان کنید.

ادغام Tensorboard

از نظر تاریخی، تنها راه نصب و استفاده از XProf استفاده از Tensorboard بود. این پروفایل پلاگین تنسوربرد نامیده می شد. برخی از اسناد قدیمی تر ممکن است هنوز از این اصطلاح استفاده کنند. این ادغام اکنون اختیاری است: می‌توانید Tensorboard را به‌عنوان محفظه‌ای برای مجموعه ابزارهای XProf در نظر بگیرید، که می‌تواند به‌صورت مستقل نصب و استفاده شود، با رفتاری یکسان.