‫XProf: تحليل أداء أداة التسريع

‫XProf هي أداة لتحليل الأداء وإنشاء الملفات التعريفية في مجال تعلُّم الآلة.

الميزات

  • معلومات عالية الجودة عن الملف الشخصي استنادًا إلى أحداث الأجهزة والعدادات والبيانات الوصفية للمترجم البرمجي
  • تكلفة جمع البيانات المنخفضة، وعادةً ما تكون أقل من% 1 على وحدات TPU وأقل من% 5 على وحدات GPU خلال فترة إنشاء الملفات الشخصية
  • مجموعة واسعة من الأدوات التي توفّر فهمًا عميقًا لأحمال العمل:
    • صفحة "نظرة عامة": يمكنك الاطّلاع على نظرة عامة مجمّعة على المستوى الأعلى حول أداء النموذج أثناء تشغيل ملف الأداء، بما في ذلك مدى استخدامه لموارد الأجهزة.
    • أداة Trace Viewer: تتيح لك عرض مخطط زمني مفصّل للأحداث التي وقعت والجزء من النظام الذي نفّذها (على سبيل المثال، وحدة المعالجة المركزية أو وحدة معالجة الموتّرات أو وحدة معالجة الرسومات).
    • أداة عرض الرسومات البيانية: تتيح لك عرض بنية الرسم البياني لبرنامج XLA. تعرض هذه الصفحة الرسم البياني للعمليات ذات المستوى العالي (HLO).
    • أداة فحص الذاكرة: تتيح لك عرض استخدام الذاكرة على مدار عمر البرنامج، والاطّلاع على تفاصيل محتوى الذاكرة عند بلوغ استخدامها الحد الأقصى.
    • ملف تعريف الذاكرة: يمكنك عرض الاستخدام الديناميكي للذاكرة في أدوات التسريع أثناء تنفيذ برنامجك.
    • ملف تعريف عملية HLO: يمكنك فهم أداء الأجهزة لفئات مختلفة من عمليات التشغيل ذات المستوى العالي (HLO) التي ينفّذها برنامجك.
    • إحصاءات عمليات HLO: يمكنك الاطّلاع على إحصاءات الأداء لعمليات High Level Optimizer (HLO) التي ينفّذها برنامجك، وتحديد العمليات الأكثر استهلاكًا للوقت ضمن الرسم البياني لـ HLO.
    • إحصاءات عمليات إطار العمل: يمكنك الاطّلاع على إحصاءات الأداء الخاصة بالعمليات على مستوى إطار العمل (مثل JAX أو TensorFlow أو PyTorch/XLA) التي يتم تنفيذها على المضيف والمسرّع.
    • تحليل Roofline: يمكنك الاطّلاع على نموذج مرئي سهل الاستخدام للأداء يوضّح القيود المضمّنة في الأجهزة والتي تؤثر في أداء برنامجك، ما يشير إلى ما إذا كان البرنامج محدودًا بالذاكرة أو بالقدرة الحسابية.
    • إحصاءات النطاق الواسع: يمكنك تحليل أداء الاتصال بين الشرائح لأحمال العمل التي تمتد على شرائح TPU متعددة وتتواصل عبر شبكة مركز البيانات (DCN).
    • إحصاءات نواة وحدة معالجة الرسومات: يمكنك الاطّلاع على إحصاءات الأداء وعملية إطار العمل الأصلية لكل نواة يتم تسريعها باستخدام وحدة معالجة الرسومات في برنامجك.

البدء

للحصول على تعليمات التثبيت، راجِع دليل البدء السريع في XProf.

إذا كنت تستخدم Google Cloud لتشغيل أحمال العمل، ننصحك باستخدام أداة xprofiler. ويوفّر تجربة مبسطة لجمع الملفات الشخصية وعرضها باستخدام الأجهزة الافتراضية التي تعمل بنظام XProf.

للحصول على عرض توضيحي سريع لإمكانات XProf، جرِّب دفتر الملاحظات التجريبي.

دمج Tensorboard

في السابق، كانت الطريقة الوحيدة لتثبيت XProf واستخدامه هي من خلال Tensorboard. كان يُطلق على هذه الميزة اسم إضافة ملفات التعريف في TensorBoard، وقد تستخدم بعض المستندات القديمة هذا المصطلح. أصبح هذا الدمج اختياريًا الآن، ويمكنك اعتبار Tensorboard حاوية لمجموعة أدوات XProf التي يمكن أيضًا تثبيتها واستخدامها بشكل مستقل مع السلوك نفسه.