הכלי Graph Viewer

אפשר להשתמש ב-Graph Viewer כדי להציג גרפית את מבנה התרשים של תוכנית ה-XLA. מוצג בו התרשים 'פעולות ברמה גבוהה' (HLO).

פלטפורמות נתמכות

TPU: נתמך

GPU: נתמך

רכיבי ממשק

אפשר לשלוט ב-Graph Viewer באמצעות האפשרויות הבאות:

  1. תפריט נפתח לבחירת מודול XLA, שממנו בוחרים מודול HLO מהרשימה הזמינה לצורך ויזואליזציה.

  2. תיבת שם של פעולה, שבה מזינים את שם הפעולה כדי לבחור אותה כצומת הראשי ולהציג גרפית את השכנים שלה. לחיצה על Enter אחרי הקלדה של שם הפעולה תציג גרפית את הצמתים שמסביב.

  3. בורר של רוחב התרשים, שמאפשר לקבוע את המרחק המקסימלי של הצמתים מהצומת הראשי שנכלל בתצוגה החזותית.

  4. בורר מטא-נתונים, שמאפשר להציג או להסתיר את המטא-נתונים של הפעולה שכלולים במהדר, אם יש כאלה. חשוב לזכור: צריך ללחוץ שוב על 'תרשים חיפוש' אחרי שמסמנים את התיבה הזו.

  5. תיבת הסימון Merge Fusion, שבה אפשר להשתמש כדי לכווץ או להרחיב את הרכיבים של פעולות המיזוג. שימו לב: אחרי שמפעילים או משביתים את התיבה הזו, צריך ללחוץ שוב על 'תרשים חיפוש'.

  6. לחצנים או מקשים להגדלה/להקטנה של התצוגה, אבל אפשר גם להשתמש בעכבר כדי להתקרב או להתרחק.

  7. קישורים להורדת התרשים כקובץ SVG או קובץ נקודה.

  8. באמצעות פונקציית החיפוש, אפשר לאתר במהירות פעולות ספציפיות בתרשים הגדול ולעסוק בהן.

  9. כדי להקפיא את חלונית הנתונים של סביבת זמן הריצה בפעולה מסוימת, לוחצים לחיצה ימנית על הפעולה.

שימוש ב'Graph Viewer'

כברירת מחדל, אף פעולה לא מסומנת ב-Graph Viewer, ולכן יוצג מסך ריק. מחפשים את הפעולה הרצויה כדי להגדיל את התצוגה שלה ולהתחיל לעבור על התרשים. בדרך כלל, מתחילים עם אחד מהכלים האחרים (למשל, Op Profile כדי לזהות את הפעולה שדורשת הכי הרבה זמן, או Trace Viewer כדי לזהות את הסיבה לבועה בצינור עיבוד הנתונים). לחיצה על הפעולה בכלים האלה תציג קישור ישיר לאותה פעולה ב-Graph Viewer.

כשמעבירים את העכבר מעל תיבת ריבוע (שמייצגת פעולת HLO), לרוב מופיע הקו בקוד המשתמש שתואם לפעולה שבה הוגדרה הפונקציה. המידע הזה זמין רק אם המטא-נתונים האלה יסופקו ל-XProf דרך שכבות הטרנספורמציה הרבות שתוכנית Python עוברת בדרך ליצירת קובץ ההפעלה של המאיץ.

שימו לב שהכלי לניתוח ביצועים מקבל מידע ברמת HLO מהגרף 'HLO משופר', קרוב לנקודה שבה הוא מוכן להמרה לקוד ספציפי למאיץ על ידי הקצה העורפי של המהדר. לכן, Graph Viewer וכל הכלים של XProf מטפלים בייצוג HLO ברמה נמוכה בתוך XLA, ולא ב-StableHLO או בייצוג קרוב למסגרת ה-ML.

התרשים עצמו סטטי לחלוטין, והוא מתקבל ישירות מ-XLA גם בלי להריץ את התוכנית. עם זאת, כלי הצפייה בתרשים מציג שכבת-על של מידע נוסף על זמן הריצה בתרשים כדי להפוך אותו לשימושי יותר. לדוגמה, כשמעבירים את העכבר מעל פעולה, מופיע קטע בצד ימין של ממשק המשתמש שמציין כמה פעמים הפעולה בוצעה במהלך משך הזמן של הפרופיל, ומה היה זמן הביצוע הממוצע. הוא גם מחשב ומציג מספרים שונים של ניצול פס ורוחב פס. הנתונים האלה מבוססים על ניתוח העלויות הסטטי של XLA עבור FLOPS ועבור בייטים שנצרכו, ומחושב מהם שיעור על סמך זמן הביצוע שנמדד.