উন্নত প্রোফাইলার বিকল্পগুলি

এই ডকুমেন্টে এমন সব অ্যাডভান্সড প্রোফাইলিং ফ্ল্যাগের তালিকা দেওয়া হয়েছে যা XProf-এ উপলব্ধ কিন্তু মূল JAX প্রোফাইলিং গাইডে নথিভুক্ত নাও থাকতে পারে। এই ফ্ল্যাগগুলি সাধারণত TPU-তে সূক্ষ্ম নিয়ন্ত্রণ, পাওয়ার মনিটরিং এবং বিস্তারিত পারফরম্যান্স কাউন্টার স্যাম্পলিংয়ের জন্য ব্যবহৃত হয়।

এই ফ্ল্যাগগুলি jax.profiler.start_trace এর profiler_options প্যারামিটারের মাধ্যমে advanced_configuration ডিকশনারির অংশ হিসেবে পাস করা হয়।

উদাহরণ:

options = jax.profiler.ProfileOptions()
options.advanced_configuration = {
    "tpu_power_trace_level": 1,  # Integer
    "tpu_perf_counters": True,  # Boolean
    "tpu_cpu_perf_counter_profile_events": "context-switches,page-faults",  # String
}
jax.profiler.start_trace("/tmp/profile-data", profiler_options=options)

শক্তি এবং তাপীয় ঘটনা

এই ফ্ল্যাগগুলো টিপিইউ-তে পাওয়ার এবং থার্মাল ইভেন্টগুলোর সংগ্রহ নিয়ন্ত্রণ করে।

  • tpu_power_trace_level (পূর্ণসংখ্যা): পাওয়ার ট্রেসিং-এর মাত্রা নিয়ন্ত্রণ করে। সমর্থিত মানসমূহ:
    • 0 : POWER_TRACE_NONE (ডিফল্ট)
    • 1 : POWER_TRACE_NORMAL
    • 2 : POWER_TRACE_SPI (এসপিআই পাওয়ার ট্রেস সক্রিয় করুন, বিশদ বিবরণ সহ)
  • tpu_e2e_enable_fw_throttle_event (বুলিয়ান): ফার্মওয়্যার থ্রটল ইভেন্ট সক্রিয় করে।
  • tpu_e2e_enable_fw_power_level_event (বুলিয়ান): ফার্মওয়্যার পাওয়ার লেভেল ইভেন্ট সক্রিয় করে।
  • tpu_e2e_enable_fw_thermal_event (বুলিয়ান): ফার্মওয়্যার থার্মাল ইভেন্ট সক্রিয় করে।
  • tpu_enable_fw_pcie_utilization_event (বুলিয়ান): ফার্মওয়্যার PCIe ইউটিলাইজেশন ইভেন্টগুলো সক্রিয় করে।

শক্তি এবং তাপীয় ঘটনা

ট্রেসমার্ক কনফিগারেশন

  • tpu_tracemark_lower (পূর্ণসংখ্যা): ট্রেসমার্কের নিম্নসীমা।
  • tpu_tracemark_upper (পূর্ণসংখ্যা): ট্রেসমার্কের ঊর্ধ্বসীমা।

পর্যায়ক্রমিক কাউন্টার স্যাম্পলিং বিকল্পগুলি

এই অপশনগুলো টিপিইউ-তে থাকা বিভিন্ন পারফরম্যান্স কাউন্টারের পর্যায়ক্রমিক স্যাম্পলিং কনফিগার করে।

  • tpu_enable_periodic_counter_sampling (বুলিয়ান): পর্যায়ক্রমিক কাউন্টার স্যাম্পলিং সক্ষম করে।
  • tpu_tc_perf_counter_sampling_options (স্ট্রিং): টিসি পারফ কাউন্টার স্যাম্পলিং-এর জন্য অপশনসমূহ। এর জন্য xprof::XprofRequest::PeriodicCounterSamplingOptions নামের একটি টেক্সট প্রোটো স্ট্রিং প্রত্যাশিত।
  • tpu_scs_perf_counter_sampling_options (স্ট্রিং): SCS পারফ কাউন্টার স্যাম্পলিং-এর জন্য অপশনসমূহ।
  • tpu_sctc_perf_counter_sampling_options (স্ট্রিং): SCTC পারফ কাউন্টার স্যাম্পলিং-এর জন্য অপশনসমূহ।
  • tpu_sctd_perf_counter_sampling_options (স্ট্রিং): SCTD পারফ কাউন্টার স্যাম্পলিং-এর জন্য অপশনসমূহ।
  • tpu_cmn_perf_counter_sampling_options (স্ট্রিং): CMN পারফ কাউন্টার স্যাম্পলিং-এর জন্য অপশনসমূহ।
  • tpu_icr_perf_counter_sampling_options (স্ট্রিং): ICR পারফ কাউন্টার স্যাম্পলিং-এর জন্য অপশনসমূহ।

অন্যান্য উন্নত টিপিইউ বিকল্পগুলি

  • tpu_perf_counters (বুলিয়ান): টিপিইউ পারফরম্যান্স কাউন্টার চালু/বন্ধ করার জন্য বুলিয়ান।
  • max_trace_buffers (পূর্ণসংখ্যা): ট্রেস বাফারের সর্বোচ্চ আকার নিয়ন্ত্রণ করে।
  • tpu_circular_buffer_tracing (বুলিয়ান): বৃত্তাকার বাফার ট্রেসিং সক্ষম করে।
  • tpu_watched_sync_flag_number (পূর্ণসংখ্যা): পর্যবেক্ষণ করা সিঙ্ক ফ্ল্যাগ নম্বর।
  • tpu_watched_sync_flag_mask (পূর্ণসংখ্যা): পর্যবেক্ষণকৃত সিঙ্ক ফ্ল্যাগ মাস্ক।
  • tpu_sc_dma (বুলিয়ান): টিপিইউ এসসি ডিএমএ ট্রেসিং নিয়ন্ত্রণ করে।