Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Hata kodu: E3001

Kategori: CompileTime: SparseCore No Viable Logical Replica Count

Bu hata, XLA:SparseCore derleyicisi iş yükünün SparseCore'un yerel geçici bellek alanına (Tilespmem) sığmasını sağlayan geçerli bir mantıksal replika sayısı yapılandırmasını belirleyemediğinde oluşur.

Örnek hata mesajları:

XLA:TPU compile permanent error. Compilation failure: No viable logical replica count for the embedding table with metadata: max_nz_per_row = 141352, max_unique_nz_per_row = 8, feature_width = 8, sample_count = 204800 (last tried split factor for vector splitting = 1, last tried split factor for sample dimension splitting = 1, fixed_size_allocation_bytes = 410880, row_dependent_size_allocation_bytes = 1696224, total_spmem_size_bytes = 524288) ...

XLA arka uçları: TPU

Genel Bakış

Bu hata, özellikle Büyük Yerleştirme Modelleri (LEM'ler) için SparseCore kullanım alanlarına özgüdür.

Mantıksal kopya sayısı, geçici alan ayırma baskısını yönetmek için giriş gruplarının nasıl bölümleneceğini belirleyen dahili bir derleyici parametresidir. Derleyici, iş yükünü daha küçük parçalara (kopyalar) bölmeye çalışır. Böylece her parça için gereken ara arabellekler, SparseCore'un sınırlı Scratchpad Memory'sine sığar. Genel olarak, daha yüksek bir mantıksal kopya sayısı, bir seferde daha küçük veri grupları işleyerek tahsis baskısını azaltır.

Bu hata, derleyicinin çeşitli bölme yapılandırmalarını denemesine rağmen gerekli arabelleklerin Tilespmem belleğine sığdığı bir kurulum bulamadığını gösterir. Ayırma boyutu, aşağıdakilerin bir kombinasyonuyla belirlenir:

sample_count: Her SparseCore'a atanan yerleştirme arama kimliği sayısıdır (grup boyutundan türetilir).
feature_width: Yerleştirme boyutunun boyutu.
max_nz_per_row: Tüm SparseCore'larda benzersiz olmayan yerleştirme arama kimliklerinin maksimum sayısı.
max_unique_nz_per_row: Maksimum benzersiz yerleştirme arama kimliği sayısı.

Hata ayıklama

Bu hatayı düzeltmek için SparseCore geçici alanındaki bellek baskısını azaltmanız gerekir.

1. Meta veri tahminlerini iyileştirme

Derleyici, max_nz_per_row ve max_unique_nz_per_row'ye göre bellek ayırır. Bu değerler muhafazakar bir şekilde tahmin edilirse (yani gerçek verilerin gerektirdiğinden çok daha yüksek ayarlanırsa) derleyici gereksiz alan ayırarak bu hataya neden olur. Bu parametrelerin, veri kümenizin gerçek kimlik dağıtımını doğru şekilde yansıttığından emin olun.

Bu parametreler için optimum değerleri belirlemek üzere geri bildirim odaklı optimizasyonu (FDO) uygulamayı düşünebilirsiniz.

2. Grup boyutunu küçültün

sample_count, doğrudan genel grup boyutunuzdan elde edilir. Toplu iş boyutunu azaltmak, her SparseCore'un adım başına işlemesi gereken veri miktarını düşürerek gerekli not defteri arabelleklerinin boyutunu azaltır.

Hata kodu: E3001 Koleksiyonlar ile düzeninizi koruyun İçeriği tercihlerinize göre kaydedin ve kategorilere ayırın.

Genel Bakış

Hata ayıklama

1. Meta veri tahminlerini iyileştirme

2. Grup boyutunu küçültün

Hata kodu: E3001