支持的运营和硬件
我们目前支持以下 GPU 内核:
tokamax.dot_product_attention(FlashAttention)。tokamax.gated_linear_unit(门控线性单元 [SwiGLU 等])。tokamax.layer_norm(层归一化和均方根归一化)。
对于 GPU 和 TPU,以下各项均适用:
tokamax.ragged_dot(混合专家)。
我们目前支持以下 GPU 内核:
tokamax.dot_product_attention(FlashAttention)。tokamax.gated_linear_unit(门控线性单元 [SwiGLU 等])。tokamax.layer_norm
(层归一化和均方根归一化)。对于 GPU 和 TPU,以下各项均适用:
tokamax.ragged_dot
(混合专家)。如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可,并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情,请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。
最后更新时间 (UTC):2025-11-21。